El análisis predictivo y Machine Learning
Un rol que está surgiendo en las organizaciones con grandes cantidades de datos es el rol del científico de datos que es una persona que incorpora técnicas y teorías de muchos campos, incluyendo las matemáticas, la estadística, la ingeniería de datos, reconocimiento de patrones, aprendizaje avanzado , visualización, modelado de la incertidumbre, almacenamiento de datos y la computación de alto rendimiento con el objetivo de extraer el significado de datos.
El científico de datos se enfoca en la ciencia de datos que es un término utilizado indistintamente con inteligencia de negocio o análitica empresarial, siendo el análisis predictivo el análisis de datos con técnicas matemáticas de estadística, minería de datos y aprendizaje automático y se se utiliza para descubrir patrones ocultos, que da una ventaja competitiva.
Existen distintas definiciones de análisis predictivo, sin embargo, la en mi opinión es más clara y completa es la siguiente “es el descubrimiento de información predictiva, a veces oculta, de las bases de datos utilizando atributos de datos relacionados y no relacionados con la aplicación de algoritmos de análisis, y la creación de modelos que generan resultados predictivos” por lo tanto el modelaje predictivo “es el proceso de creación de un modelo para predecir mejor la probabilidad de un resultado”.
El análisis predicto y el apredizaje automático tiene distintas aplicaciones prácticas por ejemplo detección de fraudes, clasificación de crédito, análisis de redes sociales, publicidad dirigida e investigación de ciencias de la vida.
Para las tareas anteriores se utiliza el aprendizaje automático o Machine Learning, el cual lo podemos describir como la automatización de la automatización, se enfoca en utilizar computadoras para programar computadoras y principalmente en dejar que los datos hagan el trabajo!, esto es, poder aprender de los datos para poder predecir.
Según Erik F, el aprendizaje automático es la programación de computadoras para optimizar un criterio de desempeño usando datos como ejemplo o experiencia previa y el el aprendizaje se utiliza cuando:
•Experiencia humana no existe (la navegación en Marte),
•Los seres humanos son incapaces de explicar su experiencia (reconocimiento de voz)
•Solución cambios en el tiempo (el enrutamiento en una red informática)
•Solución necesita ser adaptada a los casos particulares (biométrica de usuario)
Cuando se desea implementar Machine Learning en casos y empresas reales se deben contar con herramientas que permitan la comprensión de dominio, conocimiento previo, y las metas deseadas, la integración de datos, selección, limpieza, pre-procesamiento, que posean modelos de aprendizaje, que permita la interpretación de los resultados y que facilite la consolidación y el despliegue de conocimiento descubierto.
Una de las soluciones disponibles es el Azure Machine Learning, el cual es un servicio en la nube que cumple con las características descritas anteriormente.
El Azure Machine Learning ofrece distintas capacidades como elasticidad y uso por demanda, así como la herramienta ML Studio que permite que se puedan crear experimentos de aprendizaje de datos.
En artículos posteriores veremos los detalles de cómo utilizar el Azure Machine Learning.
Comments