El uso indistinto de términos como inteligencia artificial, machine learning y big data es común dentro del público no experto en el área. En los últimos 50 años, la presencia de estos conceptos ha tomado cada vez más fuerza y se ha expandido en diversas áreas del conocimiento como medicina, economía, ingeniería, ciencias ambientales, robótica, entre otras.
Pedro Domingos, Profesor del Departamento de Ciencias de la Computación e Ingeniería de la Universidad de Washington, describe de forma intuitiva la relación entre Inteligencia artificial (IA), machine learning y big data. Machine learning es una disciplina científica del ámbito de la Inteligencia Artificial que se enfoca en proveer a las computadoras la habilidad de “aprender” por sí mismas a partir de datos. En una analogía interesante, Domingos plantea a la IA como un planeta al cual queremos llegar, machine learning como el cohete que actualmente nos está llevando a ese destino, y big data como el combustible de este cohete.
El aprendizaje automático, o más conocido como “machine learning”, se basa en las ciencias de la computación, ciencia de datos y estadística. Esta sub-área de la IA, utiliza observaciones del mundo real y permite a las computadoras (o más explícitamente a un algoritmo), identificar patrones a partir de esos datos. De esta manera machine learning permite generalizar el comportamiento de esas instancias/observaciones del mundo real, para poder generar conclusiones sobre instancias nunca antes vistas.
Las aplicaciones de técnicas de machine learning se encuentran actualmente en el día a día de las personas, incluyendo las recomendaciones de artículos de compra que vemos al navegar en internet, identificación de correo spam, y las sugerencias de amigos en redes sociales. Otros usos del machine learning están orientados a predicciones de variables ambientales, detección de enfermedades, etc. Para todos los casos, un amplio volumen de datos recopilados es necesario.
La capacidad de procesar millones de datos es una de las potencialidades más apreciadas del machine learning. En la era digital, la disponibilidad de grandes volúmenes de datos se ve limitada por la capacidad de extraer información y conocimiento a partir de estas observaciones. Por tanto, la evolución del poder computacional ha permitido que la aplicación del machine learning no se vea limitada a servidores computaciones de alto rendimiento, sino que también esté al alcance de tu computador personal.
La accesibilidad actual a múltiples paquetes informáticos, que facilitan aplicar técnicas de machine learning de manera simplificada, ha incrementado su popularidad y uso en la academia y en los negocios. No obstante, es indispensable reconocer que el conocimiento que se extrae de los datos depende en gran medida del tipo de algoritmo/técnica utilizada, y de la calidad y preprocesamiento de los datos suministrados. Esto último aún no es un proceso automático y requiere ser supervisado por expertos en el área de machine learning.