El término Big Data se refiere a los datos que son tan grandes, rápidos o complejos que es difícil o imposible procesarlos con los métodos tradicionales. El acto de acceder y almacenar grandes cantidades de información para la analítica ha existido desde hace mucho tiempo. Pero el concepto de Big Data cobró impulso a principios de los 2000 cuando se acuño la definición actual de las tres V:
Los datos son indispensables en el tejido empresarial actual y se están convirtiendo en una pieza clave que ayuda a tomar decisiones estratégicas. Aquí es donde entran en juego las herramientas para saber identificar, extraer y analizar los datos con la mayor rapidez posible. ¿Qué beneficios nos aporta el análisis de los datos?
Big Data es una herramienta para aumentar la competitividad en todo el sentido de la palabra y no solo como un elemento de recolección de información.
Aunque hablaremos más en profundidad en próximos artículos sobre el Machine Learning podemos definirlo brevemente como la rama de la inteligencia artificial que permite que las máquinas aprendan. Este proceso de aprendizaje se hace gracias al entrenamiento de modelos analíticos que son capaces de aprender de los datos, identificar patrones y tomar decisiones con mínima intervención humana.
Podríamos, por ejemplo, entrenar un modelo de aprendizaje que sea capaz de identificar desviaciones en la producción de una pieza industrial, ya sea a partir de parámetros recogidos durante la cadena de producción o mediante imágenes. Para entrenar a este modelo sería necesario darle un buen número de datos de muestra de entrada de tal manera que una vez entrenado será capaz de identificar con un elevado porcentaje de acierto si la pieza producida se ajusta a los parámetros de calidad o hay alguna desviación, todo ello sin la intervención de un humano.
Extrapolemos esto a cualquier ejemplo que se nos pueda ocurrir de la vida real y entenderemos el poder que pueden llegar a tener los datos y lo importante que pueden llegar a ser. La unión entre datos y aprendizaje automático puede ser aplicable a las finanzas, sistemas de producción, distribución, marketing, consumo, medicina, automoción y mucho más.
El concepto de aprendizaje es el núcleo central de relación entre el Big Data y el Machine Learning. El primero es una colección o conjunto de datos tan grande y complejo que, para poder ser entendido y explotado, hace necesario el desarrollo de tecnologías que confieran a las máquinas y al software la capacidad de aprender, esto es: identificar patrones complejos o tendencias en el comportamiento de personas y sistemas mediante el análisis y procesamiento del Big Data.
El patrón de diseño que permite comunicarse de forma reactiva.