Data Mining vs. Big Data

Data Mining, Machine Learning, Inteligencia Artificial, Big Data, Business Intelligence: estos son algunos de los términos que han aparecido con la revolución de los datos y que nos rodean en el mundo empresarial de hoy. No obstante, su significado y la relación entre ellos no siempre es muy clara. Por eso en LIS-Solutions hemos lanzado varios posts para traer luz a estas palabras de moda que describen conceptos muy potentes (“¿Qué es el Data Mining?”, “¿Qué es el Business Intelligence?”, “¿Qué es el Big Data?”). Hoy queremos descubrir la relación entre el Data Mining y el Big Data.

¿Qué es el Data Mining?

El Data Mining, también conocido como minería de datos, es un conjunto de técnicas que se realizan para explorar grandes cantidades de datos (Big Data). Encontrando patrones en los datos, el Data Mining nos puede ayudar a optimizar la toma de decisiones y la estrategia empresarial (Business Intelligence). Para alcanzar este objetivo, existen múltiples métodos matemáticos y estadísticos encapsulados en algoritmos, y que hoy en día también llamamos machine learning o inteligencia artificial. Si quieres saber más sobre el Data Mining puedes leer nuestro post “¿Qué es el Data Mining?

¿Qué es el Big Data?

El Big Data, también denominado macrodatos o datos a gran escala, es un conjunto de tecnologías y herramientas que permiten trabajar con datos masivos. El concepto de Big Data está caracterizado por las 5 Vs. Un volumen extremo de datos, con una alta velocidad y variedad son las características más conocidas. No obstante, hablando de Big Data también tenemos que tomar en cuenta la calidad de los datos descrita por la veracidad y el valor que representan para la organización. Si quieres saber más sobre el Big Data puedes leer nuestro post “¿Qué es el Big Data?

 

¿En qué se diferencia el Data Mining del Big Data?

El Data Mining y el Big Data son dos conceptos que están relacionados a los datos pero que tienen un enfoque diferente sobre ellos. El enfoque principal del Big Data es la gestión de grandes volúmenes de datos para que estos estén disponibles para la organización. El enfoque principal del Data Mining por otro lado es el análisis de los datos. Por lo tanto, para extraer valor del Big Data necesitamos el Data Mining. Podemos aplicar cualquier técnica del Data Mining, como un algoritmo de clustering sobre el Big Data para descubrir patrones y exprimir el valor escondido en los grandes volúmenes de datos. Relacionado al Big Data se han desarrollado múltiples herramientas. Entre ellas encontramos algunas como Apache Spark con las librerías MLlib y SparkML que crean un entorno para realizar Data Mining con Big Data.

En conclusión, el Big Data se puede ver como el activo mientras que el Data Mining es la herramienta o las técnicas para aprovechar ese activo. Desde LIS-Solutions planteamos soluciones adaptadas a cada empresa en particular, analizando el tipo de datos que maneja y el resto de las variables necesarias para prescribir la solución de Big Data y Data Mining más apropiada.

 

COMPARTE ESTE POST

Share on facebook
Share on google
Share on twitter
Share on linkedin
Share on pinterest
Share on print
Share on email

Deja un comentario