El objetivo del episodio: explorar los diferentes tipos de datos que se pueden recopilar y procesar en Big Data.
Algunas de las posibles aplicaciones de Big Data, como la toma de decisiones empresariales, la investigación y el análisis de tendencias.
- Redes sociales: los datos generados por los usuarios de redes sociales, como publicaciones, comentarios y reacciones, pueden ser recopilados y procesados en Big Data. Estos datos pueden proporcionar información valiosa sobre las opiniones, intereses y comportamientos de los usuarios.
- Dispositivos de internet de las cosas (IoT): los datos generados por dispositivos conectados a internet, como termostatos inteligentes, relojes deportivos o cámaras de seguridad, pueden ser recopilados y procesados en Big Data. Estos datos pueden proporcionar información valiosa sobre el uso de los dispositivos y la forma en que estos se integran en la vida diaria de las personas.
- Transacciones comerciales: los datos generados por las transacciones comerciales, como compras en línea, pagos con tarjeta de crédito o transacciones bancarias, pueden ser recopilados y procesados en Big Data. Estos datos pueden proporcionar información valiosa sobre los hábitos de compra de los consumidores y las tendencias del mercado.
- Datos gubernamentales: los datos generados por los gobiernos, como estadísticas de población, empleo o consumo, pueden ser recopilados y procesados en Big Data
Explica que el término “Big Data” se refiere a la cantidad de datos generados, no a su tamaño en términos de memoria o almacenamiento.
Datos estructurados:
- Bases de datos relacionales: son bases de datos que almacenan información en tablas y utilizan claves para relacionar los datos entre sí. Ejemplos de bases de datos relacionales incluyen MySQL, Oracle y Microsoft SQL Server.
- Hojas de cálculo: son archivos que contienen información organizada en celdas y filas, y que pueden incluir fórmulas y gráficos. Ejemplos de hojas de cálculo incluyen Excel, Google Sheets y Apple Numbers.
- Archivos CSV: son archivos de texto que almacenan información organizada en filas y columnas, separadas por comas. Los archivos CSV pueden ser abiertos y editados con cualquier editor de texto o procesador de hojas de cálculo.
Datos no estructurados:
- Documentos de texto: son archivos que contienen información escrita, como artículos, ensayos o informes. Ejemplos de documentos de texto incluyen archivos Word, PDF o texto plano.
- Imágenes: son archivos que contienen información visual, como fotografías o ilustraciones. Ejemplos de imágenes incluyen archivos JPEG, PNG o GIF.
- Audio: son archivos que contienen información sonora, como música o grabaciones de voz. Ejemplos de archivos de audio incluyen archivos MP3, WAV o AIFF.
- Video: son archivos que contienen información visual y sonora, como películas o vídeos. Ejemplos de archivos de video incluyen archivos MP4, MOV o AVI..
Datos semi-estructurados:
- Contenido de redes sociales: el contenido publicado en redes sociales, como publicaciones, comentarios y hashtags, puede ser considerado semi-estructurado.
- Correos electrónicos: los correos electrónicos también pueden ser considerados semi-estructurados, ya que tienen cierta estructura, como el remitente, el destinatario, el asunto y el cuerpo del mensaje, pero no están tan organizados como una tabla de datos.
- Archivos XML: el XML es un lenguaje de marcas extensible que permite definir estructuras para los datos