1. Dato vs Información

🎯 Resultado de Aprendizaje RA5 (20% de la calificación)

Evalúa la importancia de los datos, así como su protección en una economía digital globalizada, definiendo sistemas de seguridad y ciberseguridad tanto a nivel de equipo/sistema, como globales.

📋 Criterios de Evaluación que se trabajan en esta sección:

  • CE a) Se ha establecido la diferencia entre dato e información
  • CE b) Se ha descrito el ciclo de vida del dato
  • CE c) Se ha identificado la relación entre Big Data, análisis de datos, machine/deep learning e inteligencia artificial
  • CE d) Se han descrito las características que definen Big Data
  • CE e) Se han descrito las etapas típicas de la ciencia de datos y su relación en el proceso
  • CE f) Se han descrito los procedimientos de almacenaje de datos en la cloud/nube
  • CE g) Se ha descrito la importancia del cloud computing
  • CE h) Se han identificado los principales objetivos de la ciencia de datos en las diferentes empresas
  • CE i) Se ha valorado la importancia de la seguridad y su regulación en relación con los datos

1.1 Definición de Dato

Un dato es un elemento bruto, sin procesar, que por sí solo no tiene significado o contexto. Los datos son hechos, cifras, símbolos o caracteres que representan información pero que no han sido organizados, procesados o interpretados.

📊 Ejemplos de Datos

25, "Juan", 15.5, "2024-01-15", "verde", 1001101

🔢 Tipos de Datos

Numéricos, texto, fechas, booleanos, binarios, multimedia

1.2 Definición de Información

La información es el resultado del procesamiento, organización y contextualización de los datos. Es el conocimiento que se obtiene cuando los datos son interpretados y dotados de significado.

📈 Transformación Dato → Información

  • Datos: 25, 30, 28, 32, 27
  • Procesamiento: Cálculo de promedio
  • Información: "La temperatura promedio es 28.4°C"

1.3 Características de la Información

✅ Calidad

  • Precisión y exactitud
  • Completitud
  • Consistencia
  • Actualidad

🎯 Relevancia

  • Pertinencia al contexto
  • Utilidad para la toma de decisiones
  • Valor agregado
  • Aplicabilidad práctica

📊 Estructura

  • Organización lógica
  • Formato comprensible
  • Contexto adecuado
  • Presentación clara

2. Ciclo de Vida del Dato

2.1 Etapas del Ciclo de Vida

🔄 Ciclo de Vida de los Datos

📥 Captura
💾 Almacenamiento
🔄 Procesamiento
📊 Análisis
📈 Visualización
🗑️ Archivo/Eliminación

2.2 Descripción de Etapas

📥 1. Captura

  • Recolección de datos
  • Sensores IoT
  • Formularios web
  • APIs y sistemas

💾 2. Almacenamiento

  • Bases de datos
  • Data warehouses
  • Data lakes
  • Almacenamiento en nube

🔄 3. Procesamiento

  • Limpieza de datos
  • Transformación
  • Validación
  • Enriquecimiento

📊 4. Análisis

  • Análisis estadístico
  • Machine learning
  • Minería de datos
  • Predicción

2.3 Gestión del Ciclo de Vida

⚙️ Principios de Gestión

  • Governance: Políticas y procedimientos para el manejo de datos
  • Quality: Mantenimiento de la calidad a lo largo del ciclo
  • Security: Protección en todas las etapas
  • Compliance: Cumplimiento de regulaciones
  • Retention: Políticas de retención y eliminación

3. Big Data: Características y Definición

3.1 Las 5 V's del Big Data

📊 Volumen

  • Cantidad masiva de datos
  • Terabytes, petabytes, exabytes
  • Crecimiento exponencial
  • Almacenamiento distribuido

⚡ Velocidad

  • Generación en tiempo real
  • Procesamiento rápido
  • Streaming de datos
  • Respuesta inmediata

🎭 Variedad

  • Diferentes tipos de datos
  • Estructurados y no estructurados
  • Texto, imágenes, video
  • Múltiples fuentes

✅ Veracidad

  • Calidad y confiabilidad
  • Datos precisos y exactos
  • Validación de fuentes
  • Eliminación de ruido

💎 Valor

  • Utilidad para el negocio
  • Insights accionables
  • ROI de los datos
  • Ventaja competitiva

3.2 Fuentes de Big Data

📱 Dispositivos Móviles

Apps, sensores, GPS, redes sociales móviles

🌐 Internet

Websites, redes sociales, e-commerce, búsquedas

🏭 IoT Industrial

Sensores, máquinas, equipos conectados

📊 Transacciones

Compras, pagos, operaciones bancarias

4. Análisis de Datos y Relación con IA

4.1 Tipos de Análisis

📈 Análisis Descriptivo

  • ¿Qué ha pasado?
  • Estadísticas históricas
  • KPIs y métricas
  • Reportes y dashboards

🔍 Análisis Diagnóstico

  • ¿Por qué ha pasado?
  • Análisis de causas
  • Drill-down
  • Correlaciones

🔮 Análisis Predictivo

  • ¿Qué va a pasar?
  • Modelos predictivos
  • Machine Learning
  • Forecasting

🎯 Análisis Prescriptivo

  • ¿Qué debería hacer?
  • Recomendaciones
  • Optimización
  • Automatización

4.2 Relación Big Data - IA - Machine Learning

🔗 Conexión entre Tecnologías

  • Big Data: Proporciona el volumen de datos necesario para entrenar algoritmos de IA
  • Machine Learning: Algoritmos que aprenden de los datos para hacer predicciones
  • Deep Learning: Redes neuronales que procesan datos complejos
  • IA: Aplicación de ML y DL para resolver problemas inteligentes

4.3 Aplicaciones en Mantenimiento Electrónico

🔧 Mantenimiento Predictivo

Análisis de patrones de fallo para predecir averías

📊 Optimización de Inventarios

Predicción de demanda de repuestos mediante ML

🔍 Diagnóstico Automático

IA para identificar problemas en equipos electrónicos

5. Almacenamiento de Datos en la Nube

5.1 Modelos de Almacenamiento

🗄️ Almacenamiento de Objetos

  • Amazon S3, Google Cloud Storage
  • Escalabilidad ilimitada
  • Acceso vía API
  • Ideal para Big Data

📊 Bases de Datos NoSQL

  • MongoDB, Cassandra, DynamoDB
  • Flexibilidad de esquemas
  • Alto rendimiento
  • Escalabilidad horizontal

🏢 Data Warehouses

  • Amazon Redshift, Snowflake
  • Análisis de datos estructurados
  • Consultas complejas
  • Business Intelligence

🌊 Data Lakes

  • Amazon S3, Azure Data Lake
  • Datos estructurados y no estructurados
  • Flexibilidad total
  • Análisis avanzado

5.2 Ventajas del Almacenamiento en Nube

☁️ Beneficios del Cloud Storage

  • Escalabilidad: Capacidad ilimitada de almacenamiento
  • Accesibilidad: Acceso desde cualquier lugar
  • Costos: Pago solo por lo que se usa
  • Seguridad: Encriptación y backups automáticos
  • Integración: Fácil conexión con servicios de análisis

5.3 Consideraciones de Seguridad

🛡️ Aspectos de Seguridad

  • Encriptación: Datos en tránsito y en reposo
  • Control de acceso: Autenticación y autorización
  • Compliance: Cumplimiento de regulaciones
  • Backup: Copias de seguridad automáticas
  • Auditoría: Registro de accesos y cambios

6. Ciencia de Datos: Etapas y Proceso

6.1 Etapas de la Ciencia de Datos

🧪 Proceso de Ciencia de Datos

🎯 Definición del Problema
📊 Recopilación de Datos
🧹 Limpieza de Datos
🔍 Exploración
🤖 Modelado
📈 Evaluación
🚀 Despliegue

6.2 Descripción de Etapas

🎯 1. Definición del Problema

  • Identificación del objetivo
  • Formulación de hipótesis
  • Definición de métricas
  • Planificación del proyecto

📊 2. Recopilación de Datos

  • Identificación de fuentes
  • Extracción de datos
  • Validación de calidad
  • Documentación

🧹 3. Limpieza de Datos

  • Detección de errores
  • Eliminación de duplicados
  • Tratamiento de valores faltantes
  • Normalización

🔍 4. Exploración

  • Análisis estadístico
  • Visualización de datos
  • Identificación de patrones
  • Correlaciones

6.3 Herramientas de Ciencia de Datos

🐍 Python

Pandas, NumPy, Matplotlib, Seaborn, Scikit-learn

📊 R

dplyr, ggplot2, caret, shiny

📈 Tableau

Visualización y análisis de datos

☁️ Cloud Platforms

Google Colab, AWS SageMaker, Azure ML

7. Herramientas para Analizar Datos

7.1 Categorías de Herramientas

💻 Herramientas de Programación

  • Python (pandas, numpy)
  • R (dplyr, ggplot2)
  • SQL (consultas)
  • Scala (Spark)

📊 Herramientas de Visualización

  • Tableau
  • Power BI
  • QlikView
  • D3.js

☁️ Plataformas Cloud

  • Google Cloud Platform
  • Amazon Web Services
  • Microsoft Azure
  • IBM Cloud

🤖 Herramientas de ML

  • TensorFlow
  • PyTorch
  • Scikit-learn
  • Weka

7.2 Selección de Herramientas

🎯 Criterios de Selección

  • Tipo de datos: Estructurados vs no estructurados
  • Volumen: Cantidad de datos a procesar
  • Complejidad: Nivel de análisis requerido
  • Presupuesto: Costos de licencias y servicios
  • Habilidades del equipo: Conocimientos técnicos disponibles

8. Seguridad y Regulación de Datos

8.1 Principales Amenazas

🚨 Amenazas a la Seguridad de Datos

  • Brechas de datos: Acceso no autorizado a información
  • Malware: Software malicioso que compromete datos
  • Phishing: Engaño para obtener credenciales
  • Insider threats: Amenazas internas
  • Ransomware: Secuestro de datos por rescate

8.2 Medidas de Protección

🛡️ Estrategias de Seguridad

  • Encriptación: Protección de datos en tránsito y reposo
  • Autenticación multifactor: Verificación en múltiples pasos
  • Backup y recuperación: Copias de seguridad regulares
  • Monitoreo: Detección de actividades sospechosas
  • Formación: Concienciación del personal

8.3 Regulaciones Importantes

🇪🇺 GDPR (Europa)

Reglamento General de Protección de Datos de la UE

🇺🇸 CCPA (California)

Ley de Privacidad del Consumidor de California

🇪🇸 LOPD-GDD (España)

Ley Orgánica de Protección de Datos Personales

9. Objetivos de la Ciencia de Datos en Empresas

9.1 Objetivos Estratégicos

📈 Mejora de la Rentabilidad

  • Optimización de costos
  • Aumento de ingresos
  • Mejora de eficiencia
  • ROI de inversiones

🎯 Toma de Decisiones

  • Decisiones basadas en datos
  • Reducción de incertidumbre
  • Predicción de tendencias
  • Análisis de riesgos

👥 Experiencia del Cliente

  • Personalización
  • Mejora del servicio
  • Predicción de necesidades
  • Retención de clientes

🚀 Innovación

  • Nuevos productos
  • Servicios innovadores
  • Ventaja competitiva
  • Transformación digital

9.2 Casos de Uso por Sector

🏭 Manufactura

Mantenimiento predictivo, control de calidad, optimización de producción

🏥 Salud

Diagnóstico médico, medicina personalizada, gestión hospitalaria

💰 Finanzas

Detección de fraudes, análisis de riesgo, trading algorítmico

🛒 Retail

Recomendaciones, gestión de inventarios, análisis de comportamiento

9.3 Métricas de Éxito

📊 KPIs de Ciencia de Datos

  • Precisión de modelos: Exactitud de predicciones
  • Tiempo de implementación: Velocidad de despliegue
  • ROI: Retorno de inversión en proyectos de datos
  • Adopción: Uso de insights por parte de usuarios
  • Impacto en negocio: Mejoras en métricas empresariales

📊 Resumen de Resultados de Aprendizaje y Criterios de Evaluación

🎯 RA5 - Evaluación de Datos (20%)

CE a-i: Dato/información, ciclo vida, Big Data, análisis, almacenamiento, ciencia datos, seguridad

Evaluación: 3ª Evaluación (4h)