¡A que sí! Apuesto a que has escuchado algunos de estos conceptos. La realidad es que aunque no trabajemos con datos a diario, éstos influyen en nuestro día a día. Conocer estos conceptos básicos de datos nos ayudará a entender mejor el mundo con el cuál interactuamos. ¿Ready? ¡Comencemos!
Ciencia de datos
- Ciencia de datos: Es un campo multidisciplinario en el cual se busca convertir los datos en información. Para lograr esto se combinan las destrezas y conocimientos en matemáticas, computación e industrias. Abarca la preparación de los datos, la realización de análisis y procesamientos avanzados, la presentación de los resultados para mostrar patrones y permitir a las partes interesadas tomar decisiones informadas.
Estrategia de datos
- Estrategia de datos: Se refiere a las herramientas, procesos y reglas con las cuáles una organización va a regir el manejo, acceso, análisis y toma de decisiones basadas en datos. Esto incluye identificar las etapas, personas claves, metas, riesgos, entre otros aspectos.
Fuentes de datos
- Datos abiertos (open data): Son datos que pueden ser utilizados y distribuidos de manera libre. La idea detrás del movimiento de datos abiertos que hemos visto recientemente es que más personas tengan acceso a los datos. Un ejemplo de este movimiento, es que los ciudadanos puedan tener acceso a los datos del gobierno sin importar el motivo, ya sea para estudios investigativos o como herramienta de fiscalización.
- API (Application Programming Interface): Un API permite que las compañías puedan abrir sus datos a programadores o desarrolladores externos. Para esto, las compañías proveen documentación de los métodos para que otras aplicaciones puedan comunicarse o conectarse para usar los datos. Por ejemplo, Google tiene un API en el cual programadores pueden acceder a la información de los lugares que aparecen en Google Maps. La documentación del API explica cómo hacerlo y qué tipo de información está disponible.
Tipos de datos
- Datos cualitativos: Estos datos giran en torno a los adjetivos o cualidades. Por ejemplo, el color de un carro, emociones al realizar una tarea, o motivaciones para hacer algo. Una de las razones por la que se utilizan es para poder tener el contexto o panorama de manera más completa.
- Datos cuantitativos: Estos tipos de datos giran en torno a los números. Por ejemplo, cuánto cuesta un producto, cantidad de publicaciones, o máximo de visitas. Una de las razones por la que se utilizan es para poder generar estadísticas de manera fácil.
Inteligencia artificial y aprendizaje automático
- Inteligencia artificial: La inteligencia artificial, más allá de los rumores o de lo que vemos en películas, es la capacidad de replicar la inteligencia humana en máquinas o programas informáticos a través de algoritmos. ¿Qué significa esto? Significa que tienen memoria y la capacidad de aprender continuamente. Algunos ejemplos son reconocimiento facial como el utilizado para desbloquear nuestros teléfonos o el reconocimiento del lenguaje como cuando interactuamos con chatbots.
- Aprendizaje automático (machine learning): Es una de las aplicaciones de inteligencia artificial. Ésta permite el reconocimiento de patrones en los datos y el aprendizaje de los programas informáticos. En esta ocasión, el programa no es estático, por lo tanto va cambiando dependiendo de los datos que se utilicen para el entrenamiento. Un ejemplo, son los sistemas de recomendación. Estoy segura de que te has sorprendido cuando Amazon o Netflix te sugieren algo basado en tus gustos o perfil. Esas recomendaciones no están programadas en las plataformas, si no que, las plataformas han ido aprendiendo y han sido influenciadas por tu comportamiento y preferencias.
Tipos de análisis
- Análisis descriptivo: Como sugiere el nombre, este análisis pretende describir lo que ha sucedido en el pasado. Algunos ejemplos son los puntos anotados en los juegos de baloncesto o la cantidad de solicitudes a la universidad.
- Análisis diagnóstico: Este análisis es para descubrir las razones o el porqué detrás de lo que se muestra en el análisis descriptivo. Por ejemplo, se pudiera analizar si una disminución en ventas está relacionada a una disminución de empleados, disminución del nivel de satisfacción o al aumento en la cantidad de quejas sometidas por los clientes.
- Análisis predictivo: Con este tipo de análisis podemos tener una mejor comprensión de lo que ocurrirá o puede ocurrir en el futuro. Las compañías pudieran beneficiarse de este tipo de análisis para hacer las proyecciones de sus ventas.
- Análisis prescriptivo: Aquí podemos conseguir distintas posibles acciones que nos lleven a una solución a nuestro problema. Cada vez que estamos utilizando una aplicación para llegar a nuestro destino, vemos el análisis prescriptivo en vivo ayudándonos a ver el tráfico y varias alternativas de rutas.
Otros conceptos de datos
- Base de datos: Su función principal es almacenar información de tal manera que se puedan acceder, editar y usar de manera organizada. A diferencia de una hoja de cálculo, como un archivo de Excel, las bases de datos tienen mayor capacidad de almacenamiento y son más fáciles para manipular a gran escala o de manera frecuente. Las hojas de cálculo funcionan para cuando un solo individuo o un grupo pequeño necesita acceso a los datos o editarlos.
- Algoritmo: Es un conjunto de instrucciones que un sistema utiliza para llevar a cabo una tarea específica. Se puede ver como el procedimiento para cocinar algo utilizando una receta. Cuando se dice que el algoritmo de una red social cambió, significa que hubo un cambio en ese conjunto de decisiones que se utilizaba por ejemplo para determinar cuáles publicaciones salen en nuestras páginas de inicio.
- Metadata: Aquí puedes encontrar los datos de los datos. ¿Cómo es? Puedes conseguir cosas como el nombre, tamaño, quién lo generó, cuándo fue creado, o cuándo fue actualizado. Esto ayuda a poder organizar y conseguir los datos de manera fácil y rápida. Imagina cuán difícil sería conseguir algo en un libro sin un índice o una tabla de contenido.
- Computación en la nube (cloud computing): Son un conjunto de servicios de tecnología que se ofrecen a través de Internet, lo cual permite que sean accedidos de manera remota desde cualquier parte del mundo en el cual se tenga conexión a internet. Una de las ventajas que ofrece es que en caso de un desastre o apagón, se pueden conservar los datos. Algunos de estos servicios los utilizamos a diario, por ejemplo nuestros correos electrónicos o cuentas de Spotify residen en la nube.
- Encriptar datos: Esto ayuda a proteger nuestros datos, consiste en utilizar algoritmos o reglas para lograr que los datos se vuelvan ilegibles o incomprensibles. ¿Por qué haríamos esto? Se hace para limitar el acceso a solo personas o programas que estén autorizados. Para que tengas una idea, cuando utilizamos clave Morse estamos siguiendo una serie de reglas para convertir palabras en líneas y puntos, para hacer otros tipos de encriptaciones podemos utilizar otras reglas y solo aquellos que sepan descifrarlo podrán tener el acceso a la información original.
- Calidad de datos: Creo que tenemos una buena idea de lo que es la calidad, pero cuando se trata de datos ¿qué exactamente incluye? Nos referimos a que los datos estén completos, sean verdaderos, estén actualizados, haya consistencia, y que puedan integrarse con otros datos. Además, los datos que son considerados de alta calidad también son útiles para los usos previstos como toma de decisiones o planificación.
¿Cuántos de estos conceptos de datos conocías? No te preocupes si no los conocías, lo importante es que ahora tienes una referencia. Cada vez que escuches alguna de estas, porque estoy segura de que lo harás, vas a tener una mejor idea de a qué se refieren.
El mundo de datos es para todos.