¿Qué es un dato?
Representación simbólica de un atributo sin contexto que por sí solo no tiene significado.
¿Qué es información?
Conjunto de datos procesados y organizados para que tengan un significado y utilidad
¿Qué es una base de datos?
Conjunto organizado de datos que se gestiona para que puedan ser accesibles. La información puede ser modificada, analizada o consultada según se requiera.
Características de las bases de Datos
Se organizan en tablas, filas y columnas (bases relacionales)
Acceso eficiente, las operaciones CRUD, se ejecutan con rapidez
Seguridad, se tiene control del acceso y permisos para acceder a la información
Escalabilidad, puede aumentar el volumen de datos sin afectar al rendimiento
Integridad, los datos son correctos y consistentes
¿Porqué los PDF, Word, Excel, entre otros no se consideran bases de datos?
Falta de estructura relacional
No hay seguridad ni validación de datos
No hay lenguaje de consulta
No son escalables ni eficientes
No permiten acceso concurrente confiable
No están diseñadas para ser consultadas automáticamente.
¿Qué es un Datasource?
Cualquier medio que posea datos utilizables.
¿Las bases de datos son datasources?
Sí, diseñadas para gestionar datos de forma estructurada
¿Qué es un Data Lake?
Es una datasource que almacena la información de manera cruda, masivamente y de forma flexible. Usada en Exploración, Machine Learning
¿Qué es un Data Werehouse?
Es una base de datos especializada, almacena de forma estructurada la información buscando que sea organizada y optimizada. Se usan en Reporting, BI