Data Mining Flashcards

(34 cards)

1
Q

Bases de datos relacionales

A

Colección de relaciones (tablas). Cada tabla consta de un conjunto de atributos (columnas o campos) y puede contener un gran número de tuplas (registros o filas).
Se relacionana entre si por llaves foraneas

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Bases de datos espaciales

A

Información relacionada con el espacio físico en un sentido amplio.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Bases de datos temporales

A
  • Datos que incluyen muchos atributos relacionados con el tiempo.
  • Distintos instantes Intervalos temporales.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

4 tipo de datose en bases de datos documentales

A
  • Descripciones para los objetos
  • Documentos no estructurados
  • Semi-estructurados
  • Estructurados
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Las bases de datos multimedia

A

Imágenes, videos y audio

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

¿Qué es la minearía de Datos?

A

Es un paso específico dentro del proceso KDD. Consiste en aplicar algoritmos inteligentes para extraer patrones o tendencias ocultas en los datos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

¿Qué es el KKD?

A

Es el proceso completo de descubrimiento de conocimiento en bases de datos. Abarca desde la limpieza y preparación de los datos hasta la interpretación de los resultados

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Dato válido

A

Los patrones descubierto son verdaderos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Dato potencialmente útil

A
  • El patrón debe tener un valor práctico.
  • Debe permitir tomar decisiones que generen un beneficio
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Que significa “es Comprensible”

A

un humano puede entender la lógica o el resultado.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

¿Qué son las bases de datos?

A

Recopilación organizada de información o datos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

¿Qué es la recuperación de información?

A

Técnicas para buscar y extraer información relevante en datos no estructurados

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

¿Qué son los sistemas de decisión?

A

Sistemas para que los ejecutivos tomen decisiones basadas en evidencia.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

4 Propiedades del conocimiento:

A
  • valido
  • potencialmente útil
  • novedoso
  • comprensible
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

2 Tipos de modelo:

A

descriptivo y predictivo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

2 tipos de aprendizaje:

A

supervisado y no supervisado

17
Q

6 fases de Metodología CRISP-DM:

A
  • Comp. Negocio
  • Comp. de Datos
  • Preparación de Datos
  • Modelado de Datos
  • Evaluación
18
Q

5 Tipos de sistemas y herramientas:

A

Tipo de base de datos minada
Tipo de conocimiento minado
Tipo de funcionalidad y técnica
Tipo de aplicación

19
Q

Describe: Validación cruzada de n pliegues

A

Dividir los datos en n grupos; se entrena n veces usando cada grupo una vez como prueba y el resto como entrenamiento.

20
Q

¿Qué es un dato?

A

son hechos/informaciones y cifras que se recogen, analizan y resumen para su presentación e interpretación.

21
Q

Cuales son 6 Tipos de Datos

A

*Interpretativo
*Razón
*Cualitativos
*Cuantitativos
*Nominales
*Ordinales

22
Q

¿Qué es el tipo de dato Nominal?

A

Se utilizan para distinguir categorías comprendidas en una variable determinada

23
Q

¿Qué son los datos Ordinales?

A

Reflejan un orden de rango entre las categorías que forman una variable.

24
Q

¿Qué es un dato de Intervalo?

A

en este tipo de dato los intervalos entre las categorías son iguales en la medición
**El cero es arbitrario

25
¿Qué es un dato de Razón?
Tiene las mismas características que las medidas de intervalo **El cero no es arbitrario
26
¿Qué es un dato cualitativo?
comprenden etiquetas o nombres
27
¿Qué es un dato Cuantitativo?
requieren valores numéricos que indiquen cuánto o cuántos.
28
Datos de sección transversal
Son los obtenidos en el mismo (aproximadamente el mismo) punto de tiempo
29
Datos de Series de tiempo
Son datos obtenidos a lo largo de varios periodos de tiempo
30
Estadísticas de Localización
Toma un punto/referencia para determinar el valor de los datos.
31
Estadísticas de dispersión
Se entiende por dispersión la separación que presentan los puntos entre sí o con respecto al centro de la gráfica.
32
Para donde volteas la grafica
derecha
33
¿Qué es la varianza?
En una muestra se refiere a la diferencia entre el dato y la media elevadas al cuadrado. También llamada cuadro medio
34
¿Qué es la Desviación estándar?
Es la raíz cuadrada de la varianza.