B2-INTELIGENCIA ARTIFICIAL Flashcards by Firestorm Great

¿Cuál es la relación jerárquica entre IA, Machine Learning (ML) y Deep Learning (DL)?

DL es un subconjunto de ML, que a su vez es un subconjunto de IA (DL ⊂ ML ⊂ IA).

How well did you know this?

Not at all

Perfectly

¿Qué es la Inteligencia Artificial (IA)?

Sistemas que realizan tareas que normalmente requieren inteligencia humana, como percepción, razonamiento, aprendizaje y acción.

How well did you know this?

Not at all

Perfectly

Según la definición clásica de Tom Mitchell, un programa “aprende” si mejora su desempeño (P) en una tarea (T) con la _____.

experiencia (E).

How well did you know this?

Not at all

Perfectly

¿Qué pregunta clave ayuda a decidir si un problema de Machine Learning es supervisado?

¿Tengo datos con etiquetas?

How well did you know this?

Not at all

Perfectly

¿Qué caracteriza al aprendizaje supervisado?

Se entrena con datos que ya incluyen la respuesta correcta o “etiqueta”.

How well did you know this?

Not at all

Perfectly

¿Cuál es el objetivo principal del aprendizaje no supervisado?

Descubrir patrones, grupos o estructuras ocultas en datos sin etiquetas.

How well did you know this?

Not at all

Perfectly

¿Cómo aprende un agente en el aprendizaje por refuerzo (RL)?

Interactúa con un entorno y aprende a través de señales de recompensa y castigo por sus acciones.

How well did you know this?

Not at all

Perfectly

Tarea de ML: Clasificación

Definición: Asignar una etiqueta o categoría discreta a una entrada. Ejemplo: Determinar si un correo es spam o no spam.

How well did you know this?

Not at all

Perfectly

Tarea de ML: Regresión

Definición: Predecir un valor numérico continuo. Ejemplo: Estimar el precio de una vivienda.

How well did you know this?

Not at all

Perfectly

A pesar de su nombre, el algoritmo de Regresión Logística se utiliza principalmente para tareas de _____.

clasificación binaria

How well did you know this?

Not at all

Perfectly

¿Qué problema común en modelos lineales ayudan a mitigar los algoritmos Ridge y Lasso?

El sobreajuste (overfitting) mediante la aplicación de regularización.

How well did you know this?

Not at all

Perfectly

¿Qué parámetro principal requiere el algoritmo de clustering K-means que otros como DBSCAN no necesitan?

El número de grupos (k).

How well did you know this?

Not at all

Perfectly

¿Cuál es una ventaja clave de DBSCAN sobre K-means para el clustering?

Puede encontrar grupos de formas arbitrarias e identificar el ruido (outliers).

How well did you know this?

Not at all

Perfectly

¿Cuál es el uso principal y recomendado del algoritmo t-SNE?

La visualización de estructuras de datos de alta dimensionalidad en 2D o 3D.

How well did you know this?

Not at all

Perfectly

¿Para qué tarea NO se debe usar el resultado de t-SNE como entrada?

Para alimentar un modelo de predicción posterior.

How well did you know this?

Not at all

Perfectly

El acrónimo LDA en Machine Learning puede referirse a dos algoritmos diferentes. ¿Cuáles son?

Linear Discriminant Analysis (supervisado) y Latent Dirichlet Allocation (no supervisado).

How well did you know this?

Not at all

Perfectly

¿Qué tipo de algoritmos de Machine Learning implementa principalmente la librería scikit-learn?

Algoritmos de ML “clásico” (clasificación, regresión, clustering), pero no redes neuronales profundas.

How well did you know this?

Not at all

Perfectly

¿Para qué tipo de modelos se utilizan principalmente las librerías PyTorch y TensorFlow?

Para construir y entrenar modelos de Deep Learning (redes neuronales profundas).

How well did you know this?

Not at all

Perfectly

En el ecosistema de TensorFlow, ¿qué rol cumple Keras?

Es la API de alto nivel de TensorFlow, que facilita la construcción de redes neuronales.

How well did you know this?

Not at all

Perfectly

¿Cuál es la estructura de datos principal que utiliza la librería pandas para manejar datos tabulares?

El DataFrame.

How well did you know this?

Not at all

Perfectly

¿Cuál es la función principal de herramientas como Anaconda o conda en un proyecto de Machine Learning?

Gestionar entornos y dependencias de paquetes para evitar conflictos de versiones.

How well did you know this?

Not at all

Perfectly

¿Para qué tipo de datos son ideales las redes neuronales estándar (densas o fully-connected)?

Datos tabulares (columnas numéricas o categóricas).

How well did you know this?

Not at all

Perfectly

¿Cuál es la idea clave detrás de las Redes Neuronales Convolucionales (CNN) que las hace efectivas para imágenes?

Usan filtros locales que analizan pequeñas “ventanas” de la imagen y comparten pesos.

How well did you know this?

Not at all

Perfectly

Las Redes Neuronales Convolucionales (CNN) son la arquitectura de elección para datos con estructura _____, como las imágenes.

espacial

How well did you know this?

Not at all

Perfectly

¿Qué característica permite a las Redes Neuronales Recurrentes (RNN) procesar secuencias?

Tienen bucles internos que mantienen un estado o memoria del contexto anterior.

¿Para qué tipo de datos son ideales las Redes Neuronales Recurrentes (RNN)?

Para secuencias, como texto, audio o series temporales.

En muchas tareas de NLP hoy en día, ¿qué arquitectura ha reemplazado en gran medida a las RNN?

Los Transformers, que se basan en mecanismos de atención.

¿En qué se basaban principalmente los primeros sistemas de IA (paradigma simbólico)?

En reglas lógicas y conocimiento explícito codificado por humanos.

¿Qué necesita el algoritmo de búsqueda informada A* para guiar eficientemente su exploración?

Una función heurística que estime el costo restante hasta el objetivo.

En una tarea de clasificación, ¿cuál es la diferencia entre precisión (precision) y exhaustividad (recall)?

Precisión mide los aciertos entre los predichos como positivos, mientras que recall mide los positivos reales que fueron capturados.

¿En qué tipo de problema es crucial priorizar el recall sobre la precision?

En problemas donde los falsos negativos son muy costosos, como en el diagnóstico de enfermedades graves.

¿En qué tipo de problema es crucial priorizar la precision sobre el recall?

En problemas donde los falsos positivos son muy costosos, como marcar un correo importante como spam.

¿Qué ocurre cuando un modelo sufre de sobreajuste (overfitting)?

Aprende "de memoria" los datos de entrenamiento y no generaliza bien a datos nuevos.

Nombra una técnica común para reducir el overfitting en modelos de Machine Learning.

La regularización (como en Ridge/Lasso) o el uso de un conjunto de validación.

En ética de la IA, ¿qué es el sesgo (bias)?

Un error sistemático del modelo que perjudica o desfavorece a ciertos grupos de personas.

¿Por qué es importante la transparencia o explicabilidad en un sistema de IA?

Para generar confianza, poder auditar sus decisiones y detectar errores o sesgos.

Los niveles de capacidad de la IA como "Teoría de la Mente" o "Autoconciencia" son principalmente _____.

conceptuales o aspiracionales, no tecnologías implementadas actualmente.

¿Cuál es el objetivo de los algoritmos de reglas de asociación?

Descubrir patrones de co-ocurrencia, como en cestas de la compra (si se compra A, también se suele comprar B).

¿Para qué se utiliza la reducción de dimensionalidad como el PCA?

Para condensar un gran número de variables en un conjunto más pequeño, manteniendo la mayor parte de la información relevante.

¿Por qué se considera que k-NN es un método de aprendizaje "perezoso" (lazy)?

Porque casi no "entrena" (solo almacena los datos), y el cálculo principal ocurre durante la fase de predicción.

¿Cuál es la suposición "ingenua" (naive) que hace el clasificador Naive Bayes?

Asume que todas las características (features) de entrada son independientes entre sí.

¿Para qué tipo de datos es especialmente útil y rápido el algoritmo Naive Bayes?

Para la clasificación de texto y datos dispersos (sparse data).

¿En qué escenario destaca el algoritmo de Máquinas de Vectores de Soporte (SVM)?

Cuando hay pocos o medianos datos y las clases están bien separadas por un margen claro.

¿Cuál es una ventaja clave de los modelos basados en árboles como Random Forest?

Son robustos, manejan bien datos no lineales y son relativamente interpretables.

¿Qué es un "prompt" en el contexto de la IA generativa?

La instrucción o guía en lenguaje natural que se le da al modelo para que genere una respuesta.

¿Por qué la métrica de exactitud (accuracy) puede ser engañosa?

En datasets con clases desbalanceadas, puede dar una falsa sensación de buen rendimiento.

¿Cuál es la relación entre Ciencia de Datos (Data Science) e IA?

Son campos que se solapan: la ciencia de datos usa ML, pero la IA también incluye áreas no basadas en datos como la búsqueda y la planificación simbólica.

¿Para qué tarea no supervisada se pueden usar los Autoencoders?

Para reducción de dimensionalidad, detección de anomalías o aprendizaje de representaciones (rasgos).

En un problema de predicción de abandono de clientes (churn), ¿qué dos algoritmos clásicos se usan como modelos base (baselines)?

Regresión Logística y Árboles de Decisión/Random Forest.

En Visión por Computador, la tarea de Detección de Objetos devuelve la clase del objeto y también _____

las cajas delimitadoras (bounding boxes) que indican su ubicación.

¿En qué momento de un pipeline de Machine Learning se aplicaría típicamente PCA?

Como un paso de preprocesamiento, antes de entrenar el modelo predictivo final.

En representación del conocimiento, ¿qué representa un grafo?

Un conjunto de entidades (nodos) y las relaciones entre ellas (aristas).

¿Qué garantiza el algoritmo de búsqueda en anchura (BFS) en un grafo con costes de arista uniformes?

Encuentra el camino más corto en términos de número de aristas o saltos.

¿Cuál es el objetivo de la planificación en IA?

Encontrar una secuencia de acciones que transforme un estado inicial en un estado objetivo.

En un clasificador que predice probabilidades, ¿qué efecto tiene subir el umbral de decisión para la clase positiva?

Reduce los falsos positivos (aumenta la precisión) a costa de aumentar los falsos negativos (reduce el recall).

El aprendizaje supervisado se considera _____-driven, mientras que el no supervisado es _____-driven.

task-driven (guiado por la tarea); data-driven (guiado por los datos)

¿Qué arquitectura de red neuronal es el estado del arte para la mayoría de las tareas de visión por computador?

Redes Neuronales Convolucionales (CNN).

Para datos tabulares con etiquetas, ¿qué librería y qué tipo de modelos son un buen punto de partida?

La librería scikit-learn con modelos como Regresión Logística, Árboles de Decisión o Gradient Boosting.

Los algoritmos como Apriori o FP-Growth se utilizan para la tarea de _____, típicamente en datos de transacciones.

búsqueda de patrones o reglas de asociación

¿Qué es un "token" en el Procesamiento del Lenguaje Natural (NLP)?

La unidad básica de texto, que puede ser una palabra, sub-palabra o carácter.

¿Cuál es el propósito de la validación cruzada (cross-validation) al evaluar un modelo?

Obtener una estimación más robusta y fiable del rendimiento del modelo en datos no vistos.

¿Cuál es la principal capacidad que distingue a la IA Generativa de otros tipos de IA?

La capacidad de crear contenido nuevo y original, como texto, imágenes, audio o código.

El algoritmo k-NN entrena _____, pero predice _____.

rápido; lento

¿Qué tipo de preprocesamiento de datos suele ser necesario para que los SVM funcionen bien?

El escalado de las variables (features).

¿Con qué tipo de problemas tienen dificultades los modelos de regresión lineal?

Con relaciones fuertemente no lineales entre las variables y con la presencia de outliers.

¿Cuál es la diferencia fundamental entre clustering y clasificación?

El clustering descubre grupos en datos no etiquetados, mientras que la clasificación asigna datos a grupos predefinidos y conocidos.

En ética de la IA, ¿qué significa el principio de "humano en el bucle" (human in the loop)?

Implica que una persona revise o apruebe las decisiones críticas tomadas por un sistema de IA.

¿Cuál es la intuición de una red neuronal estándar (densa)?

Actúa como un "mezclador universal" que combina todas las variables de entrada para encontrar patrones complejos.

¿Qué dos factores principales impulsaron el auge del Deep Learning a partir de la década de 2010?

La disponibilidad de grandes volúmenes de datos y el poder de cómputo de las GPUs.

¿Cómo se evalúan típicamente los modelos no supervisados como el clustering?

Con métricas indirectas (ej. coeficiente de silueta) o por su utilidad para el negocio, al no haber etiquetas de verdad.

¿Qué tipo de aprendizaje de ML usarías para segmentar clientes por su comportamiento de compra, sin tener categorías predefinidas?

Aprendizaje no supervisado (específicamente, clustering).

¿Qué arquitectura de Deep Learning sería la principal para detectar grietas en fotos de carreteras?

Una Red Neuronal Convolucional (CNN), ya que el problema se basa en patrones espaciales en imágenes.

¿Qué tipo de tarea de ML es predecir el precio de una vivienda basándose en sus características?

Regresión (aprendizaje supervisado).

Jupyter y pandas se asocian comúnmente con la fase de _____, mientras que exportar un modelo a una API se asocia con la fase de _____.

prototipado o exploración; producción

B2-INTELIGENCIA ARTIFICIAL Flashcards

(74 cards)