¿Cuál es la mejor aplicación de la regresión lineal?
A) Detección de spam
B) Predicción de precios de casas
C) Reconocimiento facial
D) Agrupación de clientes
B
¿Qué limita a la regresión logística?
A) No funciona con variables categóricas
B) Es débil con fronteras de decisión no lineales
C) No soporta conjuntos de datos binarios
D) Es demasiado lenta con pocos datos
B
¿Cuál es una desventaja principal de los árboles de decisión?
A) Son difíciles de interpretar
B) Son muy lentos en entrenamiento
C) Tienden a sobreajustar y ser inestables
D) No sirven para regresión
C
¿Cuál es una ventaja clave de los Random Forest frente a un árbol de decisión?
A) Mayor interpretabilidad
B) Evitan el sobreajuste gracias al bagging
C) Requieren menos datos
D) Son más rápidos en inferencia
B
¿Cuál es un punto débil de los modelos de boosting?
A) No alcanzan alta precisión
B) Son muy interpretables
C) Pueden sobreajustar y requieren mucho tiempo de entrenamiento
D) No sirven para clasificación
C
¿Cuál es un escenario típico donde usar un SVM?
A) Predicción de series temporales
B) Clasificación de imágenes con pocas dimensiones
C) Reconocimiento facial con datasets grandes
D) Reducción de dimensionalidad
C
¿Por qué no es recomendable usar KNN en datasets muy grandes?
A) Porque no puede clasificar datos numéricos
B) Porque es lento al hacer predicciones
C) Porque solo funciona con datos textuales
D) Porque no soporta regresión
B
Naive Bayes, ¿Cuál es una de sus principales suposiciones?
A) Las features son dependientes entre sí
B) Las features son independientes entre sí
C) Los datos deben ser numéricos
D) Siempre se entrena con árboles de decisión
B
¿Cuándo NO es recomendable usar K-Means?
A) Cuando los clusters son esféricos
B) Cuando el número de clusters está bien definido
C) Cuando los datos forman clusters no esféricos
D) Cuando se necesita agrupación rápida
C
¿Cuál es la utilidad principal de PCA?
A) Clasificar datos
B) Reducir la dimensionalidad conservando la mayor varianza
C) Detectar anomalías
D) Generar árboles de decisión
B
¿Cuál es una limitación de las redes neuronales tradicionales (MLP)?
A) No pueden entrenarse con datos numéricos
B) Necesitan grandes cantidades de datos
C) Son muy interpretables
D) No se pueden paralelizar
B
¿Para qué tipo de datos son ideales las CNN?
A) Datos de texto
B) Datos de audio
C) Datos de imagen y espaciales
D) Datos tabulares
C
¿Cuál es la mayor limitación de las RNN clásicas?
A) No sirven para datos secuenciales
B) Son demasiado rápidas
C) El problema del gradiente desvanecido en secuencias largas
D) No funcionan con embeddings
C
Transformers (BERT, GPT)- ¿Qué característica los hace superiores a las RNN?
A) Usan convoluciones en lugar de atenciones
B) Capturan dependencias largas gracias al mecanismo de atención
C) Requieren pocos datos
D) Son más interpretables
B
Autoencoders-¿Cuál es una de sus aplicaciones más comunes?
A) Predicción de precios
B) Compresión y detección de anomalías
C) Clasificación de imágenes
D) Clustering esférico
B
DBSCAN-¿Qué ventaja tiene sobre K-Means?
A) Es más interpretable
B) Puede encontrar clusters de formas arbitrarias y manejar ruido
C) Siempre requiere definir el número de clusters
D) Es más rápido en todos los casos
B
¿Cuál es el algoritmo más adecuado para predecir precios de casas y por qué no se recomienda cuando los datos tienen fuerte no linealidad?
A) Árbol de Decisión
B) Regresión Lineal
C) Red Neuronal
D) Clustering de K-Means
B
¿Qué característica clave diferencia la Regresión Logística de la Regresión Lineal?
A) El tipo de datos de entrada
B) Su uso para clasificación binaria
C) El uso de bagging
D) La estructura recursiva
B
¿Por qué los árboles de decisión pueden ser inestables en conjuntos de datos ruidosos?
A) Tienen interpretabilidad baja
B) Se sobreajustan fácilmente
C) Requieren muchos datos
D) Tienen alta capacidad de computación
B
¿Qué ventaja principal proporciona el Random Forest sobre el árbol de decisión individual?
A) Más rápido en tiempo real
B) Mayor robustez y precisión
C) Mejor para compresión de imágenes
D) Menos requerimiento de datos
B
¿En qué caso no es recomendable usar Gradient Boosting?
A) Cuando se requiere alta interpretabilidad
B) En sistemas de recomendación
C) Cuando los datos presentan alta no linealidad
D) Para agrupamiento no supervisado
A
¿Cuál es la principal desventaja del uso de SVM en grandes volúmenes de datos?
A) Bajo ajuste en casos de noise
B) Altos costes computacionales
C) Sensible a la escala de las características
D) Usa bagging
B
¿Por qué KNN puede ser lento en problemas con muchísimos datos?
A) Por el preprocesamiento extenso
B) Por la naturaleza de la búsqueda de distancia
C) Por la necesidad de interpretabilidad
D) Usa boosting
B
¿En qué tipo de situaciones es más útil Naive Bayes?
A) Recomendaciones personalizadas
B) Clasificación de texto y sentimiento
C) Series temporales
D) Reducción dimensional
B