K-means
“Separar brinquedos em K caixas - cada um vai pra caixa mais perto do centro, que vai se ajustando”
Random Forest - questão típica?
“Time de experts - cada árvore vota, a maioria decide (não confia em um expert só)”
Overfitting - como identificam?
“Aluno que decora prova - na mesma prova tira 10, mas na prova diferente se ferra”
Validação Cruzada - por que usam?
“Rodízio de dados - todo mundo vira treino e teste, ninguém fica de fora”
SVM - o que sempre perguntam?
“Acha a linha da paz com maior espaço entre times brigando - kernel é colírio pra ver linhas curvas”
Naive Bayes - ‘ingênuo’ por quê?
“Acha que tudo é independente: ‘ter bigode’ e ‘miar’ não têm nada a ver (é ingênuo mesmo!)”
Regularização L1 vs L2
“L1: zera pesos menos importantes
PCA - objetivo principal?
“Compactar foto - tira detalhes menos importantes mas mantém a cara da pessoa”
Árvore de Decisão - critério split?
“Jogo de 20 perguntas - faz pergunta que mais separa times diferentes”
KNN - desvantagem importante?
“Preguiçoso - tem que calcular distância pra todo mundo, fica lento com muita gente”