TF-IDF - como calculam?
“Palavra rara no bairro mas comum na sua rua = importante
Word2Vec Skip-gram vs CBOW
“Skip-gram: pela pessoa adivinha amigos
Matriz Confusão - métricas derivadas
“Precision: não mentir
SQL - JOIN mais cobrado?
“INNER JOIN = só quem tem namorado nas duas turmas vai pro baile”
Spark vs Hadoop - vantagem?
“Spark = Ferrari na estrada
NoSQL - quando usar?
“Quando seus dados são bagunçados e não cabem em tabelinhas organizadas”
One-Hot Encoding - limitação?
“Vira festival de luzinhas piscando - muita coluna pra pouca informação”
Normalização - métodos comuns?
“Colocar todo mundo na mesma régua - ou de 0 a 1, ou com média 0”
CNN - por que convoluções?
“Olho artificial - primeiro vê pontinhos, depois risquinhos, depois formas, depois objetos”
NLP - pipeline básico?
“Quebrar texto → tirar palavras vazias → reduzir palavras → transformar em números → aprender”