Machine Learning Flashcards

(50 cards)

1
Q

O que é Machine Learning?

A

É um campo da IA que ensina computadores a aprender a partir de dados, sem programação explícita.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qual a diferença entre IA e ML?

A

ML é um subcampo da IA focado em aprendizado a partir de dados.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quais são os principais tipos de aprendizado em ML?

A

Supervisionado, não supervisionado e por reforço.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

O que é um modelo em ML?

A

É a representação matemática aprendida a partir dos dados.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

O que é overfitting?

A

Quando o modelo aprende os dados de treino tão bem que perde capacidade de generalização.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

O que é underfitting?

A

Quando o modelo não aprende o suficiente e tem baixa performance mesmo no treino.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qual é o ciclo de vida de um projeto de ML?

A

Ingestão de dados → preparação → modelagem → avaliação → deploy → monitoramento.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qual é a função de uma função de perda?

A

Medir o erro entre o valor real e o previsto.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

O que é feature engineering?

A

Processo de selecionar, transformar ou criar variáveis para melhorar o desempenho do modelo.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

O que é regularização?

A

Técnica para evitar overfitting penalizando pesos do modelo.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

O que é regressão linear?

A

Algoritmo usado para prever valores contínuos com base em uma reta.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

O que é regressão logística?

A

Algoritmo de classificação binária que usa a função sigmoide.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

O que é uma árvore de decisão?

A

Modelo em forma de árvore usado para decisões baseadas em atributos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

O que é Random Forest?

A

Conjunto de árvores de decisão que melhora a generalização.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

O que é SVM (Support Vector Machine)?

A

Algoritmo de classificação que busca o hiperplano ótimo para separar classes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

O que é KNN (K-Nearest Neighbors)?

A

Classifica com base nos ‘k’ exemplos mais próximos do ponto.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

O que é Naive Bayes?

A

Classificador probabilístico baseado no teorema de Bayes e independência entre atributos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

O que é Clustering?

A

Técnica de agrupamento de dados sem rótulos, como o K-Means.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

O que é PCA (Análise de Componentes Principais)?

A

Técnica de redução de dimensionalidade.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

O que é aprendizado por reforço?

A

Aprendizado baseado em recompensas e punições ao longo do tempo.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

O que é Deep Learning?

A

Subcampo de ML com redes neurais profundas, capaz de aprender representações complexas.

22
Q

O que é uma rede neural artificial (ANN)?

A

Estrutura com camadas de neurônios simulando o cérebro humano.

23
Q

O que é uma CNN (Convolutional Neural Network)?

A

Rede neural para imagens, que utiliza convoluções para extrair padrões.

24
Q

O que são filtros em CNN?

A

Matrizes aplicadas na imagem para detectar bordas, texturas, etc.

25
O que é pooling em CNN?
Técnica de redução de dimensionalidade, como max pooling.
26
O que é uma RNN (Recurrent Neural Network)?
Rede neural com conexões temporais, usada para dados sequenciais.
27
O que é LSTM?
Tipo de RNN que lida bem com longas dependências temporais.
28
Qual a vantagem das CNNs sobre MLPs para imagens?
Menos parâmetros e maior eficiência em padrões espaciais.
29
O que é uma camada densa?
Camada onde cada neurônio está conectado a todos da camada anterior.
30
O que é função de ativação ReLU?
Função usada para introduzir não linearidade, ReLU(x) = max(0, x).
31
O que é PLN (NLP)?
Área que estuda a interação entre computadores e linguagem humana.
32
O que é tokenização?
Quebra de texto em unidades menores como palavras ou subpalavras.
33
O que é embedding de palavras?
Vetores densos que representam palavras com significado semântico.
34
O que é modelo transformer?
Arquitetura baseada em atenção, como no BERT ou GPT.
35
Para que serve a análise de sentimentos?
Identificar a polaridade (positiva, neutra ou negativa) de textos.
36
O que é acurácia?
Proporção de acertos totais.
37
O que é precisão (precision)?
Proporção de positivos preditos que são realmente positivos.
38
O que é recall?
Proporção de positivos reais que foram corretamente preditos.
39
O que é F1-score?
Média harmônica entre precisão e recall.
40
O que é matriz de confusão?
Tabela que mostra acertos e erros para cada classe prevista vs. real.
41
O que é ingestão de dados?
Processo de coletar e importar dados de fontes diversas para análise.
42
Quais são os tipos de ingestão de dados?
Batch (em lote) e streaming (em tempo real).
43
O que é ETL?
Extração, Transformação e Carga de dados.
44
O que é data lake?
Armazenamento de dados brutos em grande volume.
45
O que são dados estruturados e não estruturados?
Estruturados têm formato fixo (como tabelas), não estruturados incluem textos, imagens etc.
46
O que é arquitetura Lambda?
Arquitetura de dados que combina processamento batch e em tempo real.
47
O que é arquitetura Kappa?
Modelo baseado somente em streaming, eliminando batch.
48
Quando usar Lambda em vez de Kappa?
Quando é necessário reprocessar grandes volumes de dados históricos.
49
Vantagem da arquitetura Kappa?
Simplicidade e foco em dados em tempo real.
50
Exemplo de ferramenta para streaming em Lambda/Kappa:
Apache Kafka, Apache Spark Streaming, Apache Flink.