pln Flashcards

(48 cards)

1
Q

come

A

fim

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

O que é PLN?

A

Campo da IA que ensina computadores a entender, interpretar e gerar linguagem humana

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Diferença: PLN vs Linguística Computacional

A

PLN foca em aplicações práticas, Linguística Computacional foca em teoria linguística

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Os 4 níveis de análise em PLN

A
  1. Morfológico 2. Sintático 3. Semântico 4. Pragmático
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

O que é Tokenização?

A

Dividir texto em unidades menores (tokens) - palavras, pontuação

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Exemplo de tokenização em português

A

“Olá, mundo!” → [“Olá”, “,”, “mundo”, “!”]

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

O que são Stop Words?

A

Palavras muito frequentes sem significado único (ex: “o”, “de”, “em”)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Por que remover Stop Words?

A

Reduz ruído e dimensionalidade, foca em palavras semanticamente importantes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

O que é Stemming?

A

Reduzir palavras à raiz (ex: “correndo” → “corr”) - método heurístico

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

O que é Lemmatization?

A

Reduzir palavras ao lemma usando dicionário (ex: “correndo” → “correr”)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

O que é POS Tagging?

A

Marcar cada palavra com sua classe gramatical (substantivo, verbo, etc.)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Tags POS básicas em português

A

NOUN (substantivo), VERB (verbo), ADJ (adjetivo), ADV (advérbio)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

O que é Parsing Sintático?

A

Analisar estrutura gramatical da frase (árvore de dependências)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Exemplo de parsing

A

“O gato preto” → [DET] [NOUN] [ADJ]

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

O que é NER (Named Entity Recognition)?

A

Identificar entidades nomeadas (pessoas, lugares, organizações, datas)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Exemplo de NER

A

“João viajou para Paris em 2023” → [PESSOA] [LUGAR] [DATA]

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

O que é Análise de Sentimentos?

A

Determinar emoção/polaridade em texto (positivo, negativo, neutro)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Exemplo de análise de sentimentos

A

“Adorei o filme!” → POSITIVO

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

O que são Word Embeddings?

A

Representação vetorial densa que captura significado semântico

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Vantagem de embeddings sobre one-hot

A

Capturam relações semânticas (ex: rei - homem + mulher = rainha)

21
Q

Diferença: Word2Vec Skip-gram vs CBOW

A

Skip-gram: palavra → contexto

22
Q

O que é TF-IDF?

A

Estatística que mede importância de palavra no documento vs corpus

23
Q

Fórmula do TF-IDF

A

TF-IDF = TF(t,d) × IDF(t)

24
Q

O que é arquitetura Transformer?

A

Baseada em mecanismo de atenção, não usa RNNs - mais paralelizável

25
O que é Attention?
Mecanismo que permite focar em partes relevantes do input
26
Diferença: BERT vs GPT
BERT: bidirecional (entende contexto)
27
O que é Fine-tuning?
Ajustar modelo pré-treinado para tarefa específica
28
Métrica para tradução automática
BLEU (Bilingual Evaluation Understudy)
29
Métrica para sumarização
ROUGE (Recall-Oriented Understudy for Gisting Evaluation)
30
Métrica para NER/POStagging
F1-Score (média harmônica entre precision e recall)
31
Aplicação: Chatbots
Sistemas de conversação automática
32
Aplicação: Machine Translation
Tradução automática entre idiomas
33
Aplicação: Text Summarization
Criar resumos automáticos de textos longos
34
Aplicação: Speech Recognition
Converter fala em texto
35
Desafio: Ambiguidade
"Vou para o banco" - 💳 financeiro ou 🏞️ de praça?
36
Desafio: Ironia/Sarcasmo
"Ótimo, mais uma reunião..." (não é ótimo)
37
Desafio: Contexto Cultural
"Time" ⚽ (BR) vs "Time" ⏰ (US)
38
O que é Bag of Words?
Representação de texto como vetor de frequências de palavras, ignorando ordem
39
Limitação do Bag of Words
Perde informação sobre ordem das palavras e contexto
40
O que é n-grams?
Sequências de n palavras consecutivas (ex: bigrams = 2 palavras)
41
Exemplo de bigrams
"gato preto pula" → ["gato preto", "preto pula"]
42
O que é Word Sense Disambiguation?
Identificar qual significado de palavra polissêmica está sendo usado
43
Exemplo de WSD
"Ele foi ao banco sacar dinheiro" → banco = instituição financeira
44
O que é Coreference Resolution?
Identificar quando duas expressões se referem à mesma entidade
45
Exemplo de Coreference
"Maria chegou. Ela estava cansada." → "Ela" refere-se a "Maria"
46
O que é Dependency Parsing?
Analisar relações gramaticais entre palavras (sujeito, objeto, etc.)
47
O que é Constituency Parsing?
Identificar frases e constituintes sintáticos
48
O que é Semantic Role Labeling?
Identificar papéis semânticos (agente, paciente, instrumento)