TI Flashcards

(62 cards)

1
Q

Operações Comuns em Banco de Dados

A

ETL
Extracte: Extrair
Transform: Alteração
Load: Incluir

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Caracteristica DW Data Warehouses

A
  • Não volátil
  • Histórico: é mantido
  • Integral /Integrado
  • Orientado por assunto
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Não volátil

A

Dados não mudam com facilidade.
Usuario faz consulta e emite relatório para tomada de decisão

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Integrado

A

Agrupamento de dados iguais. Limpeza dos dados.
Ex: CEF =Caixa= Caixa econômica.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

ENTERPRISE DATA
WAREHOUSE

A

EDW
Grande Data warehouse envolvendo diversas disciplinas. Grande e abrangente

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

OPERATIONAL DATA STORE

A

ODS
Intermediário entre EDW e data Mart.
Fonte de dados para EDW

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

DATA MART

A

DW
Data warehouse especializado
- Mais rápido
- Economico
- Customizado para a necessidade

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Data warehouse de Ralph Kimball

A

Bottom-up
- Dimensional Data Warehouse.
- Váriso Data Mart que se integram em um EDW

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Data warehouse de Inmon

A

Top-down
- Chamado de EDW
- De um EDW para vários Data mart

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Algoritimos de Machine Learnig Aprendizado Supervisionado

A
  • K-Nearest Neighbours (KNN)
  • Regressão linear
  • Regressão logistica
  • Naive Bayes
  • Arvore de Decisão
  • Florestas Aleatorias
  • Support Vector Machine
    Modelos: Regressão ou Classificação
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Algoritimos de Machine Learnig Aprendizado Não Supervisionado

A

Agrupamento ou associação

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

K-Means

A

Não Supervisionado
Divide em K clusters, k fornecido pelo usuário.
A função minimiza a soma dos quadrados das distâncias ao centroide de cada cluster.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Aglomeração

A

Não supervisionbado: para agrupamento
Classificação hierarquica de proximidadede
Ex.: Agnes(Aglomerando) e Diana (Dividindo)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

DBSCAN

A

Não supervisionado
Baseado em densidade

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Apriori

A

Não Supervisionado
Para buscar regras de associação

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Suporte e confiança

A

Suorte: Medida de frequancia que indica a proporção de transações.

Confiança: Proporção que contenha o antecedente e consequante em comparaçao aqueles que contem apenas o antecedente.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Linguagem SQL:
DCL

A

Data Control Language:
- Grant
- Revoke
- Deny

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Linguagem SQL:
TCL

A

Transition Control Language
- Commit
- Rollback
- Save Point

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Linguagem SQL:
DDL

A

Data Definition Language:
- Create
- Alter
- Drop
- Truncate

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Linguagem SQL:
DML

A

Data Manipulation Language
- Insert
- Delete
- Update

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Linguagem SQL:
DQL

A

Data Query Language
- Select

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Comando SQL para filtrar atributos e linhas da tabela

A

πColuna1,Coluna2 (σValor > 2018 (NomeTabela))
π: Projeção
σ: Seleção

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

SQL
Operação de produto cartesiano

A

Combinação entre duas tabelas

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

SQL
Operação de União

A

Une os elementos eliminando as duplicidades

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
SQL Produto cartesiano
Combinação de duas tabelas, todos os elementos de todas as tabelas - Temos uma multiplicação tupla por tupla T1 × T2
26
SQL Junção
A junção é uma operação que une duas tabelas, com base em uma condição específica, um atributo comum entre elas. T1 ⋈ T2
27
Operações Adicionais em banco de dados
Que não são primitivas JADE - Junção - Atribuição - Divisão - Interseção
28
SQL COMMIT
TCL - Transition Control Language Confirma a transição
29
SQL SAVEPOINT
TCL - Transition Control Language Ponto de salvamento
30
SQL CREATE
DDL - Data Definition Language Criar objetos principais: - bancos de dados DATABASE, - tabelas TABLE, índices INDEX, - visualizações VIEW, - gatilhos TRIGGER - procedimentos armazenados STORED PROCEDURE
31
SQL ALTER
DDL - Data Definition Language - ADD COLUMN: Adiciona uma nova coluna a uma tabela existente - DROP COLUMN: Remove uma coluna de uma tabela existente - ALTER COLUMN Modifica a estrutura de uma coluna, como seu tipo de dados - ADD CONSTRAINT Adiciona uma nova restrição à tabela - DROP CONSTRAINT Remove uma restrição de uma tabela - RENAME TO Renomeia um objeto - ADD INDEX Adiciona um novo índice - DROP INDEX Remove um índice - ENABLE TRIGGER Ativa um gatilho que estava desativado - DISABLE TRIGGER Desativa um gatilho
32
SQL DROP
DDL - Data Definition Language Excluir um objeto por completo
33
SQL TRUNCATE
DDL - Data Definition Language - Apenas para objetos do tipo tabela. Limpa todos os campos porém mantém a estrutura.
34
SQL INSERT INTO
DML - Data Manipulation Language - Insere os registos na tabela
35
SQL UPDATE
DML - Data Manipulation Language - Altera valores de registro na tabela
36
SQL WHERE
DQL Data Query Language Comando de seleção da tabela com base em atributo especifico. Um filtro
37
SQL Delete
DML - Data Manipulation Language - Apaga valores especificos - Se não for especificado a condição, irá funcionar como um TRUNCATE
38
SQL SELECT
DQL Data Query Language Projeção
39
From T1, T2
produto cartesiano
40
Precisão do modelo
VP/(VP+FP) Denominador é a quantidade de total que o modelo apontou
41
Recall ou sensibilidade
VP/(VP+FN) Denominador é a quantidade real de positivos
42
Acurácia
Total da convergência = Vp + VN / (VP + FP + VN + FN)
43
F1-Score
Média harmonica da precisão e Recall/Sensibilidade =2P.R/(R+P) =2/(1/P+1/R)
44
Especificidade
Negativos =VN/(VN + FP) Total de negativos reais.
45
Overtuning
Quanto os parametros estão execessivamente ajustavos
46
Bagging
Modelos treinados em paralelo - Busca reduzir a variância do modelo, para tratar casos de overfitting Florestas aleatórias
47
Boosting
Modelos treinados em série - Busca reduzir o Vies/Bias do modelo, indicado para tratar o underfit
48
SMOTE
Synthetic Minority Oversampling Techinique Cria amostras sisnteticas da classe minoritaria a fim de balancear as classes. ADASYN - leva em cointa a densidade da variavel.
49
Esemble Learnig
Multiplos modelos são combinados para melhorar a porformance
50
Stacking
Utiliza saídas de multiplos modelos de base como entrada em um meta modelo Meta-Learner Blanding, é um tipo (Hold-out)
51
Ruidos Classe noise Attribute Noise
- Classe noise: Etiquetagem/Rótulos erronea da classe. - Attribute noise: Valor do atributo errado
52
Dados ausentes: MAR MNAR MCAR
- MAR (Missig At Randon): Os dados faltantes possuiem correlação com algum outro atributo que não os ausentes - MNAR (Missing Not At Randon): Os dados faltantes possuem correlação com o proprio dado faltante - MCAR (Missing Completely At Randon): Completamente aleatória
53
K-NN (KNearest Neighbors)
Supervisionado - Classificação e regressão - K exemplos mais próximos. K alto: Underfit, K baixo: Overfit
54
Regressão logística
Supervisionado Intervado [0,1], 2 classificações possiveis, binário.
55
Arvore de decisão
Supervisionado - Classificação e regressão Propensão ao overfit
56
Naixe Bayes
Supervisionado - Classificação - Supões independêncais entre os recursos. - Calcula a probabilidade condicional. - Naive = Inocente
57
SVM Suporte vector Machine
Supervisionado - Classificação e regressão BUsca encontrat a reta/plano que melhor separa o conjunto de dados, ou seja, maximiza a distância da margem.
58
Diferença entre While Do While Repeat Until
- While, sai do Loop se for F. Como a verificação é antes, pode não executar nenhuma vez. - Do While: Sai quando verifica-se F, Realiza no mínimo um vez o código - Repear until: Sai quando verifica-se V. Realiza no mínimo uma vez o código.
59
Perceptron
- única camada neural e um único neurônio. - algoritmo de aprendizado de classificadores binários - Apenas para problemas lineramente separaveis. Para não lineares utilizar multiplas camapas
60
feedforward
as redes neurais feedforward processam dados em uma direção, do nó de entrada para o nó de saída. Cada nó de uma camada está conectado a todos os nós da próxima camada.
61
redes recorrentes (RNN)
- Retornam informações - Interpretações de textos - possuem conexões cíclicas, - não se limitam a uma direção única.
62
redes convolucionais CNN
* As informações fluem apenas em uma direção. * para reconhecimento de padrões em imagens e vídeos