Les 3.2: Data analytics (vanaf veracity) Flashcards

(23 cards)

1
Q

veracity

over wat gaat veracity bij data

A

data integriteit => hoe betrouwbaar de data is

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

veracity

de veracity kan op verschillende plekken mislopen, geef de namen van de stages a.d.h.v. deze foto

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

veracity

leg de data integriteit uit bij het gedeelte creation

A

Bij de data creatie komt integriteit
overeen met hoe accuraat de data is.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

veracity

leg de data integriteit uit bij het gedeelte aggregation

A

Aggregeren is een wiskundig proces waardoor er zelden iets misloopt. Wat wel kan is dat gebruikers de geaggregeerde data verkeerd
interpreteren.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

veracity

leg de data integriteit uit bij het gedeelte storage

A

Er kunnen problemen zijn met Opgeslagen data door bv. updates.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

veracity

leg de data integriteit uit bij het gedeelte access

A

Systemen die toegang voorzien voor business gebruikers moeten read-only zijn.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

veracity

leg de data integriteit uit bij het gedeelte archive

A

Als de data geen directe waarde meer heeft wordt ze in een archief opgeslagen. De beveiliging is dan het belangrijkste. Deze moet een beperkte toegangslijst hebben en read-only zijn.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

veracity

leg de data integriteit uit bij het gedeelte share

A

De integriteit wordt getest bij het delen van de data. Business gebruikers hebben meestal een goed beeld over wat ze verwachten. Als dit afwijkt zal de data in vraag gesteld worden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

veracity

wat is een database schema + 2 soorten

A

Een schema organiseert de inhoud van een relationele database en kan gebruikt worden om beperkingen op te leggen die de data integriteit ten goede komen.
+ logisch en fysisch schema

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

veracity

leg een logisch schema uit

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

veracity

leg een fysisch schema uit

A

Het fysisch schema gaat over de echte opslag van de data op een disk of in de cloud. Dit bevat informatie over de files, indices, partities, clusters, …

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

veracity

welke 2 systemen zorgen voor de consistentie van data te garanderen

A

ACID en BASE

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

veracity

voor wat staat ACID + wat bekent elk deeltje

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

veracity

voor wat staat BASE + wat bekent elk deeltje

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

veracity

geef de verschillen tussen ACID en BASE op vlak van:
consistentie
wat key is (belangrijk)
resultaten
beschikbaarheid

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

veracity

wat is ETL + uitleg

17
Q

veracity

leg fase 1 van ETL uit

18
Q

veracity

leg fase 2 van ETL uit

19
Q

veracity

leg fase 3 van ETL uit

20
Q

wat doet een data/BI analyst

21
Q

wat doet een data engineer

22
Q

wat doet een data architect

23
Q

wat doet een data scientist