kap. 2 - data Flashcards

(15 cards)

1
Q

Hva er en viktig oppgave i data science i følge forelesningsnotatet?

A

Å forberede og rense data – ofte en stor del av arbeidet i et data science-prosjekt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hva er strukturerte data?

A

Data som kan representeres i tabellform, der rader er datapunkter og kolonner er variabler.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hva er ustrukturerte data?

A

Data som tekst, bilder, lyd eller video som ikke enkelt kan representeres som en tabell.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hva er et vanlig problem når man gjør ustrukturerte data om til strukturerte data?

A

Man mister informasjon, som rekkefølge i tekst eller romlig struktur i bilder.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hva er numeriske variabler?

A

Variabler som representerer tall, enten kontinuerlige eller diskrete.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hva er kontinuerlige variabler?

A

Numeriske variabler som kan ta hvilken som helst verdi innenfor et intervall.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hva er diskrete variabler?

A

Numeriske variabler som bare kan ha et begrenset antall verdier, som antall barn.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hva er kategoriske variabler?

A

Variabler som representerer kategorier i stedet for tall, som kjønn eller utdanning.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hva er forskjellen på nominale og ordinale variabler?

A

Nominale har ingen rekkefølge (f.eks. yrke), ordinale har naturlig rekkefølge (f.eks. ‘bra’ -> ‘veldig bra’).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hvorfor er det viktig å kjenne variabeltypene?

A

Fordi det påvirker hvordan vi analyserer og oppsummerer dataene.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hva er dummy-variabler?

A

Binære variabler som brukes til å representere kategorier i numerisk form.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hva er prinsippene for ryddige data?

A

Hver variabel i én kolonne, hver observasjon i én rad.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hva gjør numpy i Python?

A

Gir støtte for numeriske beregninger og håndtering av arrays og matriser.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hva brukes pandas til i Python?

A

For å håndtere og analysere tabulære data som dataframes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hva er melt og pivot i pandas?

A

Verktøy for å endre dataformat, f.eks. fra bredt til langt format og tilbake.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly