3/4 V’s van
Big Data
Volume
Variatie
Velociteit (snelheid)
vaak zijn dit soort gegevens realtime beschikbaar
Veracity
waarachtigheid, kwaliteit/vertrouwelijkheid van de gegevens
Voordelen
Uitdagingen
niet vrijgesteld van zorgen over:
- (externe) validiteit
- wat betekenen begrippen
- kunnen we ‘echte; attitudes afleiden uit een online persona?
- repliceerbaarheid
- valse correlaties: als een dateset zo groot is zullen er altijd statisch significante correlaties zijn tussen sommige variabelen
- overfitting: je kunt bestaande gegevens heel goed verklaren maar kan het ook goed nieuwe gegevens voorspellen?