Big Data Flashcards by Moritz Br

Was macht Big Data aus?

Volume, Variety, Velocity, Veracity

How well did you know this?

Not at all

Perfectly

Was ist der Software Stack für Big Data Management?

Data Analysis
NoSQL, Search, Streaming oder SQL, Scripting
Data Processing Framework
Data Storage

parallel: Resource Management

How well did you know this?

Not at all

Perfectly

Was unterscheidet Spark von MapReduce?

Iteratives Vorgehen erleichtert
Invariante Daten (Resilient Distributed Dataset, RDD)
lazy => Optimierungen (Pipelining)
Lineage Graph

How well did you know this?

Not at all

Perfectly

Was sind die Vorteile von MapReduce gegenüber SQL?

Flexibilität
Skalierbarkeit
Effizienz
Fehlertoleranz

How well did you know this?

Not at all

Perfectly

Welche MapReduce Joins wurden vorgestellt?

Natural Join / Equi-Join
- Repartition Join
- Semi-Join
Theta-Join

How well did you know this?

Not at all

Perfectly

Big Data Flashcards