Unterschied von Projektprogress in ML vs SE
Was sind Ursachen dafür, dass 87% der ML Projekte scheitern, bzw. 53% der ML Prototypen nicht die Produktion erreichen?
5
Was ist Hoftstadter’s Law?
It always takes longer than you expect, even when you take into account Hofstadter’s Law.
Nenne Gründe gegen AI Software
3
4 Gründe für Automatisierung
4 Gründe für Augmentation (Zunahme)
Definiere den Lebenszyklus eines ML-Projekts
(4)
Scoping & Planning < Data < Model < Deployment
Was gehört zu Scoping & Planning hinzu? (ML LC)
3
Model metric does not align with project goal; performance unsatisfiable/disappointing; requirements revisiting
Was gehört zu Data hinzu? (ML LC)
4
Data mismatch (different distribution in production); rare cases required; bias found
Was gehört zu Model hinzu? (ML LC)
5
*Production performance != training performance; non-functional properties not met; *
Was gehört zu Deployment hinzu? (ML LC)
3
Wie geht man an AI-Projekte heran?
Ziel: Budgetierung
4 + Budgetierung
Was sind Probleme an der folgenden Metrik für AI System “Credit Card Fraud”:
“Success the more unauthorized withdrawals we block”
2
Beschrifte die Achsen
Impact & Feasibility
Feasibility Pyramid for Cost Drivers + je 3 Beispielfragestellung
DMD
Difficulty
Availlability of Similar Solutions, Education, Ressource for Training, Deployment
Model Accuracy
Cost of wrong predictions, mininmum accuracy, retrain frequency
Data Availlability
Data aquiration, labeling and amount
Was sollte man bei der Datenverfügbarkeit und der Modellkomplexität beachten, wenn man über die Machbarkeitsanalyse nachdenkt?
Daten(2), Model(1)
Techniken für die Verbesserung der Machbarkeit
4
Manage and Mitigate Risk
1. -> 2. -> 3.
1.Identify -> 2. Mitigate -> 3. Monitor
Was ist eine von Amazon erfunden gängige Methode für Riskmanagement?
Scoreboards in verschiedenen Kontexten:
z. B. :
- Project
- Finance
- Project Processes
- Data Quality
- Summary
Nenne die 3 Meilensteine um den Progress und Fokus für Entwicklungsstresspunkte im Auge zu behalten
Nenne den 1. Meilenstein während der Projektmanagement Phase ganz am Anfang und beschreibe, was ihn ausmacht.
3 + 3
Domain Expertise
**Starte einfach **
- kein ML / nur Heuristiken
- Wie lösen Menschen das Problem derzeit?
- Wie würdest du mit den aktuellen Daten es manuell lösen?
Schau dir die Daten zuerst an
- Exploratory Data Analysis (EDA)
- Manuelle Validierung der Annahmen
- Manuelles Labeln für Heuristiken zum Lösen des Problems
Nenne den 2. Meilenstein in AI-Software Engineering und beschreibe, was ihn ausmacht.
Idee + 2
Reproduziere ähnliche Arbeit
Idee: Was sind die technologischen Einschränkungen
Nenne den 3. Meilenstein in PM und beschreibe, was ihn ausmacht.
Simple Pipelining
Baue eine minimalistische einfache Pipeline
a) Training Pipeline
b) Inference / Production Pipeline
Nenne mögliche Datenquellen für Training
6