MicroGrad Flashcards

Question 1

Q

Ableitung von f(x) = x + c

Answer

A

Die Steigung (der Gradient) ist immer 1.

Question 2

Q

Ableitung von f(a) = a * b (nach a)

Answer

A

Der Gradient ist b (der Hebel der anderen Zahl).

Question 3

Q

Ableitung von f(a) = a * b (nach b)

Answer

A

Der Gradient ist a.

Question 4

Q

Ableitung von f(x) = x**2 (Quadrat)

Answer

A

Der Gradient ist 2 * x.

Question 5

Q

Ableitung von f(x) = x**n (Potenz)

Answer

A

Der Gradient ist n * x**(n-1).

Question 6

Q

Die Kettenregel (Chain Rule) als Formel

Answer

A

Gesamt-Grad = Lokaler-Grad * Grad-von-vorn.

Question 7

Q

Ableitung von tanh(x) (Aktivierungsfunktion)

Answer

A

Der Gradient ist 1 - (tanh(x))**2.

Question 8

Q

Wie lautet die Formel für den ‘Manual Gradient’?

Answer

A

(f(x + h) - f(x)) / h.

Question 9

Q

Ableitung von e**x (Exponentialfunktion)

Answer

A

Der Gradient ist wieder e**x (sie bleibt gleich).

Question 10

Q

Was ist die Ableitung einer Konstanten (Zahl ohne x)?

Answer

A

Der Gradient ist immer 0.

Question 11

Q

Wie berechnet man das neue Gewicht (Update)?

Answer

A

Neues Gewicht = Altes Gewicht - (Lernrate * grad).

Question 12

Q

Warum ist der Gradient von ‘a’ bei d = a + b gleich 1?

Answer

A

Weil eine Addition die Steigung der Kurve nicht verändert (nur verschiebt).

Question 13

Q

Was ist die ‘data’ in einem Value-Objekt?

Answer

A

Der aktuelle Zahlenwert (der Ist-Zustand).

Question 14

Q

Was beschreibt der ‘grad’ (Gradient)?

Answer

A

Die Empfindlichkeit: Wie stark ändert sich das Endergebnis, wenn ich diesen Wert minimal erhöhe?

Question 15

Q

Was passiert mit dem Loss, wenn der grad negativ ist und ich den Wert erhöhe?

Answer

A

Der Loss wird kleiner (das Modell wird besser).

Question 16

Q

Warum addieren wir ‘h’ (0.0001) beim manuellen Ableiten?

Answer

Study These Flashcards

A

Um die Steigung an einer winzigen Stelle zu messen (lokale Steigung).

Question 17

Q

Formel: d = a * b. Wie gross ist der grad von a?

Answer

Study These Flashcards

A

Der Wert von b.

Question 18

Q

Formel: d = a + b. Wie gross ist der grad von a?

Answer

Study These Flashcards

A

Immer 1 (da Addition nur verschiebt, nicht skaliert).

Question 19

Q

Was macht die Funktion ‘backward()’?

Answer

Study These Flashcards

A

Sie berechnet die Gradienten rückwärts vom Ende (Loss) zum Anfang (Inputs).

Question 20

Q

Was ist die Kettenregel (Chain Rule) intuitiv?

Answer

Study These Flashcards

A

Man multipliziert den lokalen Hebel mit dem Gradienten, der von “vorne” kommt.

Question 21

Q

Warum nutzt Karpathy ‘set()’ für ‘_prev’?

Answer

Study These Flashcards

A

Damit jeder Knoten bei der Ableitung nur einmal besucht wird (keine Duplikate).

Question 22

Q

Was passiert mit dem grad bei einer Multiplikation mit 0?

Answer

Study These Flashcards

A

Der Gradient wird 0 - die Verbindung ist “tot”, keine Information fliesst zurück.

Question 23

Q

Was ist ein ‘Step’ im Training?

Answer

Study These Flashcards

A

Man ändert die Gewichte leicht in die Gegenrichtung des Gradienten (Gewicht -= Lernrate * grad).

Question 24

Q

Warum ist ‘grad’ am Anfang des Loss-Knotens immer 1.0?

Answer

Study These Flashcards

A

Weil sich der Loss zu sich selbst exakt 1:1 verändert (Startpunkt).

MicroGrad Flashcards

(24 cards)