Was ist ein MINE Network?
Back:
Ein neuronales Netzwerk, das verwendet wird, um die Mutual Information zwischen zwei Zufallsvariablen zu schätzen.
Mutual Information Neural Estimation (MINE).
Was misst Mutual Information?
Mutual Information misst, wie stark zwei Variablen voneinander abhängig sind.
I(X;Y)
Bedeutung:
Wie viel Information über Y bekomme ich, wenn ich X kenne.
Wenn sie unabhängig sind:
I(X;Y)=0
Warum braucht man MINE?
Klassische Mutual-Information-Schätzer funktionieren schlecht bei:
hoher Dimensionalität
komplexen Verteilungen
MINE verwendet ein neuronales Netzwerk, um diese Information effizient zu schätzen.
Welche mathematische Idee nutzt MINE?
MINE basiert auf der Donsker–Varadhan Representation der KL-Divergenz:
I(X;Y)=DKL(PXY∣∣PXPY)
Das Netzwerk lernt eine Funktion, die diese Divergenz approximiert.
Wie funktioniert das Training eines MINE Networks?
Samples aus der Joint Distribution PXY nehmen
Samples aus der produktiven Verteilung PXPY erzeugen (durch Shuffling)
Ein neuronales Netzwerk maximiert eine MI-Schätzung
Dadurch lernt das Netzwerk, wie stark X und Y zusammenhängen.