Nem értem, miért jó a Bayesi hálózat tényezőgrafikává alakítása a Bayesi következtetésre?
A kérdéseim a következők:
- Mi az előnye a faktorgráf használatának a Bayes-i gondolkodásmódban?
- Mi történne, ha nem használnánk?
Minden konkrét példát értékelni fogunk!
Válasz
Megpróbálok válaszolni saját kérdésem.
Üzenet
A faktorgráf nagyon fontos fogalma a üzenet , amely úgy értelmezhető, hogy A mond valamit B-ről, ha az üzenetet A-ról B-re továbbítják.
A valószínűségi modell összefüggésében a tényezőtől származó üzenet $ f $ a $ x $ változóhoz $ \ mu_ {f \ to x} $ , ami úgy értelmezhető, hogy a $ f $ tud valamit (ebben az esetben valószínűségi eloszlás), és megmondja, hogy $ x $ .
A faktor összefoglalja az üzeneteket
A " faktorban " context, valamely változó valószínűségi eloszlásának ismeretéhez minden üzenetnek készen kell állnia az n-jéből fontos tényezőket, majd összesítse az összes üzenetet az eloszlás levezetéséhez.
Például a következő grafikonon a $ x_i $ élek vannak A változók és a csomópontok, a $ f_i $ , élek által összekapcsolt tényezők.
A $ P (x_4) $ ismeretéhez ismernünk kell a $ \ mu_ {f_3 \ to x_4} $ és $ \ mu_ {f_4 \ to x_4} $ és összefoglalja őket együtt.
Az üzenetek rekurzív szerkezete
Akkor hogyan lehet megismerni ezt a két üzenetet? Például: $ \ mu_ {f_4 \ to x_4} $ . Két üzenet, $ \ mu_ {x_5 \ to f_4} $ és $ \ mu_ összefoglalása után üzenetként tekinthetõ. {x_6 \ – f_4} $ . A $ \ mu_ {x_6 \ to f_4} $ pedig lényegében $ \ mu_ {f_6 \ to x_6} $ , amely kiszámolható néhány más üzenetből.
Ez az üzenetek rekurzív felépítése, az üzenetek meghatározhatók üzenetekkel .
A rekurzió egy jó dolog, egy a jobb megértésért, egy a számítógépes program könnyebb megvalósításáért.
Következtetés
A tényezők előnyei:
- Faktor, amely összefoglalja a beáramló üzeneteket és kimeneti a kiáramló üzeneteket, lehetővé teszi az üzeneteket, amelyek elengedhetetlenek a marginális számításhoz
- A tényezők lehetővé teszik az üzenetek kiszámításának rekurzív felépítését, megkönnyítve az üzenet továbbítását vagy a hitterjesztés folyamatot érthető, és valószínűleg könnyebben megvalósítható.
Megjegyzések
- Őszintén szólva úgy érzem, hogy ez inkább annak összefoglalása, hogyan tényeződiagramokban következtetés végrehajtása üzenet továbbítással, mint a tényleges válasz kérdés.
Válasz
A Bayes-i hálózat definíció szerint véletlen változók gyűjteménye $ \ {X_n : P \ rightarrow \ mathbb {R} \} $ és egy $ G $ grafikon, hogy a $ P (X_1, …, X_n) $ valószínűségfüggvény feltételes valószínűségként tényező legyen, a $ G $ által meghatározott módon. Lásd: http://en.wikipedia.org/wiki/Factor_graph .
A legfontosabb, hogy a Bayes-i hálózat tényezői $ formájúak legyenek P (X_i | X_ {j_1}, .., X_ {j_n}) $.
A tényezőgrafikon, bár általánosabb, ugyanaz, mivel grafikus módon tárolja az információkat a $ P (X_1, …, X_n) $ vagy bármely más függvény tényezőjéről.
A különbség az, hogy amikor egy Bayesi hálózatot faktorgráffá konvertálunk, a faktorgráf tényezőit csoportosítjuk. Például a faktorgráf egyik tényezője lehet $ P (X_i | X_ {j_1}, .., X_ {j_n}) P (X_ {j_n}) P (X_ {j_1}) = P (X_i | X_ { j_2}, .., X_ {j_ {n-1}}) $. Az eredeti Bayesi hálózat ezt három tényezőként tárolta, de a faktor grafikon csak egy tényezőként tárolja. Általánosságban elmondható, hogy a Bayesi hálózat tényeződiagramja kevesebb tényezőt követ, mint az eredeti Bayesi hálózat.
Válasz
A faktor grafikon csak egy újabb ábrázolása egy Bayes-modellnek. Ha lenne egy pontos algoritmusa a következtetésre egy adott Bayes-hálózatban, és egy másik pontos algoritmusa lenne a következtetésre a megfelelő faktorgráfban, akkor a két eredmény ugyanaz lenne.A A tényezőgrafikonok vélhetően hasznos ábrázolásként szolgálnak hatékony (pontos és hozzávetőleges) következtetési algoritmusok levezetéséhez a változók közötti feltételes függetlenség kihasználásával a modell, ezáltal enyhítve a dimenzionalitás átkát .
Hasonlatot adva: a Fourier-transzformáció pontosan ugyanazt az információt tartalmazza, mint a jel időbeli ábrázolása, ugyanakkor egyes feladatok könnyebbek a frekvenciatartományban, néhány pedig könnyebben megvalósítható az időtartományban. Ugyanebben az értelemben a faktorgráf csak ugyanazon információ (a valószínűségi modell) újraszerkesztése, amely hasznos az okos algoritmusok levezetéséhez, de nem igazán “add hozzá " bármi.
Pontosabban tegyük fel, hogy érdekli a marginal $ levezetése p (x_i) $ valamilyen mennyiség a modellben, amely integrációt igényel az összes többi változó felett:
$$ p (x_i) = \ int p (x_1, x_2, \ ldots, x_i, \ ldots, x_N) dx_1x_2 \ ldots x_ {i-1} x_ {i + 1} \ ldots x_N $$
Magas -dimenziós modell, ez egy integráció egy nagy dimenziós térben, amelyet nagyon nehéz kiszámítani. (Ez a marginalizációs / integrációs probléma az, ami megnehezíti / megoldhatatlanná teszi a következtetést a nagy dimenziókban. Az egyik megközelítés az, hogy találunk okos módszereket ennek az integrálnak a hatékony értékelésére, ez az, amit Markov lánc Monte Carlo (MCMC) módszerek igen. Ezekről ismert, hogy köztudottan hosszú számítási időnek vannak kitéve.)
Anélkül, hogy túl sok részletre lenne szükség, egy faktor-grafikon kódolja azt a tényt, hogy e változók közül sok feltételesen független egymástól . Ez lehetővé teszi a fenti, nagy dimenziójú integráció helyettesítését egy sokkal alacsonyabb dimenziójú integrációs problémák sorozatával, nevezetesen a a különböző üzeneteket. A probléma szerkezetének ilyen kihasználásával a következtetés megvalósíthatóvá válik. Ez a következtetés megfogalmazásának legfőbb előnye a faktorgráfok tekintetében.