Nem értem, miért jó a Bayesi hálózat tényezőgrafikává alakítása a Bayesi következtetésre?

A kérdéseim a következők:

  1. Mi az előnye a faktorgráf használatának a Bayes-i gondolkodásmódban?
  2. Mi történne, ha nem használnánk?

Minden konkrét példát értékelni fogunk!

Válasz

Megpróbálok válaszolni saját kérdésem.

Üzenet

A faktorgráf nagyon fontos fogalma a üzenet , amely úgy értelmezhető, hogy A mond valamit B-ről, ha az üzenetet A-ról B-re továbbítják.

A valószínűségi modell összefüggésében a tényezőtől származó üzenet $ f $ a $ x $ változóhoz $ \ mu_ {f \ to x} $ , ami úgy értelmezhető, hogy a $ f $ tud valamit (ebben az esetben valószínűségi eloszlás), és megmondja, hogy $ x $ .

A faktor összefoglalja az üzeneteket

A " faktorban " context, valamely változó valószínűségi eloszlásának ismeretéhez minden üzenetnek készen kell állnia az n-jéből fontos tényezőket, majd összesítse az összes üzenetet az eloszlás levezetéséhez.

Például a következő grafikonon a $ x_i $ élek vannak A változók és a csomópontok, a $ f_i $ , élek által összekapcsolt tényezők.

Példa faktor grafikonra

A $ P (x_4) $ ismeretéhez ismernünk kell a $ \ mu_ {f_3 \ to x_4} $ és $ \ mu_ {f_4 \ to x_4} $ és összefoglalja őket együtt.

Az üzenetek rekurzív szerkezete

Akkor hogyan lehet megismerni ezt a két üzenetet? Például: $ \ mu_ {f_4 \ to x_4} $ . Két üzenet, $ \ mu_ {x_5 \ to f_4} $ és $ \ mu_ összefoglalása után üzenetként tekinthetõ. {x_6 \ – f_4} $ . A $ \ mu_ {x_6 \ to f_4} $ pedig lényegében $ \ mu_ {f_6 \ to x_6} $ , amely kiszámolható néhány más üzenetből.

Ez az üzenetek rekurzív felépítése, az üzenetek meghatározhatók üzenetekkel .

A rekurzió egy jó dolog, egy a jobb megértésért, egy a számítógépes program könnyebb megvalósításáért.

Következtetés

A tényezők előnyei:

  1. Faktor, amely összefoglalja a beáramló üzeneteket és kimeneti a kiáramló üzeneteket, lehetővé teszi az üzeneteket, amelyek elengedhetetlenek a marginális számításhoz
  2. A tényezők lehetővé teszik az üzenetek kiszámításának rekurzív felépítését, megkönnyítve az üzenet továbbítását vagy a hitterjesztés folyamatot érthető, és valószínűleg könnyebben megvalósítható.

Megjegyzések

  • Őszintén szólva úgy érzem, hogy ez inkább annak összefoglalása, hogyan tényeződiagramokban következtetés végrehajtása üzenet továbbítással, mint a tényleges válasz kérdés.

Válasz

A Bayes-i hálózat definíció szerint véletlen változók gyűjteménye $ \ {X_n : P \ rightarrow \ mathbb {R} \} $ és egy $ G $ grafikon, hogy a $ P (X_1, …, X_n) $ valószínűségfüggvény feltételes valószínűségként tényező legyen, a $ G $ által meghatározott módon. Lásd: http://en.wikipedia.org/wiki/Factor_graph .

A legfontosabb, hogy a Bayes-i hálózat tényezői $ formájúak legyenek P (X_i | X_ {j_1}, .., X_ {j_n}) $.

A tényezőgrafikon, bár általánosabb, ugyanaz, mivel grafikus módon tárolja az információkat a $ P (X_1, …, X_n) $ vagy bármely más függvény tényezőjéről.

A különbség az, hogy amikor egy Bayesi hálózatot faktorgráffá konvertálunk, a faktorgráf tényezőit csoportosítjuk. Például a faktorgráf egyik tényezője lehet $ P (X_i | X_ {j_1}, .., X_ {j_n}) P (X_ {j_n}) P (X_ {j_1}) = P (X_i | X_ { j_2}, .., X_ {j_ {n-1}}) $. Az eredeti Bayesi hálózat ezt három tényezőként tárolta, de a faktor grafikon csak egy tényezőként tárolja. Általánosságban elmondható, hogy a Bayesi hálózat tényeződiagramja kevesebb tényezőt követ, mint az eredeti Bayesi hálózat.

Válasz

A faktor grafikon csak egy újabb ábrázolása egy Bayes-modellnek. Ha lenne egy pontos algoritmusa a következtetésre egy adott Bayes-hálózatban, és egy másik pontos algoritmusa lenne a következtetésre a megfelelő faktorgráfban, akkor a két eredmény ugyanaz lenne.A A tényezőgrafikonok vélhetően hasznos ábrázolásként szolgálnak hatékony (pontos és hozzávetőleges) következtetési algoritmusok levezetéséhez a változók közötti feltételes függetlenség kihasználásával a modell, ezáltal enyhítve a dimenzionalitás átkát .

Hasonlatot adva: a Fourier-transzformáció pontosan ugyanazt az információt tartalmazza, mint a jel időbeli ábrázolása, ugyanakkor egyes feladatok könnyebbek a frekvenciatartományban, néhány pedig könnyebben megvalósítható az időtartományban. Ugyanebben az értelemben a faktorgráf csak ugyanazon információ (a valószínűségi modell) újraszerkesztése, amely hasznos az okos algoritmusok levezetéséhez, de nem igazán “add hozzá " bármi.

Pontosabban tegyük fel, hogy érdekli a marginal $ levezetése p (x_i) $ valamilyen mennyiség a modellben, amely integrációt igényel az összes többi változó felett:

$$ p (x_i) = \ int p (x_1, x_2, \ ldots, x_i, \ ldots, x_N) dx_1x_2 \ ldots x_ {i-1} x_ {i + 1} \ ldots x_N $$

Magas -dimenziós modell, ez egy integráció egy nagy dimenziós térben, amelyet nagyon nehéz kiszámítani. (Ez a marginalizációs / integrációs probléma az, ami megnehezíti / megoldhatatlanná teszi a következtetést a nagy dimenziókban. Az egyik megközelítés az, hogy találunk okos módszereket ennek az integrálnak a hatékony értékelésére, ez az, amit Markov lánc Monte Carlo (MCMC) módszerek igen. Ezekről ismert, hogy köztudottan hosszú számítási időnek vannak kitéve.)

Anélkül, hogy túl sok részletre lenne szükség, egy faktor-grafikon kódolja azt a tényt, hogy e változók közül sok feltételesen független egymástól . Ez lehetővé teszi a fenti, nagy dimenziójú integráció helyettesítését egy sokkal alacsonyabb dimenziójú integrációs problémák sorozatával, nevezetesen a a különböző üzeneteket. A probléma szerkezetének ilyen kihasználásával a következtetés megvalósíthatóvá válik. Ez a következtetés megfogalmazásának legfőbb előnye a faktorgráfok tekintetében.

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük