베이지안 네트워크를 요인 그래프로 변환하는 것이 베이지안 추론에 유용한 이유를 이해할 수 없습니까?
제 질문은 다음과 같습니다.
- 베이지안 추론에서 요인 그래프를 사용하면 어떤 이점이 있습니까?
- 사용하지 않으면 어떻게됩니까?
어떤 구체적인 예라도 감사하겠습니다!
답변
답변하겠습니다. 내 질문입니다.
메시지
요소 그래프의 매우 중요한 개념은 메시지 는 메시지가 A에서 B로 전달되는 경우 A가 B에 대해 알려주는 것으로 이해할 수 있습니다.
확률 적 모델 컨텍스트에서 요인 변수 $ x $ 에 대한 $ f $ 는 $ \ mu_ {f \ to x} $로 표시 될 수 있습니다. , $ f $ 로 이해할 수있는 것은 무언가를 알고 (이 경우 확률 분포) 에게 알려줍니다. $ x $ .
Factor는 메시지를 요약합니다.
" 요소 " 컨텍스트, 일부 변수의 확률 분포를 알기 위해서는 n에서 모든 메시지를 준비해야합니다. 주변 요인을 분석 한 다음 모든 메시지를 요약하여 분포를 도출합니다.
예를 들어 다음 그래프에서 $ x_i $ 의 경계는 다음과 같습니다. 변수 및 노드 $ f_i $ 는 에지로 연결된 요인입니다.
$ P (x_4) $ 를 알기 위해서는 $ \ mu_ {f_3 \ to x_4} $ 및 $ \ mu_ {f_4 \ to x_4} $ 및 함께 요약합니다.
메시지의 재귀 구조
그럼이 두 메시지를 어떻게 알 수 있을까요? 예 : $ \ mu_ {f_4 \ to x_4} $ . $ \ mu_ {x_5 \ to f_4} $ 및 $ \ mu_의 두 메시지를 요약 한 후 메시지로 볼 수 있습니다. {x_6 \ to f_4} $ . 그리고 $ \ mu_ {x_6 \ to f_4} $ 는 기본적으로 $ \ mu_ {f_6 \ to x_6} $ 는 다른 메시지에서 계산할 수 있습니다.
이것은 메시지의 재귀 구조이며 메시지는 메시지로 정의 할 수 있습니다 .
재귀는 좋은 것, 더 나은 이해를위한 것, 컴퓨터 프로그램의 더 쉬운 구현을위한 것입니다.
결론
요인의 이점은 다음과 같습니다.
- Factor, 유입 메시지를 요약하고 유출 메시지를 출력하고, 한계 계산에 필수적인 메시지를 활성화합니다.
- 요인을 사용하면 메시지를 계산하는 재귀 구조를 사용하여 메시지 전달 또는 신념 전파 프로세스를보다 쉽게 수행 할 수 있습니다. 이해하고 구현하기 더 쉬울 수 있습니다.
댓글
- 솔직히 말하면 이것이 어떻게 실제에 대한 답변보다 메시지 전달을 통해 요인 그래프에서 추론을 수행합니다. 질문입니다.
답변
베이지안 네트워크는 정의에 따라 임의 변수의 모음입니다. $ \ {X_n : P \ rightarrow \ mathbb {R} \} $ 및 $ G $ 그래프는 $ G $에 의해 결정되는 방식으로 확률 함수 $ P (X_1, …, X_n) $ 요소를 조건부 확률로 고려합니다. http://en.wikipedia.org/wiki/Factor_graph 를 참조하세요.
가장 중요한 것은 베이지안 네트워크의 요소가 $ P (X_i | X_ {j_1}, .., X_ {j_n}) $.
요소 그래프는 더 일반적이지만 정보를 유지하는 그래픽 방식이라는 점에서 동일합니다. $ P (X_1, …, X_n) $ 또는 다른 함수의 분해에 대해.
차이점은 베이지안 네트워크가 요인 그래프로 변환 될 때 요인 그래프의 요인이 그룹화된다는 것입니다. 예를 들어, 요인 그래프의 한 요인은 $ P (X_i | X_ {j_1}, .., X_ {j_n}) P (X_ {j_n}) P (X_ {j_1}) = P (X_i | X_ { j_2}, .., X_ {j_ {n-1}}) $. 원래 베이지안 네트워크는 이것을 세 가지 요인으로 저장했지만 요인 그래프는이를 하나의 요인으로 만 저장합니다. 일반적으로 베이지안 네트워크의 인자 그래프는 원래 베이지안 네트워크보다 더 적은 분해를 추적합니다.
답변
A 요인 그래프는 베이지안 모델의 또 다른 표현입니다. 특정 베이지안 네트워크에서 추론을위한 정확한 알고리즘이 있고 해당 요인 그래프에서 추론을위한 또 다른 정확한 알고리즘이있는 경우 두 결과는 동일합니다. 요인 그래프는 변수 간의 조건부 독립성을 활용하여 효율적인 (정확하고 근사한) 추론 알고리즘을 도출하는 데 유용한 표현입니다. 이를 통해 차원의 저주 를 완화 할 수 있습니다.
비유하기 위해 : 푸리에 변환은 신호의 시간 표현과 정확히 동일한 정보를 포함하지만 일부 작업은 더 쉽습니다. 주파수 영역에서 수행되고 일부는 시간 영역에서 더 쉽게 수행됩니다. 같은 의미에서 요인 그래프는 동일한 정보 (확률 적 모델)의 재구성 일 뿐이며 영리한 알고리즘을 도출하는 데 도움이되지만 실제로는 " add
무엇이든 가능합니다.
더 구체적으로 말하자면 한계 $를 도출하는 데 관심이 있다고 가정합니다. p (x_i) $ (모델에서 일부 수량), 다른 모든 변수에 대해 통합해야 함 :
$$ p (x_i) = \ int p (x_1, x_2, \ ldots, x_i, \ ldots, x_N) dx_1x_2 \ ldots x_ {i-1} x_ {i + 1} \ ldots x_N $$
높음 -차원 모델, 이것은 계산하기 매우 어려운 고차원 공간에 대한 통합입니다. (이 주 변화 / 통합 문제는 고차원에서 추론을 어렵게 / 다루기 어렵게 만드는 것입니다. 한 가지 접근 방식은이 적분을 효율적으로 평가할 수있는 현명한 방법을 찾는 것입니다. 이것이 바로 Markov chain Monte입니다. Carlo (MCMC) 방법이 있습니다. 계산 시간이 길다고 악명 높은 것으로 알려져 있습니다.)
너무 많은 세부 사항을 다루지 않으면 서 요인 그래프는 이러한 많은 변수가 서로 조건부로 독립적 이라는 사실을 인코딩합니다. . 이를 통해 위의 고차원 통합을 훨씬 더 낮은 차원의 일련의 통합 문제 , 즉 다음의 계산으로 대체 할 수 있습니다. 다른 메시지. 이러한 방식으로 문제의 구조 를 이용하면 추론이 가능해집니다. 이것이 요인 그래프 측면에서 추론을 공식화 할 때 얻을 수있는 핵심 이점입니다.