의 실험을 이해하려고합니다. 종이 , 특히 섹션 5.2.

논문에서 희소 행렬의 로그 결정자를 계산하기위한 새로운 알고리즘을 제안하고 섹션 5에서 생성하는 데이터 세트에서이를 테스트합니다.

이들은 합성 데이터 세트에서 테스트하기를 원하므로 정밀도 행렬 (공분산 행렬의 역)이 에 의해 매개 변수화 된 5000×5000 크기의 희소 행렬을 만듭니다. $ \ rho = -0.22 $ . 논문에 따르면 각 노드에는 $ \ rho $ 의 편 상관을 가진 4 개의 이웃이 있습니다. 그런 다음 Gibbs 샘플러 를 사용하여 행렬 J로 설명되는 다변량 가우스 분포에서 하나의 샘플을 가져옵니다. 샘플에서 로그 가능성을 다음과 같이 계산합니다. $$ \ log (x | \ rho) = \ log \ det J (\ rho)-x ^ TJ (\ rho) x + G $$ . 그리고 그림 2에서와 같이 값을 플로팅합니다.

내 이해가 맞으면 하나의 샘플 만 주어진 로그 가능성을 평가합니까? 그림 2의 플롯이 위의 다음 공식이며 하나 샘플에 대해서만 계산된다는 것을 이해합니다. 저는 일반적으로 단일 샘플뿐만 아니라 데이터 세트에서 로그 가능성을 계산합니다.

제 질문은 다음과 같습니다. 정확히 무엇을 의미하는지 $ \ rho $ 만들려면 $ J (\ rho) $ 샘플 ? (즉, 파이썬 패키지를 사용합니까? 그렇지 않으면 알고리즘이 무엇입니까?)?

기본 가정은 $ \ log \ det J (\ rho ) $ 두 개의 다른 $ J (\ rho) $ 샘플이 같은 이유는 무엇입니까?

실제로 살펴 보았습니다. 많이 인용 된 참조 된 책 (GMRF에 대한 매우 좋은 책이지만 단일 매개 변수 사이의 명확한 연결을 찾지 못했습니다. $ \ rho $ 및 생성하는 행렬. GMRF의 매개 변수화는 섹션 2.7, 페이지 87에 설명되어 있습니다. 여기서 단일 매개 변수는 사용되지 않으며 매개 변수 공간은 실제로 2 차원 벡터 $ \ Theta $ :

$$ \ pi (x | \ Theta) \ propto exp (\ frac {-\ theta_1} {2} \ sum_ {i \ approx j} (x_i-x_j) ^ 2-\ frac {\ theta_2} {2} \ sum_i x_i ^ 2) $$ 하지만 아마도 그들은 다른 행렬을 참조하고있을 것입니다.

업데이트 사실, 정밀도 행렬은 $ 4 개의 이웃 간의 상호 작용을 설명하는 J (\ rho) $ 대역 행렬 즉, 여러 대각선을 가진 행렬입니다. 이 경우 (상상) 2 개의 위쪽 대각선과 2 개의 아래쪽 대각선이 모두 $-0.22 $ 로 채워지고 $ 1 주 대각선에 $ .

그래도 정밀도 행렬로 설명 된 분포에서 샘플링하려면 어떻게해야합니까? 그것을 반전하고 데이터의 공분산 행렬을 얻은 다음 샘플링해야합니까? 그렇다면 아래 코드가 있습니다. $ \ vec (0) $ 평균이고 행렬 차원이 30이라고 가정하면이 GMRF에서 샘플링하는 데 사용할 수있는 코드를 누군가가 보는 것이 유용 할 수 있습니다.

import numpy as np def precision(k, numero): return np.diag(np.repeat(1, k)) + np.diag(np.repeat(numero, k-1), -1) + np.diag(np.repeat(numero, k-2), -2) + np.diag(np.repeat(numero, k-1), 1) + np.diag(np.repeat(numero, k-2), 2) J = precision(30, -0.22) Sigma = np.linalg.inv(J) np.random.multivariate_normal(np.repeat(0, 30), Sigma) 

답변

만약 GMRF의 정밀도 매트릭스가있는 경우 GMRF에서 샘플링하는 주기적 경계 (토러스 가정이라고도 함)에 대한 추가 가정은 FFT 기반 방법을 사용하면 매우 쉬워집니다. 자세한 내용은 Rue 및 Held의 Gaussian Markov Random Fields (이론 및 응용) 의 알고리즘 2.10에 자세히 설명되어 있습니다. 2.6 절 전체는이 알고리즘의 표현에 전념하고 있습니다.

저는 당신이 언급 한 논문의 저자들이이 기술을 사용했다고 믿습니다. 왜냐하면 그들은 2 천 5 백만 개의 변수 GMRF를 다루고 있기 때문입니다. 스펙트럼 방법과 같은 샘플링 방법). 또한 그림 3에 표시된 GMRF는 주기적 경계를 가지고있는 것 같습니다.

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다