바이너리 검색 트리와 바이너리 힙의 차이점은 ' 무엇입니까?

Question

이 두 가지는 매우 비슷해 보이며 거의 동일한 구조를 가지고 있습니다. 차이점은 무엇입니까? 각 작업에 대한 시간 복잡성은 무엇입니까?

Answer 1

Heap은 상위 레벨의 요소가 하위 레벨의 요소보다 크거나 (최대 힙의 경우) 작게 (최소 힙의 경우) 보장하는 반면 BST는 순서 ( “왼쪽”에서 “오른쪽”으로)를 보장합니다. . 정렬 된 요소를 원하는 경우 BST를 사용하세요. by Dante는 괴짜가 아닙니다

힙은 findMin / findMax (O ( 1)), BST는 모든 발견에 적합하지만 (O (logN)). 두 구조 모두에 대해 Insert는 O (logN)입니다. findMin / findMax 만 신경 쓰는 경우 (예 : 우선 순위 관련) 힙을 사용하십시오. 모든 정렬은 BST로 진행됩니다.

by xysun

BST가 findMin & findMax stackoverflow에서 더 낫다고 생각합니다. .com / a / 27074221 / 764592
이것은 단지 통신 인 것 같습니다 오해에. 이진 트리는 Yeo가 가리키는 최소값과 최대 값을 찾기 위해 쉽게 수정할 수 있습니다. 이것은 실제로 힙의 제한 입니다. 유일한 효율적인 찾기는 최소 또는 최대입니다. 힙의 진정한 장점은 제가 설명했듯이 O (1) 평균 삽입 입니다. stackoverflow.com/a/29548834/895245
이 동영상 에 따르면 큰 값이 낮은 값의 하위 항목이 아닌 한 낮은 수준에서 더 큰 값을 가질 수 있습니다.
힙은 루트에서 리프로 정렬되고 BST는 왼쪽에서 오른쪽으로 정렬됩니다.
일정한 시간에 중앙값을 찾고 로그 시간의 중앙값을 제거하려면 어떻게해야합니까? 어떤 데이터 구조로 가야합니까? MinHeap 구현이 작동합니까? 제안 해주세요.

Answer 2

요약

 Type BST (*) Heap Insert average log(n) 1 Insert worst log(n) log(n) or n (***) Find any worst log(n) n Find max worst 1 (**) 1 Create worst n log(n) n Delete worst log(n) log(n)

이 테이블의 모든 평균 시간은 삽입을 제외하고 최악의 시간과 동일합니다.

* :이 답변의 모든 곳에서 BST == Balanced BST, unbalanced는 점근 적으로 짜증이 나기 때문입니다.
** :이 답변에 설명 된 사소한 수정 사용
*** : 포인터 트리 힙의 경우 log(n), n 동적 배열 힙용

BST보다 바이너리 힙의 장점

바이너리 힙에 대한 평균 삽입 시간은 O(1)이며, BST는 . 이 는 힙의 킬러 기능입니다.

O(1)는 피보나치 힙 과 같이 상각 (강력)하고 Brodal 대기열 (점근 적이 지 않은 성능으로 인해 실용적이지 않을 수 있음) : https://stackoverflow.com/questions/30782636/are-fibonacci-heaps-or-brodal-queues-used-in-practice-anywhere
이진 힙은 동적 배열 또는 포인터 기반 트리, BST에서만 효율적으로 구현할 수 있습니다. 포인터 기반 트리. 따라서 힙의 경우 가끔 크기 조정 대기 시간을 감당할 수있는 경우 공간 효율적인 배열 구현을 선택할 수 있습니다.
바이너리 힙 생성 은 O(n) 최악의 경우 이며, BST의 경우 O(n log(n))입니다.

바이너리 힙보다 BST의 장점

임의 요소 검색은 O(log(n)). 이 는 BST의 킬러 기능입니다.

힙의 경우 일반적으로, O(1) 인 가장 큰 요소는 예외입니다.

BST에 비해 힙의 “거짓”이점

힙은 최대 값을 찾기위한 O(1), BST O(log(n))입니다.

가장 큰 요소를 추적하기 위해 BST를 수정하고 해당 요소가 변경 될 수있을 때마다 업데이트하는 것이 사소하기 때문에 일반적인 오해입니다. 더 큰 스왑을 삽입 할 때 제거시 두 번째로 큰 요소를 찾습니다. https://stackoverflow.com/questions/7878622/can-we-use-binary-search-tree-to-simulate-heap-operation ( Yeo가 언급 ).

사실 이것은 BST에 비해 힙의 제한 입니다. 유일한 효율적인 검색은 가장 큰 요소에 대한 검색입니다.

평균 바이너리 힙 삽입은 O(1)

출처 :

종이 : http://i.stanford.edu/pub/cstr/reports/cs/tr/74/460/CS-TR-74-460.pdf
WSU 슬라이드 : http://www.eecs.wsu.edu/~holder/courses/CptS223/spr09/slides/heaps.pdf

직관적 인 인수 :

하단 트리 수준은 최상위 수준보다 기하 급수적으로 더 많은 요소를 포함하므로 새 요소는 거의 하단에 위치합니다.
힙 삽입 하단에서 시작 , BST는 상단부터 시작해야 함

바이너리 힙에서 주어진 인덱스에서 값을 늘리는 것도 같은 이유로 O(1). 그러나 그렇게하려면 힙 작업에 대한 추가 인덱스를 최신 상태로 유지하는 것이 좋습니다. https://stackoverflow.com/questions/17009056/how-to-implement-ologn-decrease-key-operation-for-min-heap-based-priority-queu 예 Dijkstra를 위해. 추가 시간 비용없이 가능합니다.

실제 하드웨어에 대한 GCC C ++ 표준 라이브러리 삽입 벤치 마크

C ++ std::set ( 빨강-검정 나무 BST ) 및 ( 동적 배열 힙 ) 삽입하여 삽입 시간이 옳았는지 확인하면 다음과 같은 결과를 얻었습니다.

벤치 마크 코드
플롯 스크립트
플롯 데이터
CPU가 장착 된 Lenovo ThinkPad P51 노트북의 Ubuntu 19.04, GCC 8.3.0에서 테스트 : Intel Core i7-7820HQ CPU (4 코어 / 8 스레드 , 2.90GHz 기본, 8MB 캐시), RAM : 2x Samsung M471A2K43BB1-CRC (2x 16GiB, 2400Mbps), SSD : Samsung MZVLB512HAJQ-000L7 (512GB, 3,000MB / s)

명확하게 :

heap insert t ime는 기본적으로 일정합니다.

동적 배열 크기 조정 지점을 명확하게 볼 수 있습니다. 위의 시스템 노이즈를 모두 볼 수 있도록 매 10k 삽입마다 평균을 내고 있기 때문에 이러한 피크는 실제로 표시된 것보다 약 10k 배 더 큽니다!

확대 된 그래프는 기본적으로 배열 크기 조정 지점 만 제외하고 거의 모든 삽입이 25 나노초 미만임을 보여줍니다.
BST는 로그입니다. 모든 삽입은 평균 힙 삽입보다 훨씬 느립니다.
BST 대 해시 맵 상세 분석 : https://stackoverflow.com/questions/18414579/what-data-structure-is-inside-stdmap-in-c/51945119#51945119

gem5의 GCC C ++ 표준 라이브러리 삽입 벤치 마크

gem5 는 전체 시스템 시뮬레이터이므로 m5 dumpstats. 그래서 개별 삽입물의 타이밍을 추정하는 데 사용하려고했습니다.

해석 :

힙은 여전히 일정하지만 이제 몇 줄이 있고 각 높은 줄이 더 희박하다는 것을 더 자세히 알 수 있습니다. .

이것은 더 높고 더 높은 삽입에 대해 수행되는 메모리 액세스 대기 시간과 일치해야합니다.
TODO BST를 완전히 해석 할 수는 없습니다. 그렇게 대수적이고 다소 일정 해 보이지는 않습니다.

더욱 자세히 살펴보면 몇 가지 뚜렷한 선을 볼 수 있지만 그 선이 무엇을 나타내는 지 확실하지 않습니다. 상단 하단을 삽입하기 때문에 더 얇아 지나요?

aarch64 iv에서이 Buildroot 설정 으로 벤치마킹 id = “635e322f0e”>

Answer 3

바이너리 검색 트리 및 바이너리 힙 은 트리 기반 데이터 구조입니다.

힙은 노드가 자식보다 우선 순위를 갖도록 요구합니다. 최대 힙에서 각 노드의 하위는 자체보다 작아야합니다. 이는 최소 힙의 반대입니다.

바이너리 최대 힙

바이너리 검색 트리 (BST)는 형제 노드간에 특정 순서 (선주문, 순서, 후 주문)를 따릅니다. 트리는 반드시 정렬 :

바이너리 검색 트리

BST는 평균 $ O (\ log n) $ 삽입, 삭제 및 검색.
바이너리 힙은 평균 $ O (1) $ findMin / findMax 및 $ O (\ log n) $ 삽입 및 삭제

이 q의 추상 데이터 구조 (저장된 개체, 해당 작업) 사용이 다릅니다. 하나는 우선 순위 큐를 구현하고 다른 하나는 세트를 구현합니다. 우선 순위 큐는 임의의 요소를 찾는 데 관심이 없으며 우선 순위가 가장 큰 요소 만 찾습니다.
구조의 구체적인 구현 . 첫눈에 둘 다 (이진) 나무이지만 구조적 특성이 다릅니다. 키의 상대적인 순서와 가능한 전역 구조가 모두 다릅니다. (다소 부정확합니다. BST 키는 왼쪽에서 오른쪽으로 정렬되고 힙에서는 하향식으로 정렬됩니다.) IPlant가 올바르게 설명하므로 힙도 “완전”해야합니다. .
낮은 수준 구현 에는 마지막 차이가 있습니다. (불균형) 이진 검색 트리에는 포인터를 사용하는 표준 구현이 있습니다. 반대로 바이너리 힙은 배열을 사용하여 효율적으로 구현합니다 (정확히 제한된 구조로 인해).

Answer 5

이전 답변 위에 힙에는 힙 구조 속성이 있어야합니다. ; 트리는 가득 차 있어야하며 항상 가득 차있을 수없는 맨 아래 레이어는 간격없이 맨 왼쪽에서 맨 오른쪽까지 채워야합니다.

바이너리 검색 트리와 바이너리 힙의 차이점은 ' 무엇입니까?

답변

댓글

답변

댓글

답변

댓글

Answer

Answer

답글 남기기 답글 취소하기