자료구조

[자료구조] 힙 정렬(Heap Sort) 문제 풀이

미 성 2024. 6. 4. 03:28

 

 

문제 풀이에 앞서,  힙(heap)이란 무엇인지, 그리고 힙의 종류는 어떤 것들이 있는지부터 먼저 짚어보도록 하자.

 

 


 

힙이란, 완전 이진 트리의 일종으로, 부모 노드의 키 값이 자식 노드의 키 값보다 항상 크거나 작은 이진 트리를 말한다. 

여러 개의 값들중 최댓값이나 최솟값을 빠르게 찾아내도록 만들어진 자료구조이다.

 

 

힙의 종류

 

최대 힙(max heap)

: 부모 노드의 키 값이 자식 노드의 키 값보다 항상 크거나 같은 완전 이진 트리

 

최소 힙(min heap)

: 부모 노드의 키 값이 자식 노드의 키 값보다 작거나 같은 완전 이진 트리

 

 

 

 

   

 

 

우리의 문제에서는 현재 내림차순으로 정수 집합을 정렬할 것을 요구하고 있으므로, 위 두 힙 종류 중 최대 힙(max heap)을 이용해 볼 것이다.

 


 

 

문제 풀이를 크게 두 step으로 나눈다면

 

1. max heap 생성하기

2. 힙 정렬하기 (heap sort)

 

가 되겠다. max heap을 생성한다는 말과 heap을 내림차순의 형태로 정렬한다는 말을 혼동하지 않도록 하자. max heap이란 각 서브 트리가 max heap의 특성을 만족하는 heap일 뿐이고, 우리는 이를 정렬해 주어야 한다.

 

    10
   /  \
  5    3
 / \
2   4

 

 * 위 그림은 max heap이나 내림차순 정렬은 이루어지지 않은 상태이다.

 

 

 

두 단계가 나타나 있는 함수 2개를 바로 보도록 하자.

 

void heapify(int arr[], int n, int i) {
    int largest = i;
    int left = 2 * i + 1;
    int right = 2 * i + 2;


    if (left < n && arr[left] > arr[largest])
        largest = left;

    if (right < n && arr[right] > arr[largest])
        largest = right;


    if (largest != i) {
        int temp = arr[i];
        arr[i] = arr[largest];
        arr[largest] = temp;
        heapify(arr, n, largest);
    }
}


void heapSort(int arr[], int n) {
    for (int i = n / 2 - 1; i >= 0; i--)
        heapify(arr, n, i);

    for (int i = n - 1; i > 0; i--) {
        int temp = arr[0];
        arr[0] = arr[i];
        arr[i] = temp;
        heapify(arr, i, 0);
    }
}

 

 


 

 

heapSort 함수의 첫 번째 for문에서 max heap을 생성하고, 두 번째 for문에서 이를 정렬한다고 볼 수 있다. 첫 번째 for문에서는 내부 노드를 돌면서 하나하나의 서브트리를 max heap 화 하는 부분이 나타나 있다. 두 번째 for문에서는 , 현재의 가장 큰 최댓값( 루트 노드) 인 수를 temp에 담고, 이를 현재 heap의 가장 마지막 노드와 바꾼 후 이 노드를 제외한 애들끼리만 다시 max heap화를 시켜주는 모습이다 (heap의 크기를 매번 1씩 줄여가며). 이 과정을 반복하게 되면 최종적으로 내림차순 정렬이 이루어지게 된다.

 

 

for (int i = n - 1; i >= 0; i--)
    {
        printf("%d ", arr[i]);
    }

 

 

이렇게 출력해줄 테니 말이다.