본문 바로가기
Algorithm/백준

[Python] 백준 7662번 - 이중 우선순위 큐

by 애기 개발자 2022. 12. 3.
반응형

https://www.acmicpc.net/problem/7662

 

7662번: 이중 우선순위 큐

입력 데이터는 표준입력을 사용한다. 입력은 T개의 테스트 데이터로 구성된다. 입력의 첫 번째 줄에는 입력 데이터의 수를 나타내는 정수 T가 주어진다. 각 테스트 데이터의 첫째 줄에는 Q에 적

www.acmicpc.net

 

혼자 힘으로 풀었는가? : X

알고리즘 분류
 - 자료 구조
 - 트리를 사용한 집합과 맵
 - 우선순위 큐

 

문제

이중 우선순위 큐(dual priority queue)는 전형적인 우선순위 큐처럼 데이터를 삽입, 삭제할 수 있는 자료 구조이다. 전형적인 큐와의 차이점은 데이터를 삭제할 때 연산(operation) 명령에 따라 우선순위가 가장 높은 데이터 또는 가장 낮은 데이터 중 하나를 삭제하는 점이다. 이중 우선순위 큐를 위해선 두 가지 연산이 사용되는데, 하나는 데이터를 삽입하는 연산이고 다른 하나는 데이터를 삭제하는 연산이다. 데이터를 삭제하는 연산은 또 두 가지로 구분되는데 하나는 우선순위가 가장 높은 것을 삭제하기 위한 것이고 다른 하나는 우선순위가 가장 낮은 것을 삭제하기 위한 것이다. 

정수만 저장하는 이중 우선순위 큐 Q가 있다고 가정하자. Q에 저장된 각 정수의 값 자체를 우선순위라고 간주하자. 

Q에 적용될 일련의 연산이 주어질 때 이를 처리한 후 최종적으로 Q에 저장된 데이터 중 최댓값과 최솟값을 출력하는 프로그램을 작성하라.

입력

입력 데이터는 표준입력을 사용한다. 입력은 T개의 테스트 데이터로 구성된다. 입력의 첫 번째 줄에는 입력 데이터의 수를 나타내는 정수 T가 주어진다. 각 테스트 데이터의 첫째 줄에는 Q에 적용할 연산의 개수를 나타내는 정수 k (k ≤ 1,000,000)가 주어진다. 이어지는 k 줄 각각엔 연산을 나타내는 문자(‘D’ 또는 ‘I’)와 정수 n이 주어진다. ‘I n’은 정수 n을 Q에 삽입하는 연산을 의미한다. 동일한 정수가 삽입될 수 있음을 참고하기 바란다. ‘D 1’는 Q에서 최댓값을 삭제하는 연산을 의미하며, ‘D -1’는 Q 에서 최솟값을 삭제하는 연산을 의미한다. 최댓값(최솟값)을 삭제하는 연산에서 최댓값(최솟값)이 둘 이상인 경우, 하나만 삭제됨을 유념하기 바란다.

만약 Q가 비어있는데 적용할 연산이 ‘D’라면 이 연산은 무시해도 좋다. Q에 저장될 모든 정수는 32-비트 정수이다. 

출력

출력은 표준출력을 사용한다. 각 테스트 데이터에 대해, 모든 연산을 처리한 후 Q에 남아 있는 값 중 최댓값과 최솟값을 출력하라. 두 값은 한 줄에 출력하되 하나의 공백으로 구분하라. 만약 Q가 비어있다면 ‘EMPTY’를 출력하라.

 


오답 코드

(정답 코드는 밑에 있음)

 

처음엔 문제를 딱 보자마자

최소 힙과 최대 힙 두 개를 동시에 사용하면 되겠구나 싶었다.

 

import sys
input = sys.stdin.readline
import heapq

t = int(input())
for _ in range(t):
  n = int(input())
  max_heap = []
  min_heap = []
  for _ in range(n):
    order, val = map(str, input().split())
    val = int(val)
    if order == 'I':
      heapq.heappush(min_heap, val)
      heapq.heappush(max_heap, val*-1)
    else:
      if len(max_heap) == 0 or len(min_heap) == 0:
        continue
      if val == -1:
        a = heapq.heappop(min_heap)
        max_heap.remove(a*-1)
        
      else:
        a = heapq.heappop(max_heap)
        min_heap.remove(a*-1)

  if len(max_heap) == 0 or len(min_heap) == 0:
    print("EMPTY")
  else:
    print(heapq.heappop(max_heap) * -1, heapq.heappop(min_heap))

최소힙과 최대 힙을 같이 운영하며

 

'D'가 입력되어 삭제될 때

 

삭제되는 heap을 가져와서 반대 힙의 값을 heap.remove('value')로 찾아서 삭제하는 방식을 사용했다.

 

정답을 도출하기위한 코드로는 정답이었으나

 

PyPy3로 제출해도 시간 초과가 발생하였다.

 

값을 추가하는건 heapq를 사용하기 때문에 이 시간은 변함없다.

 

값을 삭제하는 과정에서 시간이 소요된 것인데

 

heap.remove('value')를 하는 과정이

 

해당 value를 찾는데 O(n)의 시간이 소요되면서 너무 큰 시간의 소모가 된 것이다.


 

정답 코드

결국 해법을 찾지 못하고 검색을 해봤더니

 

의외로 단순한 방법이 있었으며 나는 생각지도 못한 방법이었다.

 

로직은 단순했다.

 

추가할 때

  1. visited[] 리스트를 생성한다. 이 리스트는 삭제된 값의 플래그 역할을 한다.(초기 상태 False)
  2. 힙에 추가할 때 추가하는 시점의 번호가 key값이 되며 추가한 번호의 visited[index]는 True로 변경 (방문했다는 표시)

삭제할 때

  1. D -1을 입력받으면 최소 힙만 삭제를 하고, 삭제된 값의 키값을 찾아 visited의 index에 접근하여 False로 변경(삭제했다는 표시)
  2. 반대로, D 1을 입력받으면 최대 힙만 삭제를 하고, 해당 key값의 visited의 index에 접근하여 False로 변경

출력하기 전에

  1. 앞서 삭제할 때 -1일 때는 최소 힙만, 1일 때는 최대 힙만을 삭제했다.
  2. 그 과정에서 삭제되어야 하지만 삭제되지 않은 반대 힙의 값이 남아있을 것이다.
  3. 그 값을 일일이 삭제하여 결국 힙의 맨 앞은 각 성격에 맞는 값만이 남아있도록 한다.
import sys
input = sys.stdin.readline
import heapq

def garbage(heap):
    while heap and visited[heap[0][1]] == False:
        heapq.heappop(heap)

t = int(input())
for _ in range(t):
    n = int(input())
    max_heap = []
    min_heap = []
    visited = [False] * (n+1)
    for i in range(n):
        order, val = map(str, input().split())
        val = int(val)
        if order == 'I':
            heapq.heappush(min_heap, (val, i))
            heapq.heappush(max_heap, (val*-1, i))
            visited[i] = True
        else:
            if val == -1:
                while min_heap and visited[min_heap[0][1]] == False:
                    heapq.heappop(min_heap)
                if min_heap:
                    visited[min_heap[0][1]] = False
                    heapq.heappop(min_heap)        
            else:
                while max_heap and visited[max_heap[0][1]] == False:
                    heapq.heappop(max_heap)
                if max_heap:
                    visited[max_heap[0][1]] = False
                    heapq.heappop(max_heap)
                
    garbage(min_heap)
    garbage(max_heap)

    if min_heap and max_heap:
        print(max_heap[0][0] * -1, min_heap[0][0])
    else:
        print("EMPTY")

애초에 문제 자체가 기본 수행 시간이 6초로 지정될 정도로 실행시간이 오래 걸리는 문제였다.

 

PyPy3로 제출하여도 상당히 오래걸리는 수준이었다.

 

Git 백준 7662번 - 이중 우선순위 큐.py

반응형

댓글