문제
https://programmers.co.kr/learn/courses/30/lessons/42579
스트리밍 사이트에서 장르 별로 가장 많이 재생된 노래를 두 개씩 모아 베스트 앨범을 출시하려 합니다. 노래는 고유 번호로 구분하며, 노래를 수록하는 기준은 다음과 같습니다.
- 속한 노래가 많이 재생된 장르를 먼저 수록합니다.
- 장르 내에서 많이 재생된 노래를 먼저 수록합니다.
- 장르 내에서 재생 횟수가 같은 노래 중에서는 고유 번호가 낮은 노래를 먼저 수록합니다.
노래의 장르를 나타내는 문자열 배열 genres와 노래별 재생 횟수를 나타내는 정수 배열 plays가 주어질 때, 베스트 앨범에 들어갈 노래의 고유 번호를 순서대로 return 하도록 solution 함수를 완성하세요.
- genres[i]는 고유번호가 i인 노래의 장르입니다.
- plays[i]는 고유번호가 i인 노래가 재생된 횟수입니다.
- genres와 plays의 길이는 같으며, 이는 1 이상 10,000 이하입니다.
- 장르 종류는 100개 미만입니다.
- 장르에 속한 곡이 하나라면, 하나의 곡만 선택합니다.
- 모든 장르는 재생된 횟수가 다릅니다.
입출력
genres plays return
[classic, pop, classic, classic, pop] | [500, 600, 150, 800, 2500] | [4, 1, 3, 0] |
알고리즘
def solution(genres, plays):
answer = []
dict_genres = dict()
dict_table = dict()
# dict_genres는 각 장르에 속한 노래들의 정보를 담은 딕셔너리이다
# { classic: [[노래번호, 재생횟수], ... , [노래번호, 재생횟수]],
# pop: [[노래번호, 재생횟수], ... , [노래번호, 재생횟수]] }
for i in range(len(genres)):
dict_genres[genres[i]] = []
for i in range(len(genres)):
dict_genres[genres[i]].append([i, plays[i]])
for i in list(dict_genres.keys()):
dict_genres[i].sort(key=lambda x:x[1], reverse=True)
print("장르별 노래정보(dict_genres): ", dict_genres)
# dict_table은 장르별 재생횟수 총합을 구하기 위한 딕셔너리이다.
# 장르: {재생횟수, 장르: 재생횟수, ... , 장르: 재생횟수}
for i in range(len(genres)):
dict_table[genres[i]] = 0
for i in range(len(genres)):
dict_table[genres[i]] += plays[i]
dict_table = list(dict_table.items())
dict_table = sorted(dict_table, key=lambda x:x[1], reverse=True)
print("정렬된 dict_table: ", dict_table)
for i in range(len(dict_table)):
key = dict_table[i][0]
if len(dict_genres[key]) == 1:
answer.append(dict_genres[key][0][0])
else:
answer.append(dict_genres[key][0][0])
answer.append(dict_genres[key][1][0])
return answer
genres = ["classic", "pop", "classic", "classic", "pop"]
plays = [500, 600, 150, 800, 2500]
print(solution(genres, plays))
설명
배열 형태로 주어진 데이터를 원하는대로 처리하기 위해서 딕셔너리 2개를 사용했다.
자료형 | 용도 | 생김새 | |
dict_genres | 딕셔너리 |
각 장르에 속하는 노래들의 고유번호, 재생횟수를 정렬 후 저장 |
{장르이름: [[노래번호, 재생횟수], ..., [노래번호, 재생횟수]]}
|
dict_table | 딕셔너리 | 장르별 재생 횟수 파악 | {장르 이름: 해당 장르의 총 재생횟수} |
dict_genres는 해당 장르에 속한 노래들의 정보를 담고 있다. 이 딕셔너리의 key는 장르 이름이고, values는 노래의 고유번호와 재생횟수들을 2차원 배열의 형태로 가진 리스트이다.
dict_table은 해당 장르의 재생 횟수를 파악하기 위한 딕셔너리이다. 이 딕셔너리를 list로 바꾼 후 정렬해서 사용하면 우리는 어떤 장르의 노래먼저 answer에 append할 지 알 수 있다.
그 다음, 정렬된 dict_table을 순회하면서, 각 장르마다 가장 많이 재생된 노래 2개의 고유번호를 answer배열에 append한다. 한 장르의 노래가 1개일 수도 있으므로, dict_genres[key]의 길이가 1보다 작다면 0번째 원소의 고유번호만을 answer에 append하고, 그렇지 않을 경우 0번째 원소와 1번째 원소의 고유번호를 answer에 append한다.
결과
올바른 결과를 출력한다.
후기
완전 어려웠다. 자료구조를 어떻게 바꿔야 할 지도 처음에 감이 잘 안왔고, 그냥 딕셔너리 쓰지말고 배열로 할까 아주그냥 고민고민을 겁나 하다가 해시문제니까 해시연습을 해야겠다는 생각으로 해시로 풀었다. 사실 딕셔너리에 익숙한 사람이라면, 굳이 딕셔너리를 2개 쓸 것 없이 1개만 써도 될 것 같다. 근데 나는 끙끙앓아가면서 1개만 쓰느니 2개 쓰면서 좀 쉽게 풀자 해서 2개를 썼다. 확실히 딕셔너리 쓰니까 실행 시간은 훨씬 줄어드는것 같다. 다른사람의 풀이를 봤는데, 젤 인기있는 풀이보다 내 풀이가 실행시간이 아주 조금 더 짧았다.
근데 써놓고보니까 뭐 엄청 쉬운 문제처럼 보이는데, 자료구조를 만드는게 넘 어려웠다. 해시가 아직 익숙하지 않은거같다. 그리고 key랑 value랑 배열 인덱스랑 막 섞여가지고 코드가 아주 난리가 났다. 근데 좀 길긴 길어도 내코드 보는게 더 잘 이해될거다. 다른사람들 풀이는 뭐 엄청 줄이고 줄이고 해서 간결해가지고 봐도 이해가 안된다.
'공부 > 알고리즘' 카테고리의 다른 글
[프로그래머스 힙]라면 공장 - Python3 (0) | 2020.01.29 |
---|---|
[프로그래머스 힙]더 맵게 - Python3 (2) | 2020.01.29 |
[프로그래머스 스택/큐]쇠 막대기 - Python3 (0) | 2020.01.28 |
[프로그래머스 스택/큐]프린터 - Python3 (8) | 2020.01.16 |
[프로그래머스 스택/큐]기능 개발 - Python3 (0) | 2020.01.13 |