2025 국가직7급 데이터베이스론 8번 해설 — 하둡/맵리듀스
문제
빅데이터 분석 및 처리를 위한 기술인 하둡(Hadoop)에 대한 설명으로 옳은 것은?
- ① 맵리듀스(MapReduce) 기법을 사용하는 파일 시스템은 병렬 처리를 지원하지 않는다.
- ② 맵리듀스 기법에서 reduce() 함수의 입력 키 타입은 map() 함수의 출력 키 타입과 다르다.
- ③ 맵리듀스 기법의 map() 함수는 각 입력 레코드에 대해 출력이 없거나, 한 개 이상의 (키, 값) 쌍들을 출력한다. ← 정답
- ④ 하둡 분산 파일 시스템(HDFS)에서 각 파일의 블록을 식별하기 위한 메타데이터를 저장하는 서버는 데이터노드(DataNode)이다.
선지별 해설
① 맵리듀스(MapReduce) 기법을 사용하는 파일 시스템은 병렬 처리를 지원하지 않는다.
이 선지 진술은 틀림(X)
맵리듀스는 대규모 데이터를 여러 노드에 분산하여 map과 reduce 단계로 병렬 처리하는 것이 핵심 목적이다. 병렬 처리를 지원하지 않는다는 설명은 틀렸다.
② 맵리듀스 기법에서 reduce() 함수의 입력 키 타입은 map() 함수의 출력 키 타입과 다르다.
이 선지 진술은 틀림(X)
맵리듀스에서 map()의 출력 (키, 값) 쌍은 셔플·정렬을 거쳐 reduce()의 입력으로 전달되므로 reduce()의 입력 키 타입은 map()의 출력 키 타입과 동일하다. 다르다는 설명은 틀렸다.
③ 맵리듀스 기법의 map() 함수는 각 입력 레코드에 대해 출력이 없거나, 한 개 이상의 (키, 값) 쌍들을 출력한다.
이 선지 진술은 옳음(O)
map() 함수는 각 입력 레코드를 처리하여 0개, 1개 또는 여러 개의 (키, 값) 쌍을 방출할 수 있다. 이는 맵리듀스 map 단계의 정확한 동작 설명으로 옳다.
④ 하둡 분산 파일 시스템(HDFS)에서 각 파일의 블록을 식별하기 위한 메타데이터를 저장하는 서버는 데이터노드(DataNode)이다.
이 선지 진술은 틀림(X)
HDFS에서 파일과 블록의 메타데이터(네임스페이스, 블록 위치 등)를 관리하는 서버는 네임노드(NameNode)이며, 데이터노드는 실제 블록 데이터를 저장한다. 따라서 데이터노드라는 설명은 틀렸다.
핵심 요약 (Q&A)
- Q. 2025 국가직7급 데이터베이스론 8번의 핵심 쟁점은 무엇인가?
- A. 2025 국가직7급 데이터베이스론 8번은 하둡/맵리듀스에 관한 문항으로, "옳은 것"을 고르는 문제입니다.
- Q. 2025 국가직7급 데이터베이스론 8번의 정답은?
- A. 정답은 ③번입니다. map() 함수는 각 입력 레코드를 처리하여 0개, 1개 또는 여러 개의 (키, 값) 쌍을 방출할 수 있다. 이는 맵리듀스 map 단계의 정확한 동작 설명으로 옳다.