2026 국가직9급 컴퓨터일반 3번 해설 — 머신러닝 유형
정답 ②번출제 쟁점 머신러닝 유형발문 옳은 것 고르기
문제
특정 환경에서 선택 가능한 행동들 중 보상(reward)을 최대화하는 행동을 선택하는 머신러닝(machine learning) 기법은?
- ① 지도 학습(supervised learning)
- ② 강화 학습(reinforcement learning) ← 정답
- ③ 비지도 학습(unsupervised learning)
- ④ 준지도 학습(semi-supervised learning)
선지별 해설
① 지도 학습(supervised learning)
이 선지 진술은 틀림(X)
지도 학습은 정답 레이블이 있는 데이터로 입력과 출력의 관계를 학습한다. 보상 기반 행동 선택은 강화 학습의 특징이다.
② 강화 학습(reinforcement learning)
이 선지 진술은 옳음(O)
강화 학습은 상태에서 행동을 선택하고 보상을 받아 정책을 개선하는 머신러닝 기법이다.
③ 비지도 학습(unsupervised learning)
이 선지 진술은 틀림(X)
비지도 학습은 레이블 없이 데이터의 구조나 패턴을 찾는다. 보상 신호를 쓰는 것은 강화 학습이다.
④ 준지도 학습(semi-supervised learning)
이 선지 진술은 틀림(X)
준지도 학습은 일부 레이블 데이터와 다수의 무레이블 데이터를 함께 사용한다. 행동과 보상 중심의 학습은 강화 학습이다.
핵심 요약 (Q&A)
- Q. 2026 국가직9급 컴퓨터일반 3번의 핵심 쟁점은 무엇인가?
- A. 2026 국가직9급 컴퓨터일반 3번은 머신러닝 유형에 관한 문항으로, "옳은 것"을 고르는 문제입니다.
- Q. 2026 국가직9급 컴퓨터일반 3번의 정답은?
- A. 정답은 ②번입니다. 강화 학습은 상태에서 행동을 선택하고 보상을 받아 정책을 개선하는 머신러닝 기법이다.