2026 국가직9급 컴퓨터일반 3번 해설 — 머신러닝 유형

정답 ②번출제 쟁점 머신러닝 유형발문 옳은 것 고르기

문제

특정 환경에서 선택 가능한 행동들 중 보상(reward)을 최대화하는 행동을 선택하는 머신러닝(machine learning) 기법은?

① 지도 학습(supervised learning)

이 선지 진술은 틀림(X)

지도 학습은 정답 레이블이 있는 데이터로 입력과 출력의 관계를 학습한다. 보상 기반 행동 선택은 강화 학습의 특징이다.

② 강화 학습(reinforcement learning)

이 선지 진술은 옳음(O)

강화 학습은 상태에서 행동을 선택하고 보상을 받아 정책을 개선하는 머신러닝 기법이다.

③ 비지도 학습(unsupervised learning)

이 선지 진술은 틀림(X)

비지도 학습은 레이블 없이 데이터의 구조나 패턴을 찾는다. 보상 신호를 쓰는 것은 강화 학습이다.

④ 준지도 학습(semi-supervised learning)

이 선지 진술은 틀림(X)

준지도 학습은 일부 레이블 데이터와 다수의 무레이블 데이터를 함께 사용한다. 행동과 보상 중심의 학습은 강화 학습이다.

Q. 2026 국가직9급 컴퓨터일반 3번의 핵심 쟁점은 무엇인가?: A. 2026 국가직9급 컴퓨터일반 3번은 머신러닝 유형에 관한 문항으로, "옳은 것"을 고르는 문제입니다.
Q. 2026 국가직9급 컴퓨터일반 3번의 정답은?: A. 정답은 ②번입니다. 강화 학습은 상태에서 행동을 선택하고 보상을 받아 정책을 개선하는 머신러닝 기법이다.