2026 국가직9급 컴퓨터일반 3번 해설 — 머신러닝 유형

정답 ②번출제 쟁점 머신러닝 유형발문 옳은 것 고르기

문제

특정 환경에서 선택 가능한 행동들 중 보상(reward)을 최대화하는 행동을 선택하는 머신러닝(machine learning) 기법은?

  1. 지도 학습(supervised learning)
  2. 강화 학습(reinforcement learning) ← 정답
  3. 비지도 학습(unsupervised learning)
  4. 준지도 학습(semi-supervised learning)

선지별 해설

지도 학습(supervised learning)

이 선지 진술은 틀림(X)

지도 학습은 정답 레이블이 있는 데이터로 입력과 출력의 관계를 학습한다. 보상 기반 행동 선택은 강화 학습의 특징이다.

강화 학습(reinforcement learning)

이 선지 진술은 옳음(O)

강화 학습은 상태에서 행동을 선택하고 보상을 받아 정책을 개선하는 머신러닝 기법이다.

비지도 학습(unsupervised learning)

이 선지 진술은 틀림(X)

비지도 학습은 레이블 없이 데이터의 구조나 패턴을 찾는다. 보상 신호를 쓰는 것은 강화 학습이다.

준지도 학습(semi-supervised learning)

이 선지 진술은 틀림(X)

준지도 학습은 일부 레이블 데이터와 다수의 무레이블 데이터를 함께 사용한다. 행동과 보상 중심의 학습은 강화 학습이다.

핵심 요약 (Q&A)

Q. 2026 국가직9급 컴퓨터일반 3번의 핵심 쟁점은 무엇인가?
A. 2026 국가직9급 컴퓨터일반 3번은 머신러닝 유형에 관한 문항으로, "옳은 것"을 고르는 문제입니다.
Q. 2026 국가직9급 컴퓨터일반 3번의 정답은?
A. 정답은 ②번입니다. 강화 학습은 상태에서 행동을 선택하고 보상을 받아 정책을 개선하는 머신러닝 기법이다.
🧩 인공지능 개념·기출 모아보기📄 2026 국가직9급 컴퓨터일반 전체 문항✏️ 이 시험 미니문제 풀기
출처: 2026 국가직9급 컴퓨터일반 기출 (원문 보존)해설 기준: 출제 당시 법령·판례 · 개정 사항은 ⚠️ 표시