🐨CoalaCoding
Docs▾
JavaScriptReactHTML & CSSBackendAI & LLMDev ToolsCreative
B반1
👾숏츠
🙉B반2
게시판
🐨CoalaCoding

디지털 크리에이터를 위한 한국어 기술 문서

문서

  • JavaScript
  • React
  • HTML & CSS
  • Backend
  • AI & LLM
  • Dev Tools
  • Creative

커뮤니티

  • 게시판
  • 예제 모음

기타

  • 관리자

정책

  • 소개
  • 개인정보처리방침
  • 이용약관
  • 연락처
© 2026 CoalaCoding. All rights reserved.
  • 1. AI 워커(AI Worker)가이드
  • 2. 프롬프트 다섯 가지 기법
  • 3. 생성형 AI와 일하는 방법
  • 4. 원하는 답을 얻는 요청문
  • 5. 독자에 맞는 말투 고르기
  • 6. 표와 목록으로 답변 정리하기
  • 7. 큰 업무를 작은 작업으로 나누기
  • 8. 답변의 사실과 출처 확인하기
  • 9. 개인정보와 저작권 지키기
  • 10. AI로 업무 문서 완성하기
  • 11. 긴 문서에서 핵심 찾기
  • 12. 최신 정보를 찾아 비교하기
  • 13. 표 데이터의 오류 찾기
  • 13. 챗gpt-활용법
  • 14. 이미지와 화면에서 정보 읽기
  • 14. 인공지능-서비스-목록
  • 15. 이미지·영상·음성 콘텐츠 기획하기
  • 16. 여러 대안을 같은 기준으로 비교하기
  • 17. 자주 쓰는 요청을 템플릿으로 만들기
  • 17. GEM등록하기
  • 18. 여러 자료를 묶어 결과물 만들기
  • 19. 반복 업무의 흐름 설계하기
  • 20. AI가 사용할 도구 정하기
  • 21. 대화가 바뀌어도 업무 이어가기
  • 22. AI 결과를 일관되게 검증하기
  • 23. AI의 권한과 보안 통제하기
  • 24. AI 에이전트에게 업무 맡기기
  • 25. 조사·작성·검토 역할 나누기
  • 26. AI 업무 하네스 만들기
  • 30. AI 코딩 에이전트 스킬 사용법
  1. 홈
  2. 문서
  3. AI & LLM
  4. 프롬프트 엔지니어링
  5. 22. AI 결과를 일관되게 검증하기

22. AI 결과를 일관되게 검증하기

AI 결과를 같은 기준으로 반복 검증하는 교안이다.

#ai#프롬프트

목차

  • 1. 검증 기준 준비
  • 1.1 검증 파일 만들기
  • 2. 대표 사례 만들기
  • 2.1 정상 사례와 문제 사례 준비하기
  • 3. 검증 요청 실행하기
  • 3.1 같은 요청으로 네 파일 확인하기
  • 4. 기준 수정하기
  • 4.1 놓친 오류를 기준에 반영하기
  • 5. 사람 검토 남기기
  • 5.1 AI 확인과 사람 확인 분리하기
  • 6. 오류가 생겼을 때
  • 6.1 같은 문서에 결과가 달라지는 경우
  • 6.2 기준이 너무 많은 경우
  • 7. 직접 만들기
  • 8. 예상 결과와 맞춰보기
  • 9. 살펴보기
  • 10. 적용 전 확인

1. 검증 기준 준비

좋아 보이는 결과와 요구사항을 충족한 결과는 다르다. 같은 기준으로 반복 확인할 수 있어야 한다.

검증 기준은 평가자의 기분이 아니라 관찰 가능한 문장이어야 한다. 정상 사례와 문제 사례를 함께 시험해야 AI가 어떤 오류를 놓치는지 확인할 수 있다.

1.1 검증 파일 만들기

  1. "ai_prompt" 폴더에 "22_quality" 폴더를 만든다.
  2. "22_quality"에 "검증기준.md"를 만든다.
  3. 문서 검수 업무를 기준으로 다음 내용을 입력한다.
# 문서 검증 기준

필수:
- 제목이 있다.
- 날짜가 YYYY-MM-DD 형식이다.
- 입력 자료의 핵심 사실이 모두 있다.
- 입력 자료에 없는 사실이 없다.
- 개인정보가 없다.

문장:
- 한 문장에 핵심 내용이 하나이다.
- 뜻이 모호한 지시어가 없다.
- 같은 내용이 반복되지 않는다.

출력:
- 문제 위치가 표시된다.
- 원인과 수정문이 구분된다.

2. 대표 사례 만들기

2.1 정상 사례와 문제 사례 준비하기

  1. "정상.md"를 만든다.
  2. 기준을 모두 만족하는 짧은 안내문을 넣는다.
  3. "누락.md"를 만든다.
  4. 날짜와 장소가 빠진 안내문을 넣는다.
  5. "추가사실.md"를 만든다.
  6. 입력 자료에 없는 비용과 연락처가 있는 안내문을 넣는다.
  7. "개인정보.md"를 만든다.
  8. 실명이 포함된 가상 안내문을 넣는다.
  1. 정상 사례만으로는 오류를 찾는 능력을 확인할 수 없다.
  2. 누락, 잘못된 추가, 위험 정보처럼 서로 다른 문제 사례가 필요하다.

3. 검증 요청 실행하기

3.1 같은 요청으로 네 파일 확인하기

  1. 다음 요청문을 사용한다.
아래 문서를 검증 기준에 따라 확인한다.

출력:
| 기준 | 결과 | 근거 위치 | 수정 필요 내용 |

결과는 '확인' 또는 '문제'만 사용한다.
기준에 없는 취향 판단은 추가하지 않는다.

<검증 기준>
[검증기준.md 내용]
</검증 기준>

<문서>
[검증할 문서 내용]
</문서>
  1. 네 파일에 같은 요청문을 사용한다.
  2. 예상한 문제를 찾았는지 기록한다.
파일 | 예상 문제 | AI가 찾은 문제 | 놓친 문제 | 잘못 지적한 문제

4. 기준 수정하기

4.1 놓친 오류를 기준에 반영하기

  1. AI가 반복해서 놓친 문제를 찾는다.
  2. 기준을 더 구체적인 질문으로 바꿜다.
모호함: 개인정보가 없다.
명확함: 이름, 전화번호, 이메일, 주소, 생년월일이 포함되지 않았는가?
  1. 기준을 수정한 뒤 네 파일을 다시 확인한다.
  2. 이전 결과와 비교한다.

5. 사람 검토 남기기

5.1 AI 확인과 사람 확인 분리하기

  1. 다음 항목은 사람이 최종 확인한다.
    1. 문맥에 맞는 말투
    2. 기관 정책과의 일치
    3. 출처 원문과의 일치
    4. 공개해도 되는 정보인지
  2. "사람검토.md"에 확인자, 날짜, 수정 내용을 기록한다.

AI에게 검토를 요청하는 것은 AI 확인이다. 같은 입력에 같은 판정을 내리는 검색 규칙, 계산식, 프로그램 검사와 같은 방식만 규칙 기반 자동 검사라고 부른다.

6. 오류가 생겼을 때

6.1 같은 문서에 결과가 달라지는 경우

  1. 입력 문서와 검증 기준이 같은지 확인한다.
  2. 출력 형식을 고정한다.
  3. 판단이 필요한 기준을 더 구체적으로 고친다.
  4. 중요한 항목은 규칙 기반 검사나 사람이 다시 확인한다.

6.2 기준이 너무 많은 경우

  1. 필수 기준과 권장 기준을 나눈다.
  2. 한 번에 필수 기준부터 확인한다.
  3. 통과한 뒤 문장 품질을 확인한다.

7. 직접 만들기

  1. 반복해서 확인할 결과물 하나를 고른다.
  2. 검증 기준을 작성한다.
  3. 정상 사례 한 개와 문제 사례 세 개를 만든다.
  4. 같은 요청으로 모두 확인한다.
  5. 놓친 문제를 기준에 반영한다.

8. 예상 결과와 맞춰보기

파일 | 예상 문제 | AI가 찾은 문제 | 놓친 문제 | 잘못 지적한 문제
정상.md | 없음 | 없음 | 없음 | 없음
누락.md | 날짜·장소 누락 | 날짜·장소 누락 | 없음 | 없음
추가사실.md | 비용·연락처 추가 | 비용 추가 | 연락처 | 없음
개인정보.md | 실명 포함 | 실명 포함 | 없음 | 없음

정상 사례와 서로 다른 문제 사례를 구분하고 놓친 오류가 검증 기준에 반영되면 정상이다.

9. 살펴보기

  • 검증 기준을 확인 가능한 문장으로 작성했는가
  • 정상 사례와 문제 사례를 함께 시험했는가
  • AI가 놓친 문제와 잘못 지적한 문제를 기록했는가
  • AI 확인과 규칙 기반 자동 검사를 구분했는가
  • 기관 정책과 공개 가능 여부를 사람이 최종 확인했는가

10. 적용 전 확인

  • 검증 기준이 결과마다 다르게 적용되지 않았는지 확인한다.
  • 대표 성공 사례와 실패 사례를 함께 두고 비교한다.
  • 중요한 결과는 AI 검토만 믿지 않고 규칙 기반 검사나 사람이 다시 확인한다.