🐨CoalaCoding
Docs▾
JavaScriptReactHTML & CSSBackendAI & LLMDev ToolsCreative
B반1
👾숏츠
🙉B반2
게시판
🐨CoalaCoding

디지털 크리에이터를 위한 한국어 기술 문서

문서

  • JavaScript
  • React
  • HTML & CSS
  • Backend
  • AI & LLM
  • Dev Tools
  • Creative

커뮤니티

  • 게시판
  • 예제 모음

기타

  • 관리자

정책

  • 소개
  • 개인정보처리방침
  • 이용약관
  • 연락처
© 2026 CoalaCoding. All rights reserved.
  • 1. AI 워커(AI Worker)가이드
  • 2. 프롬프트 다섯 가지 기법
  • 3. 생성형 AI와 일하는 방법
  • 4. 원하는 답을 얻는 요청문
  • 5. 독자에 맞는 말투 고르기
  • 6. 표와 목록으로 답변 정리하기
  • 7. 큰 업무를 작은 작업으로 나누기
  • 8. 답변의 사실과 출처 확인하기
  • 9. 개인정보와 저작권 지키기
  • 10. AI로 업무 문서 완성하기
  • 11. 긴 문서에서 핵심 찾기
  • 12. 최신 정보를 찾아 비교하기
  • 13. 표 데이터의 오류 찾기
  • 13. 챗gpt-활용법
  • 14. 이미지와 화면에서 정보 읽기
  • 14. 인공지능-서비스-목록
  • 15. 이미지·영상·음성 콘텐츠 기획하기
  • 16. 여러 대안을 같은 기준으로 비교하기
  • 17. 자주 쓰는 요청을 템플릿으로 만들기
  • 17. GEM등록하기
  • 18. 여러 자료를 묶어 결과물 만들기
  • 19. 반복 업무의 흐름 설계하기
  • 20. AI가 사용할 도구 정하기
  • 21. 대화가 바뀌어도 업무 이어가기
  • 22. AI 결과를 일관되게 검증하기
  • 23. AI의 권한과 보안 통제하기
  • 24. AI 에이전트에게 업무 맡기기
  • 25. 조사·작성·검토 역할 나누기
  • 26. AI 업무 하네스 만들기
  • 30. AI 코딩 에이전트 스킬 사용법
  1. 홈
  2. 문서
  3. AI & LLM
  4. 프롬프트 엔지니어링
  5. 14. 이미지와 화면에서 정보 읽기

14. 이미지와 화면에서 정보 읽기

이미지와 화면 자료에서 사실과 해석을 분리하는 교안이다.

#ai#프롬프트

목차

  • 1. 이미지 준비
  • 1.1 화면 캡처 만들기
  • 2. 보이는 사실 추출하기
  • 2.1 관찰만 요청하기
  • 3. 관찰과 해석 분리하기
  • 3.1 두 열 표 만들기
  • 4. 사용성 문제 찾기
  • 4.1 확인 기준 제공하기
  • 5. 오류가 생겼을 때
  • 5.1 이미지의 글자를 잘못 읽은 경우
  • 5.2 개인정보가 포함된 경우
  • 6. 직접 작성하기
  • 7. 예상 결과와 맞춰보기
  • 8. 살펴보기
  • 9. 적용 전 확인

1. 이미지 준비

이미지 분석에서는 화면에 보이는 사실과 그 사실에 대한 해석을 분리해야 한다.

이미지 입력을 지원하는 AI는 표, 차트, 화면 구조와 글자를 읽을 수 있다. 다만 작은 글자, 흐린 영역, 중요한 숫자와 이름은 잘못 읽을 수 있으므로 원본을 확대해 다시 확인한다.

1.1 화면 캡처 만들기

  1. 개인정보가 없는 웹 페이지나 프로그램 화면을 연다.
  2. Windows에서 Win+Shift+S를 누른다.
  3. 분석할 영역을 드래그한다.
  4. 캡처 알림을 누른다.
  5. [다른 이름으로 저장]을 누른다.
  6. "ai_prompt" 폴더에 "14_화면.png"으로 저장한다.
  7. "14_이미지분석.txt"를 만든다.
  8. AI 서비스에 "14_화면.png"를 첨부한다.

2. 보이는 사실 추출하기

2.1 관찰만 요청하기

  1. 다음 요청문을 입력한다.
첨부 이미지에서 눈으로 확인할 수 있는 사실만 작성한다.
추측과 원인 분석은 하지 않는다.

다음 항목으로 나눈다.
- 화면 제목
- 보이는 메뉴와 버튼
- 입력 영역
- 경고 또는 안내 문구
- 읽을 수 없는 부분

문구는 보이는 범위에서만 옮긴다.
  1. AI가 적은 메뉴와 버튼이 실제 화면에 있는지 확인한다.
  2. 없는 요소는 삭제한다.
  3. 흐린 글자를 AI가 단정했다면 판독 불가로 고친다.

3. 관찰과 해석 분리하기

3.1 두 열 표 만들기

  1. 다음 요청문을 입력한다.
이전 관찰 결과를 아래 두 열로 분리한다.

관찰: 이미지에서 직접 확인한 사실
해석: 관찰을 바탕으로 추정한 의미

해석에는 반드시 '추정'이라고 표시한다.
  1. "14_이미지분석.txt"에 표를 저장한다.
  2. 관찰 열에 원인이나 의도가 들어가면 해석 열로 옮긴다.

4. 사용성 문제 찾기

4.1 확인 기준 제공하기

  1. 다음 요청문을 입력한다.
첨부 화면을 아래 기준으로만 검토한다.

- 주요 버튼을 찾기 쉽운가
- 입력 항목 이름이 분명한가
- 오류 문구가 해결 방법을 알려주는가
- 글자와 배경을 구분하기 쉽운가
- 키보드만으로 사용할 수 있는지는 이미지로 판단 가능한가

이미지만으로 판단할 수 없는 항목은 '판단 불가'라고 적는다.
각 지적에 화면 근거를 붙인다.
  1. 근거가 없는 지적을 제거한다.
  2. 키보드 접근성처럼 정지 이미지로 확인하기 어려운 항목은 판단 불가인지 확인한다.

5. 오류가 생겼을 때

5.1 이미지의 글자를 잘못 읽은 경우

  1. 원본 이미지를 확대해 직접 확인한다.
  2. 필요한 영역만 다시 캡처한다.
  3. 다음 문장을 입력한다.
글자가 선명하지 않으면 추측하지 말고 '판독 불가'라고 표시한다.

5.2 개인정보가 포함된 경우

  1. 이미지를 업로드하지 않는다.
  2. 그림판이나 캡처 도구에서 이름, 이메일, 계정 사진을 가린다.
  3. 가린 사본만 업로드한다.

6. 직접 작성하기

  1. 개인정보가 없는 화면 한 개를 캡처한다.
  2. 보이는 사실을 추출한다.
  3. 관찰과 해석을 나눌다.
  4. 사용성 문제 두 개 이하를 근거와 함께 작성한다.
  5. 결과를 "14_이미지분석.txt"에 저장한다.

7. 예상 결과와 맞춰보기

관찰: 화면 위쪽에 '로그인' 제목이 보인다.
관찰: 이메일 입력칸과 비밀번호 입력칸이 보인다.
해석: 계정 정보로 로그인하는 화면으로 추정한다.
판단 불가: 키보드만으로 모든 항목을 이동할 수 있는지

이미지에서 직접 본 내용과 추정을 구분하고 확인할 수 없는 동작을 판단 불가로 표시하면 정상이다.

8. 살펴보기

  • 개인정보를 가린 사본을 사용했는가
  • 보이는 사실과 해석을 분리했는가
  • 흐린 글자를 추측하지 않았는가
  • 중요한 숫자와 이름을 확대해 확인했는가
  • 정지 이미지로 알 수 없는 동작을 판단 불가로 표시했는가

9. 적용 전 확인

  • 이미지에서 직접 보이는 사실과 AI의 해석을 구분해 적는다.
  • 작거나 흐린 글자는 확인 불가로 표시하고 임의로 채우지 않는다.
  • 파일 업로드 제한과 이미지 입력 지원 여부는 사용하는 서비스에서 확인한다.