이미지와 화면에서 정보 읽기

이 문서에서는 개인정보를 가린 화면 캡처 한 장을 AI에게 읽혀, 화면에 보이는 사실과 그에 대한 해석을 나누고 사용성 문제까지 근거와 함께 뽑아낸다. 컴퓨터에서 화면을 캡처해 파일로 저장할 수 있고 이미지 입력을 지원하는 생성형 AI 서비스에 접속할 수 있으면 따라올 수 있다. 끝까지 따라 하면 관찰과 해석을 분리한 표와 근거 있는 사용성 지적이 한 파일에 정리되어, 이미지에서 본 것과 추정한 것을 구분해 읽는 습관이 손에 남는다.

1 – 이미지 준비

이미지 분석에서는 화면에 보이는 사실과 그 사실에 대한 해석을 분리해야 한다.

이미지 입력을 지원하는 AI는 표, 차트, 화면 구조와 글자를 읽을 수 있다. 다만 작은 글자, 흐린 영역, 중요한 숫자와 이름은 잘못 읽을 수 있으므로 원본을 확대해 다시 확인한다.

1.1 – 화면 캡처 만들기

화면을 캡처해 파일로 저장하고 AI 서비스에 첨부한다.

개인정보가 없는 웹 페이지나 프로그램 화면을 연다.
Windows에서 Win+Shift+S를 누른다.
분석할 영역을 드래그한다.
캡처 알림을 누른다.
[다른 이름으로 저장]을 누른다.
"ai_prompt" 폴더에 "14_화면.png"으로 저장한다.
"14_이미지분석.txt"를 만든다.
AI 서비스에 "14_화면.png"를 첨부한다.

[!WARNING]

캡처에 이름, 이메일, 계정 사진 같은 개인정보가 들어 있으면 업로드하지 않는다.

그림판이나 캡처 도구에서 개인정보를 가린 뒤 가린 사본만 업로드한다.

2 – 보이는 사실 추출하기

2.1 – 관찰만 요청하기

화면에서 눈으로 확인할 수 있는 사실만 뽑고, 추측은 빼게 한다.

다음 요청문을 입력한다.

첨부 이미지에서 눈으로 확인할 수 있는 사실만 작성한다.
추측과 원인 분석은 하지 않는다.

다음 항목으로 나눈다.
- 화면 제목
- 보이는 메뉴와 버튼
- 입력 영역
- 경고 또는 안내 문구
- 읽을 수 없는 부분

문구는 보이는 범위에서만 옮긴다.

AI가 적은 메뉴와 버튼이 실제 화면에 있는지 확인한다.
없는 요소는 삭제한다.
흐린 글자를 AI가 단정했다면 판독 불가로 고친다.

[!WARNING]

이미지의 글자를 잘못 읽으면 원본 이미지를 확대해 직접 확인하고 필요한 영역만 다시 캡처한다.

다시 캡처한 이미지와 함께 "글자가 선명하지 않으면 추측하지 말고 '판독 불가'라고 표시한다."를 덧붙여 요청한다.

3 – 관찰과 해석 분리하기

3.1 – 두 열 표 만들기

앞에서 뽑은 사실을 관찰과 해석 두 열로 나눈다.

다음 요청문을 입력한다.

이전 관찰 결과를 아래 두 열로 분리한다.

관찰: 이미지에서 직접 확인한 사실
해석: 관찰을 바탕으로 추정한 의미

해석에는 반드시 '추정'이라고 표시한다.

"14_이미지분석.txt"에 표를 저장한다.
관찰 열에 원인이나 의도가 들어가면 해석 열로 옮긴다.

4 – 사용성 문제 찾기

4.1 – 확인 기준 제공하기

정해진 기준으로만 화면을 검토하게 하고, 근거 없는 지적은 걸러낸다.

다음 요청문을 입력한다.

첨부 화면을 아래 기준으로만 검토한다.

- 주요 버튼을 찾기 쉬운가
- 입력 항목 이름이 분명한가
- 오류 문구가 해결 방법을 알려주는가
- 글자와 배경을 구분하기 쉬운가
- 키보드만으로 사용할 수 있는지는 이미지로 판단 가능한가

이미지만으로 판단할 수 없는 항목은 '판단 불가'라고 적는다.
각 지적에 화면 근거를 붙인다.

근거가 없는 지적을 제거한다.
키보드 접근성처럼 정지 이미지로 확인하기 어려운 항목은 판단 불가인지 확인한다.

5 – 직접 작성하기

개인정보가 없는 화면 한 개를 캡처한다.
보이는 사실을 추출한다.
관찰과 해석을 나눈다.
사용성 문제 두 개 이하를 근거와 함께 작성한다.
결과를 "14_이미지분석.txt"에 저장한다.

6 – 예상 결과와 맞춰보기

자신의 결과가 제대로 나왔는지 아래 답과 맞춰 본다. AI 답변은 실행마다 표현이 달라지므로, 글자 하나까지 같기를 기대하지 말고 사실과 해석이 제대로 나뉘었는지를 본다.

관찰: 화면 위쪽에 '로그인' 제목이 보인다.
관찰: 이메일 입력칸과 비밀번호 입력칸이 보인다.
해석: 계정 정보로 로그인하는 화면으로 추정한다.
판단 불가: 키보드만으로 모든 항목을 이동할 수 있는지

[!INFO]
네 항목 중 세 항목 이상을 만족하면 정상이다.

개인정보를 가린 사본을 사용했고 보이는 사실과 해석을 분리했다.

흐린 글자를 추측하지 않았고 중요한 숫자와 이름은 확대해 확인했다.

정지 이미지로 알 수 없는 동작을 판단 불가로 표시했다.

작거나 흐린 글자는 확인 불가로 표시하고 임의로 채우지 않았다.

[!NOTE]
파일 업로드 제한과 이미지 입력 지원 여부는 사용하는 서비스에서 확인한다.

7 – 막히면 AI 코치에게 묻기

이 문서에서 익힌 이미지·화면에서 보이는 사실과 해석을 분리해 읽는 작업을 내 자료에 적용하다 막히면, 아래를 대화형 AI(ChatGPT·Claude·Gemini)에 붙여 넣어 실습 코치로 삼는다. 답을 한꺼번에 받지 말고 한 단계씩 풀어 간다.

너는 이미지 분석 실습 코치다. 나는 화면 캡처에서 보이는 사실만 먼저 뽑고 해석은 '추정'으로 따로 표시하며 읽을 수 없는 부분은 판독 불가로 남기는 법을 배웠고, 내 화면 캡처 하나로 관찰·해석 분리 표를 직접 완성하려 한다. 답을 통째로 주지 말고 한 단계씩 물어 내가 직접 하게 한다.

[코칭 방식]
1. 먼저 내가 지금까지 한 것과 막힌 지점을 묻는다.
2. 막힌 원인을 한 가지 짚어 준다. 완성된 관찰·해석 표를 통째로 주지 않는다.
3. 다음 한 단계만 제시하고, 내가 해 본 결과를 말하면 확인 질문을 던진다.
4. 마지막에 관찰 열에 추측이 섞이지 않고 읽을 수 없는 부분이 판독 불가로 표시됐는지 점검 질문을 한다.

[내 상황]
- 지금까지 한 것: {한것}
- 막힌 지점·메시지: {막힌점}
- 내 소재: {소재}

준비됐으면 "분석할 화면에서 개인정보를 먼저 가렸나?"라고만 답한다.

{한것} – 지금까지 진행한 단계, 예: 화면을 캡처해 보이는 사실 목록까지는 적었다.
{막힌점} – 막힌 부분이나 받은 메시지, 예: 관찰과 해석을 나눌 때 어디까지가 사실이고 어디부터 추정인지 헷갈린다.
{소재} – 적용할 내 자료·주제, 예: 개인정보를 가린 로그인 화면 캡처.

위 변수를 실제 값으로 채운 완성 예시는 다음과 같다.

너는 이미지 분석 실습 코치다. 나는 화면 캡처에서 보이는 사실만 먼저 뽑고 해석은 '추정'으로 따로 표시하며 읽을 수 없는 부분은 판독 불가로 남기는 법을 배웠고, 내 화면 캡처 하나로 관찰·해석 분리 표를 직접 완성하려 한다. 답을 통째로 주지 말고 한 단계씩 물어 내가 직접 하게 한다.

[코칭 방식]
1. 먼저 내가 지금까지 한 것과 막힌 지점을 묻는다.
2. 막힌 원인을 한 가지 짚어 준다. 완성된 관찰·해석 표를 통째로 주지 않는다.
3. 다음 한 단계만 제시하고, 내가 해 본 결과를 말하면 확인 질문을 던진다.
4. 마지막에 관찰 열에 추측이 섞이지 않고 읽을 수 없는 부분이 판독 불가로 표시됐는지 점검 질문을 한다.

[내 상황]
- 지금까지 한 것: 화면을 캡처해 보이는 사실 목록까지는 적었다.
- 막힌 지점·메시지: 관찰과 해석을 나눌 때 어디까지가 사실이고 어디부터 추정인지 헷갈린다.
- 내 소재: 개인정보를 가린 로그인 화면 캡처.

준비됐으면 "분석할 화면에서 개인정보를 먼저 가렸나?"라고만 답한다.

[!TIP]

코치가 답을 통째로 주려 하면 "한 단계씩 물어라"라고 다시 요청한다.

내 상황을 적을 때 캡처에 이름·이메일·계정 사진 같은 개인정보가 남아 있는지 먼저 확인했음을 함께 적는다.