🧠 AI는 어떻게 표정을 읽을까?

표정 분석기에 사용된 인공지능 기술을 알기 쉽게 설명합니다

Teachable Machine이란?

Teachable Machine은 Google이 만든 무료 머신러닝 학습 도구입니다. 코딩 지식이 없어도 웹 브라우저에서 사진, 소리, 자세 데이터를 업로드하면 몇 분 만에 나만의 인공지능 모델을 만들 수 있습니다.

이 사이트의 표정 분석기는 Teachable Machine의 이미지 프로젝트 기능으로 만들어졌습니다. 화남, 행복, 슬픔, 놀람 네 가지 표정의 얼굴 사진들을 각 클래스(분류 항목)에 나누어 학습시켰고, 완성된 모델을 웹에 내보내 누구나 브라우저에서 바로 사용할 수 있게 했습니다.

이미지 분류의 원리: 3단계로 이해하기

1단계. 이미지를 숫자로 바꾼다

컴퓨터에게 사진은 그림이 아니라 숫자의 격자입니다. 표정 분석기는 입력된 이미지를 224×224 픽셀 크기로 줄인 뒤, 각 픽셀의 색상값(빨강·초록·파랑)을 숫자로 읽어들입니다. 즉 하나의 얼굴 사진은 약 15만 개의 숫자 목록이 됩니다.

2단계. 신경망이 특징을 찾아낸다

이 숫자들은 합성곱 신경망(CNN)이라는 인공지능 구조를 통과합니다. 신경망의 앞쪽 층은 선과 모서리 같은 단순한 패턴을, 뒤쪽 층은 눈썹의 기울기, 입꼬리의 방향, 눈의 크기처럼 표정과 관련된 복잡한 특징을 감지하도록 학습되어 있습니다.

Teachable Machine은 전이학습(Transfer Learning)이라는 기법을 사용합니다. 수백만 장의 이미지로 미리 학습된 MobileNet이라는 기반 모델 위에, 우리가 제공한 표정 사진들로 마지막 분류 층만 새로 학습시키는 방식입니다. 덕분에 적은 데이터로도 꽤 정확한 모델을 만들 수 있습니다.

3단계. 확률로 답한다

마지막으로 모델은 네 가지 감정 각각에 대한 확률을 출력합니다. 예를 들어 "행복 92%, 놀람 5%, 화남 2%, 슬픔 1%"처럼요. 분석기 화면의 막대그래프가 바로 이 확률입니다. 가장 높은 확률의 감정이 대표 결과로 표시됩니다.

인식률을 높이는 촬영 팁

항목권장 사항
💡 조명얼굴 정면에서 빛이 들어오게 하세요. 역광(창문을 등진 상태)은 얼굴이 어둡게 나와 인식률이 크게 떨어집니다.
📐 각도카메라를 정면으로 바라보세요. 고개를 많이 돌리거나 숙이면 학습 데이터와 달라져 오차가 커집니다.
📏 거리얼굴이 화면의 절반 이상을 차지하도록 가까이 오세요. 얼굴이 작게 나오면 배경이 판단에 끼어듭니다.
🎭 표정과장되게 표현할수록 잘 인식됩니다. 활짝 웃기, 눈썹 치켜올리기, 입 크게 벌리기 등을 시도해보세요.
🖼️ 배경단순한 배경일수록 좋습니다. 뒤에 다른 사람의 얼굴이 있으면 결과가 섞일 수 있습니다.

AI의 한계, 꼭 알아두세요

나만의 모델도 만들어보세요

Teachable Machine은 누구나 무료로 사용할 수 있습니다. 직접 모델을 만들어보고 싶다면:

  1. teachablemachine.withgoogle.com에 접속해 "이미지 프로젝트"를 선택합니다.
  2. 분류하고 싶은 항목(클래스)을 만들고, 웹캠이나 파일로 각 클래스마다 사진을 50장 이상 모읍니다.
  3. "모델 학습시키기" 버튼을 누르면 브라우저 안에서 학습이 진행됩니다.
  4. "모델 내보내기"로 공유 링크를 만들면 이 사이트처럼 웹에서 활용할 수 있습니다.

표정 외에도 손동작 인식, 마스크 착용 감지, 반려동물 품종 구분 등 아이디어는 무궁무진합니다. 직접 만들어보는 것이 AI를 이해하는 가장 빠른 길입니다.

더 알아보기