기술개요
인간과 동물 간, 즉 이종(異種) 도메인에서 얼굴 이미지 간의 정밀한 대응점(특징점)을 자동 검출하여, 서로 다른 종의 얼굴 이미지를 자연스럽게 매핑하고 유사한 구조로 변환할 수 있게 하는 시스템 개발.
기술 구현 내용
■ 주요 구성 요소 및 동작
1) 데이터 수신 모듈
- 인간 또는 동물의 얼굴 이미지 입력
2) 인코더 (제1 기계학습 모델):
- 입력 이미지를 임베딩하여 ‘종간 얼굴 임베딩’을 생성
3) 기계 학습 모듈:
- 종간 임베딩과 CSE 임베딩 차이를 기반으로 손실 함수 계산 → 모델 반복 학습
4) CSE 생성 모듈 (Continuous Surface Embedding):
- 얼굴 내 특정 포인트들(예: 눈, 코, 입)을 기반으로 연속 표면 임베딩 생성
5) 도메인 컨버터 (제2 기계학습 모델):
- 생성된 임베딩을 새로운 표현 공간으로 변환해 특징 임베딩 생성
6) 특정 도메인 얼굴 생성 모듈 (StyleGAN 기반):
- 노이즈 입력을 바탕으로 랜덤한 인간/동물 얼굴 이미지 생성
7) 노이즈 값 결정 모듈:
- 잠재 공간(Latent Space) 내에서 적절한 노이즈 벡터를 선택해 어색하지 않은 이미지 생성 유도
■ 손실 함수 학습 방식
1) 손실 함수 1 (L_K1):
- 종간 얼굴 임베딩과 연속 표면 임베딩 간 차이 최소화
2) 손실 함수 2 (L_K2):
- 특징 임베딩과 종간 특징점 간 차이 최소화
3) 손실 함수 3 (Semantic Matching Loss):
- 인간-동물 간 대응되는 얼굴 임베딩의 차이 최소화
시장성
■ AI 기반 얼굴 이미지 처리 시장
글로벌 이미지 인식 시장 규모는 2024년 기준 5,360억 달러로 2032년까지 163억 7,500만 달러로 연평균 15.8% 성장할 것으로 전망됨.
대역폭이 높은 데이터 서비스와 고급 머신 러닝에 대한 개인 선호도를 높이면서 기술에 대한 수요가 증가하고 있으며, 소매, 미디어 및 엔터테인먼트, IT 및 통신, 은행, 금융 서비스 및 보험과 같은 다양한 산업의 시설은 조직 내에서 고급 기술의 사용이 증가하여 시장을 주도하고 있음.
기술의 차별성
1) 기존 기술의 한계
- 인간과 동물 등 이종 도메인 간 얼굴 매칭 정확도가 낮음
- 얼굴 주요 구조(눈, 입, 코 등)의 대응이 비정확하거나 누락됨
- 완전한 임의 노이즈를 기반으로 생성된 이미지가 비현실적이거나 어색한 경우 다수
2) 본 발명의 핵심 차별점
- 종간 얼굴 임베딩이라는 개념 도입 → 인간-동물 간 구조적 유사성을 반영한 임베딩 방식
- CSE 기반 포인트 정합성 강화 → 신체 구조의 대응 포인트들을 더 정확히 매칭
- StyleGAN 기반 이미지 생성 + 노이즈 선택 알고리즘 → 현실감 있고 매끄러운 얼굴 이미지 생성
- 3종 손실 함수 기반 학습 전략으로 정밀도 극대화
- 자동화된 노이즈 벡터 선별 → 어색하지 않은 결과물 도출 (수염, 귀 등 비대응 영역 문제 해결)