기술개요
자율주행차 또는 이동체가 교통 관제사의 수신호 제스처를 영상 인식을 통해 정확히 인식하도록 지원하는 기술임.
기술 구현 내용
1) 교통 관제사 인식 (Object Detection)
- YOLO 기반 네트워크를 학습시켜 교통경찰 등 관제사 검출
2) 손 인식 및 3D 손 모델링
- 관제사 이미지에서 왼손/오른손, 손바닥/손등 구분
- SMPL-X 모델을 활용한 3D 손 모델링
- 손실함수: 손 포즈, 2D/3D 키포인트, 정규화 손실의 가중합
3) 수신호 분류 네트워크
- 3가지 구성요소:
1. FEN(Feature Extraction Network): CNN 기반 특징 추출
2. CEN(Contrastive Embedding Network): 제스처 변화가 큰 경우 대응
3. SIN(Single Inference Network): 제스처 변화가 작은 경우 대응
- 학습 방식: Autoencoder 구조 기반, 과거 프레임과 현재 프레임 비교를 통한 대조 임베딩 학습
- 성능: 프레임 단위 인식률 평균 96.70%, 제스처 단위 완전 인식률 100%
4) 실시간 적용성
- 총 인식 프로세스 소요 시간: 약 0.432초
- 자율주행차 내 임베디드 보드 기준 성능 만족
시장성
1) 대상 시장
- 자율주행차 산업 : L3 이상 자율주행 시스템에서 필수 기능
- 지능형 교통 시스템 : 교통 관제 통합 시스템 등
- 차량 주행보조시스템 및 안전 센서 분야
2) 지능형 교통 시스템(ITS) 시장
글로벌 지능형 교통 시스템 시장 규모는 2023년 기준으로 282억 5,000만 달러에서 2030년 591억 2,000만 달러까지 연평균 9.67% 성장할 것으로 전망됨.
교통 혼잡, 안전 문제 해결, 효율적인 교통 관리 등의 필요성이 증대됨에 따라 ITS 기술 적용이 확산되고 있으며, 자율주행, 스마트시티 구축 등 미래 모빌리티 시장 성장과 맞물려 ITS 시장의 성장세는 더욱 가속화 되고 있음.
기술의 차별성
1) 기존 기술의 한계
- 수신호 인식은 대체로 영상 기반 객체 탐지 수준에 그침
- 손 인식 정확도 낮고, 장갑 착용 시 손 구분 어려움
- 좌우 손 구분 및 제스처 연속성 분석 부족
- 제스처 변화의 크기에 따른 유연한 분류 체계 미비
2) 본 발명의 특장점
- YOLO 기반 교통 관제사 인식 + 3D 손 모델링 적용
- 장갑을 착용한 손에 대해서도 좌우/손등/손바닥 구분
- 대조 임베딩 + 단일 추론 이중 네트워크로 변화 크기에 따른 분류 최적화
- 0.4초 수준의 빠른 인식 속도, 자율주행 보드에 탑재 가능한 구조
3) 차별화 포인트
- 영상 기반 AI 기술 중에서도 제스처 분류 최적화 구조 (CEN+SIN 병렬 구조)를 채택
- 3차원 손 모델링 정교화를 통해 정확도 극대화
- 실시간 탑재 가능한 경량화 구조 + 고정확도 제스처 인식 동시 달성