기술개요
본 기술은 입력 이미지를 Leaky-Clip 모듈 및 라운딩 함수로 양자화한 뒤, 사전 학습된 양자화된 가중치와 함께 컨볼루션 연산을 수행하여 이미지를 효율적으로 압축하고 복원하는 방법 및 장치임
기술 구현 내용
1) 주요 구성
- 압축 모델 구성: 메인 인코더, 하이퍼 인코더, 메인 디코더, 하이퍼 디코더, 산술 부호화 및 복호화기 포함
- QConv 레이어 사용: 입력 이미지와 가중치를 정수로 양자화한 후 Convolution 연산
- Leaky-Clip 모듈:
1. 추론 과정: 일반 Clip 함수 사용 (외부 기울기 0)
2. 학습 과정: 수정된 Clip 함수 사용 (외부 기울기 0 < γ ≤ 1)
- 손실 함수:
3. BD-Rate 최소화 + 양자화 오차 최소화를 동시에 고려한 항으로 구성된 복합 손실함수 사용
2) 구현의 핵심 로직
- 실수 기반 가중치 및 입력을 8비트 정수로 양자화하여 경량화
- 추론 시 연산 비용을 줄이며도 원본과 유사한 고품질 이미지 재구성 가능
- Clip 함수의 기울기 차별적 적용으로 외부 값도 학습에 반영 가능
시장성
1) 이미지 인식 시장
글로벌 이미지 인식 시장 규모는 2025년 기준 58억 5,000만 달러에서 2032년 163억 7,000만 달러까지 연평균 15.8% 성장할 것으로 전망됨
2) 시장 성장 요인
- 고해상도 콘텐츠 증가 : 4K/8K 영상, 실시간 스트리밍의 확대
- 모바일 및 엣지 디바이스의 연산 및 저장 한계
- 기존 JPEG, HEVC 대비 압축 효율성 한계
- AI기반 모델의 실시간화, 경량화 기술 진전
- 자율주행, 스마트시티 등에서의 영상 압축 필요성 증가
기술의 차별성
1) 기존 기술의 한계
- 기존 JPEG/HEVC 기반 압축은 비딥러닝 기반으로 한계가 있음
- 기존 학습 기반 압축 방식은 연산량이 크고, 양자화 에러가 커 학습이 불안정함
2) 본 발명의 특장점
- Leaky-Clip 모듈을 통한 학습 안정성 확보
- 학습과 추론 시 서로 다른 Clip 기울기를 사용하여 양자화 외부값도 반영
- 손실 함수에 양자화 에러까지 반영해 성능 향상
- 8비트 정수 기반 양자화로 연산량 경량화
3) 차별화 포인트
- Leaky-Clip 기법 적용을 통한 학습 안정성 극대화
- 양자화 에러 항을 포함한 복합 손실 함수
- QConv 구조를 통한 8비트 정수 연산 최적화
- 경량화 + 고정밀 압축 가능