기술개요
본 기술은 소량의 3D 점군 데이터를 바탕으로, 다양한 시점의 객체 이미지와 그에 대응되는 레이블을 자동 생성하여 딥러닝 학습용 데이터셋을 가상으로 대량 생성할 수 있는 시스템임.
기술 구현 내용
1) 원시 데이터 수집부
- RGB 색상 정보를 포함한 3D 점군 데이터(x, y, z, r, g, b)를 수집
- 예시: 모바일 라이다, 사진 기반 3D 재구성
2) 객체 데이터 생성
- 점군 데이터를 다양한 관점(뷰 포인트, 뷰 벡터)으로 시각화하여 이미지 및 레이블 생성
- 레이블은 외곽선 탐지 기반의 이진 마스크 형태로 생성
- 시각화에 Open3D 라이브러리 등 활용 가능
3) 배경 이미지 정보 생성부
- 사용자가 선택한 배경 이미지에 대해 객체의 존재 가능 영역을 바운딩 박스로 지정
4) 가상 학습 데이터 생성부
- 객체 이미지들을 배경 이미지에 붙여넣어 학습용 이미지-레이블 세트 생성
- 위치, 크기, 개수 모두 랜덤 요소를 포함하여 다양한 조합 생성
시장성
1. 적용 가능 시장
- 컴퓨터 비전 학습 데이터 생성 플랫폼
- 건설, 로봇, 드론, 다율주행 분야의 객체 인식/분할 모델 개발
- 스마트 건설현장/안정관리, 디지털 트윈
2. 딥러닝 시장
글로벌 딥러닝 시장 규모는 2024년 기준 126억달러로 2033년 1262억 달러까지 연평균 30.2% 성장할 것으로 전망됨.
고성능 딥러닝 모델에는 대규모, 고품질 데이터셋이 필수이나, 실제 수집은 비용과 시간이 많이 소요되며, 특히 건설현장, 작업자 인식 등 특수 도메인은 데이터가 부족하므로 가상 데이터 생성 수요가 높음.
이러한 기회 요인으로 SaaS 형태의 데이터 증강 플랫폼, 또는 모듈형 API 제공의 사업화로 시장은 지속적으로 확대 되고 있음.
기술의 차별성
1) 기존 기술의 한계
- 기존 이미지 기반 데이터셋 생성은 배경 제거가 필요하거나, 객체 모습 다양성이 부족
- 객체 위치가 실제 물리 상황과 어울리지 않음 (예: 공중에 뜬 작업자)
- 색조 정보 미포함
2) 본 발명의 특장점
- 3D 점군 기반이므로 객체의 다양한 각도 이미지 생성 가능
- 색상·텍스처 포함된 이미지 생성으로 실제와 유사
- 객체 존재 가능 위치를 바운딩 박스로 제어, 현실감 있는 합성 가능
- 자동화된 프로세스로 적은 원시 데이터로 수천 개 이상 생성 가능
3) 차별화 포인트
- 360도 전방위 관점 기반 학습 이미지 생성 (기존 대비 이미지 다양성↑)
- 배경-객체 자연스러운 합성 보장 (위치·크기 제한, 현실적 배경 적용)
- 이진 마스크 기반의 정밀 레이블 자동 생성
- 기존 GAN 기반 생성과 달리, 실제 객체 정보를 활용한 합성 방식