기술개요
본 기술은 Bi-LSTM(Bidirectional Long Short-Term Memory)과 어텐션 메커니즘을 기반으로, 한국어와 영어가 혼합된 이중언어 메디컬 리포트와 의료 영상을 함께 분석하여 질병 관련 정보를 분류하는 인공지능 기술임.
특히, 기계번역을 통해 언어 간 통합 임베딩을 생성하고, 어텐션 계층에서 중요한 단어에 가중치를 부여함으로써 리포트의 의미를 효과적으로 추출하며, 방사선학 이미지를 통한 신체 부위 추론까지 결합하여 의료 리포트의 긍정, 부정, 모호 여부를 높은 정확도로 분류할 수 있음.
기술 구현 내용
■ 구성 요소
1) 메디커 리포트 처리부
- 한영 혼합 리포트 전처리, 번역, 임베딩 생성 (Bi-LSTM 사용)
2) 어텐션 계층부
- 클러스터링 분석 기반 가중치 부여 (중요 단어 강조)
3) 소프트맥스 계층부
- 3단계 분류 (긍정/부정/모호), 모호 시 회귀분석 추가
4) 제어부
- 전체 흐름 제어 및 각 부 구성 간 데이터 흐름 조절
5) 데이터셋
- 서울아산병원 10년치 영상 리포트 (2008~2018) 사용
6) 평가 결과
- 모호 클래스 분류 성능 향상 (정확도 80%, F1-score 향상)
시장성
1) 의료 AI 시장
글로벌 의료 AI시장 규모는 2024년 기준 497억 1,000만 달러에서 2037년 6조 4,000억 달러까지 연평균 45.3% 성장할 것으로 전망됨.
특히, 의료 영상 AI 시장은 의료용 자연어처리, 양국어 기반 의료정보 해석 시스템등, EHR, EMR 기반 진단지원 솔루션 등 지속적인 성장을 보여주고 있음.
2) 적용 분야
- 병원 내 PACS 시스템 연동
- 이중언어 기반 의료기관
- 의료 빅데이터 분석
기술의 차별성
1) 기존 기술의 한계
- 메디컬 리포트는 비정형 텍스트로 AI 분석 어려움
- 이중언어 구성 시 언어 간 불일치로 정확도 저하
- 영상과 텍스트의 통합 분석 부재
2) 본 발명의 특장점
- 한국어-영어 혼합 데이터에 대한 전처리 및 기계번역 자동화
- Bi-LSTM + 어텐션 기반 임베딩 정확도 향상
- 신체 부위 연관성 분석으로 임베딩 필터링 가능
- 소프트맥스 + 회귀분석 통한 다중단계 판단
3) 차별화 포인트
- 어텐션 시각화로 해석 가능성 확보
- 모호한 사례 분류 정확도 개선 (기존 모델 대비 우수)
- 실제 병원 데이터를 통한 성능 검증 기반 (서울아산병원)