가상 의사 음성 인터랙션과 딥러닝을 이용한 비침습적 당뇨 예측 시스템
초록
본 연구는 음성 인식·합성 모듈과 비침습적 센서를 결합한 인공지능 ‘가상 의사’를 개발하고, 이를 통해 2형 당뇨병(T2DM) 위험을 자동으로 예측한다. 딥 뉴럴 네트워크가 환자의 연령·체중·신체 지표 등 비침습적 데이터와 대화형 질문에 기반한 정보를 입력받아 확률 형태로 결과를 제공한다. 또한 청년층을 대상으로 AI 의료에 대한 수용성을 조사하여 향후 확산 가능성을 평가하였다.
상세 분석
이 논문은 의료 현장에서 환자와 직접 대화할 수 있는 인공지능 시스템을 구현한다는 점에서 기존의 판독형 AI와 차별화된다. 시스템은 크게 세 부분으로 구성된다. 첫째, 마이크와 스피커를 이용한 실시간 음성 인식(ASR)·음성 합성(TTS) 모듈이다. 여기서는 오픈소스 Kaldi 기반의 음성 인식 엔진을 사용하고, 한국어 발음 사전을 맞춤형으로 구축해 인식 정확도를 92 % 이상으로 끌어올렸다. 둘째, 비침습적 센서 데이터 수집이다. 체중, 신장, 허리둘레, 혈압, 심박수 등 착용형 웨어러블 디바이스와 스마트폰 카메라를 통해 얻은 피부색·맥박 파형을 활용한다. 이러한 데이터는 개인 프라이버시를 침해하지 않으면서도 대사 상태를 추정하는 데 충분히 정보를 제공한다. 셋째, 딥러닝 기반 예측 모델이다. 다층 퍼셉트론(MLP)과 1‑D 컨볼루션 신경망(CNN)을 혼합한 하이브리드 구조를 채택했으며, 입력 특성은 정규화 후 64차원 임베딩으로 변환된다. 모델은 교차 엔트로피 손실함수와 Adam 옵티마이저로 학습되었고, 5‑fold 교차 검증을 통해 과적합을 방지하였다.
성능 평가는 정확도, 정밀도·재현율, ROC‑AUC 등 다중 지표를 사용했으며, 최종 모델은 AUC 0.87, 정확도 84 %를 기록했다. 특히 확률 출력은 캘리브레이션 플롯을 통해 실제 발생률과 높은 일치도를 보였으며, 이는 환자와 의료진이 위험도를 직관적으로 이해하는 데 기여한다.
수용성 조사에서는 18‑30세 대학생 200명을 대상으로 설문을 진행했으며, ‘AI가 친절하고 신뢰할 수 있다면 의료 접근성이 향상될 것’이라는 응답이 78 %에 달했다. 그러나 ‘개인 정보 보호’와 ‘오진 위험’에 대한 우려도 각각 45 %와 38 %로 나타나, 향후 시스템 설계 시 투명성 및 보안 강화가 필요함을 시사한다.
한계점으로는 데이터셋이 주로 한국인 성인에 국한돼 있어 인구통계학적 다양성 확보가 요구되고, 음성 인식 오류가 대화 흐름을 방해할 가능성이 있다. 또한 비침습적 센서만으로는 혈당 수치를 직접 측정할 수 없으므로, 실제 진단 단계에서는 추가 검증이 필요하다.
향후 연구 방향은 다국어·다문화 환경에 맞는 음성 모델 확장, 웨어러블 센서 종류 확대, 그리고 의료기관 연계 API를 통한 실시간 검증 시스템 구축이다. 이러한 발전이 이루어지면, 농촌·저인구 지역에서 의료 인력 부족을 보완하고, 초기 위험군 선별을 자동화함으로써 예방 의료의 효율성을 크게 향상시킬 수 있을 것으로 기대된다.
댓글 및 학술 토론
Loading comments...
의견 남기기