Image and Video Processing

'Image and Video Processing' 카테고리의 모든 글

총 7개의 글
시간순 정렬
단계별 심장 박동 듣기  생리학적 단계 인식 ECG 바이오메트리кс

단계별 심장 박동 듣기 생리학적 단계 인식 ECG 바이오메트리кс

이 논문은 IEEE에 출판을 위해 제출되었으며, 저작권 이전 후에는 이 버전이 더 이상 접근할 수 없을 수도 있음을 알립니다. 본 연구는 중국 국립자연과학연구재단의 지원을 받았습니다 (지원번호 62466038); 또한 Jiangxi 주 키 라벨러 이미지 처리 및 패턴 인식 연구소에서 지원받았으며, 그 외에도 Nanchang 항공대학교 정보센터의 고성능 컴퓨팅 서비스를 이용하였습니다. *(대응 저자 Lu Leng과 Ziyuan Yang*)

paper AI 요약
불확실성 인식 및 포기 가능 신경과 급성 무혈관 스토크 이미징 결정을 위한 설명 가능한 에이전트 AI 프레임워크

불확실성 인식 및 포기 가능 신경과 급성 무혈관 스토크 이미징 결정을 위한 설명 가능한 에이전트 AI 프레임워크

인공지능 모델은 특히 컴퓨터 단층 촬영 및 자기 공명 영상 기술을 활용한 급성 혈관 Occlusion 뇌졸중 영상 분석에서 강력한 잠재력을 보여주고 있다. 그러나 대부분의 기존 접근 방식들은 불확실성을 명시적으로 인지하지 않거나 모호한 조건 하에서 구조화된 중단 메커니즘을 갖추지 않는 블랙박스 예측기를 운영한다. 이 한계는 고위험 응급 영상의학 환경에서 심각한 안전 및 신뢰성 문제를 일으킨다. 본 논문에서는 급성 혈관 Occlusion 뇌졸중 영상 분석에 대한 불확실성을 인지하고 중단 가능한 의사결정 지원을 위한 설명 가능하고 에이전트 기반 AI 프레임워크를 제안한다. 이 프레임워크는 모듈형 에이전트 파이프라인을 따르며, 여기서 인식 에이전트는 병변 감지 영상 분석을 수행하고, 불확실성 추정 에이전트는 슬라이스 수준의 예측 신뢰도를 계산하며, 의사결정 에이전트는 사전 정의된 불확실성 임계값에 따라 예측을 내보내거나 중단할지 결정한다. 이 프레임워크는 기존의 뇌졸중 영상 시스템들이 주로 분할 또는 분류 정확도를 향상시키는데 초점을 맞추는 것과 달리, 임상 안전성, 투명성 및 임상 의사와 일치하는 의사결정 행동을 명시적으로 우선시한다. 대표적인 뇌졸중 영상 시나리오에 대한 질적 및 사례 기반 분석은 진단적으로 모호한 지역과 정보가 적은 슬라이스에서 불확실성에 따른 중단이 자연스럽게 발생함을 보여준다. 이 프레임워크는 예측 및 중단 결정을 지원하기 위해 시각적 설명 메커니즘을 통합하여 기존의 불확실성을 인식한 의료 영상 시스템의 주요 한계를 해결한다. 성능 벤치마크를 도입하는 것이 아닌, 이 연구는 안전하고 신뢰할 수 있는 의료 이미징 AI 시스템 개발을 위한 필수 설계 원칙으로 에이전트 제어, 불확실성 인식 및 선택적 중단을 제시한다.

paper AI 요약
생명을 구하는 플라센타 아크레타 딥러닝

생명을 구하는 플라센타 아크레타 딥러닝

플라세น타 아크레타 스펙트럼(PAS)은 자궁벽으로의 비정상적인 태반 침습을 포함하는 산부인과에서 생명을 위협하는 합병증입니다. 모성 및 신생아 위험성을 줄이기 위해서는 조기에 정확한 임신 중 진단이 필수적입니다. 본 연구의 목적은 다양한 영상 모달리티를 통합하여 PAS 검출을 향상시키는 딥러닝 프레임워크를 개발하고 검증하는 것입니다. 3차원 자기 공명 영상(MRI)과 2차원 초음파(US) 스캔을 결합한 중간 특성 수준 융합 아키텍처를 사용하여 다중 모달 딥러닝 모델을 설계하였습니다. 체계적인 비교 분석 후, MRI용 3D DenseNet121-비전 트랜스포머와 US용 2D ResNet50을 단일 모달 특성 추출기로 선택했습니다. 1,293개의 MRI 및 1,143개의 US 스캔으로 구성된 정제 데이터셋을 사용하여 단일 모달 모델을 훈련하고, 다중 모달 모델 개발과 평가를 위해 환자 매칭 MRI-US 스캔 쌍 샘플을 분리했습니다. 독립적인 테스트 세트에서 다중 모달 융합 모델은 92.5%의 정확도와 수신기 작동 특성 곡선(AUC) 아래 넓이인 0.927의 우수한 성능을 달성하여 MRI만(82.5%, AUC 0.825) 및 US만(87.5%, AUC 0.879) 모델보다 더 나은 결과를 보였습니다. MRI와 US 특성을 통합하면 진단 정보가 서로 보완되어 임신 중 위험 평가를 향상시키고 환자 결과를 개선할 수 있는 강력한 가능성을 보여줍니다.

paper AI 요약
유니크롭  확장 가능한 작물 수확량 예측을 위한 다소스 데이터 공학 파이프라인

유니크롭 확장 가능한 작물 수확량 예측을 위한 다소스 데이터 공학 파이프라인

농작물 수확량 예측은 전 세계 식량 안보와 경제적 안정에 중추적인 역할을 하지만, 기후 변화, 인구 증가 및 불규칙한 날씨 패턴으로 인해 점점 더 큰 압력을 받고 있습니다. 정확한 농작물 수확량 예측은 정부 정책, 공급망 안정화, 농업 기업 물류 그리고 농민들의 관수, 비료 사용 및 수확 일정에 대한 결정을 위한 정보를 제공하는데 필수적입니다. 이러한 필요성은 한 지역의 생산 충격이 국제 시장 전체로 급속히 확산되는 경향으로 인해 더욱 절실해졌습니다. 지구관측(EO), 농기상학 및 기계 학습(ML) 분야에서 이루어진 주요 진전은 데이터 주도의 농업 예측 가능성을 크게 확장시켰습니다. 개방형 EO 프로그램인 코페르니쿠스 센티넬 임무는 높은 공간적 및 시간적 해상도로 광학, 레이더 및 대기 측정을 제공하며 작물 상태를 상세하게 모니터링할 수 있도록 합니다. MODIS의 장기간 식생 지수는 큰 지역에서 식물학적 분석을 가능하게 하며, ERA5-Land와 NASA POWER 등 기후 데이터셋은 온도, 강수량, 복사량, 습도 및 바람과 같은 농업 생산성의 주요 촉진 요인에 대한 전 세계적으로 일관된 정보를 제공합니다. 또한, SoilGrids와 SRTM의 보조 환경 데이터셋은 토양 구조, 탄소 함량, pH, 고도, 경사 및 미기후적 영향을 설명합니다. 그러나 이러한 진전에도 불구하고 농작물 수확량 예측 모델의 실용적인 개발은 지속적으로 데이터 공학적 병목 현상에 제한받고 있습니다. 대부분의 연구는 특정 작물, 지역 또는 시간대를 대상으로 맞춤형 파이프라인을 구축하는데, 이 과정에서 다양한 데이터셋을 통합하고 공간 및 시간 해상도를 조화시키기 위한 수작업이 많이 필요합니다. 심지어 최신 다중 모드의 심층 학습 접근 방식조차 복잡한, 수작업이 필요한 전처리 워크플로우에 의존하고 있습니다. 이러한 문제를 해결하기 위해 **UniCrop**을 소개합니다. UniCrop는 농작물 수확량 예측을 위한 다중 출처 환경 데이터의 획득, 조화 및 변환을 자동화하는 보편적이고 구성 설정에 따른 데이터 파이프라인입니다. UniCrop은 필요한 변수 지정과 구현을 분리하여 사용자가 단순한 구성 파일을 수정함으로써 새로운 작물이나 지역에 파이프라인을 적응시킬 수 있도록 합니다.

paper AI 요약
자연스러운 합성  자연적인 외관 유지 이미지 스티칭

자연스러운 합성 자연적인 외관 유지 이미지 스티칭

이 논문은 파라llx와 깊이 변화로 특징지어지는 난관 많은 실제 환경에서 구조적 정확성을 우선시하는 기하학 중심 이미지 스테칭 접근 방식인 SENA(SEamlessly NAtural)를 소개한다. 전통적인 이미지 스테칭은 동차변환 대상을 사용하지만, 이 엄격한 평면 가정은 장면의 깊이가 큰 듀얼 카메라 구조에서 종종 실패하여 가시적 왜곡과 구형 부풀림 등의 문제가 발생한다. SENA는 세 가지 핵심 기여를 통해 이러한 근본적인 한계를 해결한다. 첫째, 전역 아핀 초기화와 로컬 아핀 개선 및 매끄러운 자유 형태 변형을 결합하는 계층적 아핀 기반 왜곡 전략을 제안한다. 이 설계는 현지 모양, 평행성, 측면 비율을 유지함으로써 동차변환 모델에 의해 일반적으로 발생하는 환시 구조적 왜곡을 피한다. 둘째, RANSAC 필터링된 특징 대응의 깊이 일관성을 통해 직접 패럴랙스 최소화 영역을 감지하는 기하학 중심 적절한 영역 탐지 메커니즘을 도입한다. 세미어틱 분할에 의존하지 않는다. 셋째, 이 적절한 영역 위에 앵커 기반 경계선 자르기 및 분할을 수행하여 이미지 쌍 간의 일대일 기하학적 대응을 강제함으로써 최종 팬오라마에서 유령 효과, 중복 및 번짐 아트팩트를 효과적으로 제거한다. 난관 많은 데이터셋에 대한 광범위한 실험은 SENA가 선두 동차변환 기반 방법들과 비교할 수준의 정렬 정확도를 달성하면서 모양 보존, 텍스처 무결성 및 전체적인 시각적 현실감과 같은 중요한 시각적 메트릭에서 그들을 크게 능가함을 보여준다.

paper AI 요약
제한적인 의학적 어노테이션을 갖춘 다_SCALE-인식 적응형 감독 네트워크

제한적인 의학적 어노테이션을 갖춘 다_SCALE-인식 적응형 감독 네트워크

우리는 제한적인 어노테이션 조건에서도 성능을 향상시키기 위해 SASNet, 즉 이중 분기 반감독 세분화 네트워크를 제안합니다. 스케일 인식 적응 가중 전략은 선택적으로 픽셀 단위 결과를 합쳐 더 신뢰할 수 있는 집합 예측을 생성합니다. 또한 관점 변동 증강 메커니즘은 다양한 관점과 스케일에 따른 어노테이션 차이를 시뮬레이션하여 견고성과 세분화 정확도를 향상시킵니다.

paper AI 요약

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키