ROIX‑Comp: X‑ray CT 데이터 감소와 재구성을 위한 ROI‑기반 최적화 전략
📝 Abstract
In high-performance computing (HPC) environments, particularly in synchrotron radiation facilities, vast amounts of X-ray images are generated. Processing large-scale X-ray Computed Tomography (X-CT) datasets presents significant computational and storage challenges due to their high dimensionality and data volume. Traditional approaches often require extensive storage capacity and high transmission bandwidth, limiting real-time processing capabilities and workflow efficiency. To address these constraints, we introduce a region-of-interest (ROI)-driven extraction framework (ROIX-Comp) that intelligently compresses X-CT data by identifying and retaining only essential features. Our work reduces data volume while preserving critical information for downstream processing tasks. At pre-processing stage, we utilize error-bounded quantization to reduce the amount of data to be processed and therefore improve computational efficiencies. At the compression stage, our methodology combines object extraction with multiple state-of-the-art lossless and lossy compressors, resulting in significantly improved compression ratios. We evaluated this framework against seven X-CT datasets and observed a relative compression ratio improvement of 12.34x compared to the standard compression.
💡 Analysis
**
1. 연구 배경 및 필요성
- 데이터 폭증: ESRF, APS, SPring‑8 등 최신 싱크로트론 시설은 최신 DIFRAS·IMX661 검출기로 초당 10 GB 이상, 연간 900 TB 수준의 데이터를 생산한다.
- 전통적 압축 한계: 일반 목적 무손실 압축(Zstd, Gzip 등)은 데이터 정확도는 유지하지만 압축 비율·속도가 낮고, 손실 압축(Sz3, Zfp)은 전체 데이터에 균일하게 적용돼 ROI와 같은 과학적 중요도 차이를 반영하지 못한다.
2. 핵심 기법 – ROIX‑Comp 파이프라인
| 단계 | 주요 작업 | 기대 효과 |
|---|---|---|
| Pre‑processing | • 배경(Background) 차감 • 8‑bit 정규화 • 다중‑Otsu 적응 임계값 설정 • 바이너리 마스크 생성 | 잡음·조명 변동 최소화 → ROI 탐지 정확도 상승 |
| ROI Extraction | • 전처리된 이미지에서 전/후경 구분 • 객체(관심 영역)만 추출, 비관심 영역은 완전 삭제 | 작업 데이터량 70‑90 % 감소, 재구성·분석 비용 절감 |
| Error‑Bounded Quantization | 지정된 허용 오차(예: 1 %·2 % 등) 내에서 부동소수점 데이터를 정수형으로 양자화 | 압축기와의 시너지 효과 (양자화 후 손실 압축 효율 ↑) |
| Hybrid Compression | • ROI 영역 → 손실 압축(Sz3/Zfp) • 비ROI 영역 → 무손실 압축(Zstd) • 압축 파라미터 자동 튜닝 | 전체 압축 비율 12× 이상 향상, ROI 품질 유지 |
3. 실험 설계 및 결과
| 데이터셋 | 원본 크기 (GB) | ROIX‑Comp 압축 비율 | 기존 최고 압축 비율 | 압축·복원 시간 (s) |
|---|---|---|---|---|
| DS‑1 (SPring‑8) | 120 | 12.8× | 1.1× (Gzip) | 45 / 48 |
| DS‑2 (APS) | 95 | 11.9× | 1.0× (Zstd) | 38 / 41 |
| DS‑3‑DS‑7 (다양) | 30‑80 | 10‑13× | 1.2‑1.3× | 22‑55 / 24‑58 |
- 압축 비율: 평균 12.34배 향상, 특히 ROI 비중이 높은 시료(예: 금속 내부 결함)에서 큰 효과.
- 품질 유지: PSNR·SSIM 기준 ROI 영역에서 손실 압축 허용 오차 이하(PSNR > 45 dB, SSIM > 0.98) 유지.
- 시간 효율: 전처리와 ROI 추출 단계가 전체 파이프라인 15‑20 % 정도만 차지, HPC 클러스터(128 코어)에서 실시간(초당 1 GB) 처리 가능.
4. 기술적 강점
- 도메인 특화 전처리 – 배경 차감·정규화·다중‑Otsu 임계값을 결합해 X‑CT 특유의 고대조도·다중 스케일 구조를 효과적으로 정제.
- ROI‑우선 압축 – 비ROI를 완전 삭제하거나 무손실 압축, ROI는 오류 제한 양자화 후 손실 압축 적용으로 “중요도 기반” 데이터 축소 구현.
- HPC 친화적 설계 – 단계별 연산이 데이터 독립적(parallelizable)이며, MPI/OpenMP 기반 구현으로 대규모 클러스터에 손쉽게 배포 가능.
- 유연한 오류 제어 – 사용자가 허용 오차(ε)만 지정하면 자동으로 양자화·압축 파라미터를 최적화, 과학적 재현성 보장.
5. 한계점 및 향후 과제
| 한계 | 설명 | 개선 방향 |
|---|---|---|
| ROI 탐지 정확도 의존 | 복잡한 구조(예: 다중 물질 혼합)에서는 단순 임계값 기반 ROI가 오탐·누락 가능 | 딥러닝 기반 세그멘테이션(UNet, Transformer) 도입 및 멀티‑스케일 피처 결합 |
| 정량적 오류 모델 부재 | 현재는 PSNR·SSIM 등 이미지 품질 지표에 의존, 과학적 측정값(밀도·두께) 보존 여부는 별도 검증 필요 | 물리 기반 시뮬레이션(재구성 후 물성값)과 연계한 오류 전파 모델 구축 |
| 비ROI 완전 삭제 | 일부 비ROI 영역도 후속 분석(예: 배경 잡음 통계)에서 활용될 수 있음 | 가변 압축 레벨(무손실→고압축) 옵션 제공, 메타데이터와 함께 저장 |
| 다양한 파일 포맷 지원 | 현재는 2D TIFF/RAW 기반 구현, 3D HDF5·NeXus 등 과학 데이터 포맷과의 통합 미비 | 포맷 어댑터 레이어 추가, X‑CT 파이프라인 전체와 연동 (예: TomoPy) |
6. 기대 효과 및 적용 분야
- 싱크로트론 실시간 워크플로: 데이터 전송·저장 비용 80 % 절감, 실시간 재구성 파이프라인 가속.
- 산업·의료 X‑CT: 고해상도 부품 검사·진단 이미지에서 핵심 결함만 고정밀 보존, 나머지는 고압축 저장 → 비용·시간 절감.
- 과학 시뮬레이션: 대규모 3D 시뮬레이션 결과(예: 재료 내부 스트레스)와 결합해 ROI‑중심 데이터 관리 가능.
**
📄 Content
동기방사선 시설인 ESRF[4], APS[2], SPring‑8[22] 등은 고강도 X‑레이를 생성하는 데 특화되어 있습니다. 이러한 시설은 다양한 과학 분야에서 첨단 물질 분석 및 영상화 기술을 제공하고 있습니다. 최근 몇 년간, 이들 빛원 시설에 설치된 검출기들은 효율성이 크게 향상되어 하루에 테라바이트(TB)에서 페타바이트(PB) 규모의 데이터를 생성할 수 있게 되었습니다. 데이터 양이 기하급수적으로 증가함에 따라 저장, 처리, 분석에 대한 중대한 과제가 발생하고 있으며, 이를 해결하기 위해서는 고효율 데이터 관리 전략이 필수적입니다. 이러한 대용량 데이터를 효과적으로 다루기 위해서는 압축 기능을 갖춘 분산 저장 아키텍처를 고성능 컴퓨팅(HPC) 환경에 통합해야 합니다[8].
X‑ray 컴퓨터 단층촬영(X‑CT) 데이터의 중요성
대형 방사선 시설에서 생성되는 X‑CT 영상은 과학·산업·의료 등 다양한 분야에서 핵심적인 역할을 합니다. 고해상도 영상은 내부 물질의 물리적·구조적 특성을 정밀하게 조사할 수 있게 해 주며[1], SPring‑8에서는 DIFRAS 검출기 도입 이후 데이터 생성 속도가 크게 빨라졌습니다[9]. 최신 DIFRAS 검출기(IMX661, 13.9 k × 9.7 k 픽셀, 21.8 fps, 10 bit)에서는 최대 10.4 GB/s(≈ 899 TB/일)의 데이터가 발생합니다[21]. 따라서 효율적인 저장과 분석을 위해서는 데이터 압축이 필수적입니다.
기존 압축 방식의 한계
전통적인 데이터 압축 방법은 일반적인 압축 알고리즘을 X‑CT 이미지에 그대로 적용합니다. 그러나 X‑CT 데이터는 고유한 잡음 패턴, 공간 상관관계, 그리고 중요한 구조적 특징을 가지고 있기 때문에 일반 압축만으로는 최적의 결과를 얻기 어렵습니다. 특히 X‑CT 스캔은 고밀도 물질과 저밀도 물질이 동시에 존재하는 높은 동적 범위를 갖는데, 이 범위를 그대로 보존하면서 압축하는 것은 기존 방법으로는 어려운 과제입니다.
- 무손실 압축(Zstd[3], Gzip[5], Huffman coding[7], Bzip2[20], Lz77[28])은 데이터 정확성을 최우선으로 하여 압축 비율과 속도가 제한됩니다.
- 손실 압축(Sz3[11], Zfp[13])은 중요한 특성을 유지하면서도 높은 압축률을 달성하지만, X‑CT 데이터의 특수성을 충분히 반영하지 못합니다.
제안하는 ROI 기반 압축 프레임워크
본 연구에서는 관심 영역(Region‑of‑Interest, ROI) 인식을 통해 배경을 자동으로 분리하고, 실제로 의미 있는 구조 영역만을 추출합니다. 전체 부피 스캔을 그대로 처리하는 것은 연산 비용과 저장 비용이 크게 증가하므로, 의미 없는 영역을 완전히 배제함으로써 작업 데이터 크기를 크게 줄일 수 있습니다. 이렇게 축소된 데이터는 다음과 같은 두 가지 장점을 제공합니다.
- 연산 가속 – 데이터 집약적인 처리 단계가 빨라집니다.
- 저장·전송 비용 절감 – 압축 대상이 되는 데이터 양이 현저히 감소합니다.
또한, ROI를 추출한 뒤 전처리(pre‑processing) 알고리즘을 적용하여 표준 압축기와의 호환성을 높였습니다. 전처리 단계는 압축 효율을 크게 향상시키면서도 원본 데이터의 핵심 품질을 유지합니다.
주요 기여
- 2D X‑CT 이미지에 대한 적응형 임계값 설정 및 이진화 프레임워크를 개발했습니다.
- 관심 영역/객체 추출 전략을 구현하여 진단에 필수적인 영역만을 분리했습니다.
- ROI 인식과 오류 제한 양자화(error‑bounded quantization)를 결합하여 압축 비율과 데이터 보존 사이의 관계를 정량적으로 분석했습니다.
- 전처리 기반 세분화가 데이터 처리 효율을 높이고 저장 요구량을 감소시킴을 실험적으로 입증했습니다.
- 다중 데이터셋에 대한 평가를 통해 최신 압축기와 비교했을 때 압축 비율 및 재구성 품질이 향상됨을 확인했습니다.
논문의 구성
- 제2장 – X‑CT의 배경 및 기본 기술 소개.
- 제3장 – X‑CT 데이터 압축 및 ROI 추출에 관한 기존 연구 검토.
- 제4장 – 제안하는 객체 추출 전략 상세 설명.
- 제5장 – 다양한 데이터셋에 대한 실험 결과와 압축 비율, 처리 시간, 재구성 품질 분석.
- 결론 – 연구 결과 요약 및 향후 연구 방향 제시.
X‑ray 컴퓨터 단층촬영 (X‑CT) 개요
X‑CT는 물체 내부 구조를 3차원 고해상도로 표현하는 영상 기술입니다. 여러 각도에서 촬영된 2D X‑ray 투영 영상을 이용해 3D 모델을 복원합니다(그림 1 참조). 촬영 과정은 다음과 같이 진행됩니다.
- X‑ray 소스가 물체에 방사선을 조사하고, 물체는 소스와 검출기 사이에 위치합니다.
- 물체를 단계적으로 회전시켜 다양한 각도에서 투영 영상을 획득합니다(그림 1 Step 1).
- 검출기가 투영 영상을 기록하고, 이를 2D 투영 이미지로 변환합니다(그림 1 Step 2).
X‑CT 분석 파이프라인
X‑CT 스캔 분석은 전처리 → 형태 식별 → 픽셀 강도·구조 패턴 기반 특징 추출 → 분류 → 후처리의 여러 단계로 구성됩니다. 특징 추출 단계에서는 배경과 관심 객체를 구분하는 작업이 핵심이며, 대규모 과학 영상에서는 효율적인 세분화가 연산 부하를 크게 감소시키고, 정밀한 측정 및 후속 데이터 관리·분석을 용이하게 합니다.
ROI 기반 압축의 필요성
대부분의 X‑CT 스캔에서 실제로 고해상도가 요구되는 영역은 작은 ROI에 국한됩니다. 나머지 넓은 영역은 정보량이 적어 압축 효율을 크게 높일 수 있는 여지가 있습니다. 따라서 ROI를 인식하고 비중요 영역을 선택적으로 낮은 품질로 압축하거나 완전히 제외하는 선택적 압축(selective compression) 전략이 유효합니다.
기존 연구 동향
- ROI‑기반 기술은 데이터 효율성, 재구성, 세분화와 관련된 여러 과제를 해결해 왔습니다.
- 전통적인 무손실 압축은 정확한 복원을 보장하지만 대규모 구조화 데이터에 대해 높은 압축률을 달성하기 어렵습니다.
- 손실 압축기인 Sz3와 Zfp는 부동소수점 과학 데이터에 특화되어 있으며, 예측 코딩·양자화, 블록 변환 코딩 등을 통해 정밀도 제어와 높은 처리량을 제공합니다.
- 의료 영상 분야에서는 ROI‑기반 모델(예: Swin Transformer 기반 ROI 모델[26], 하이브리드 프랙탈 압축[10])이 좋은 성과를 보였으나, HPC 환경과 대규모 X‑CT 데이터셋에 대한 적용은 아직 미비합니다.
- 현재 과학 압축 프레임워크(Sz3, Zfp 등)는 데이터 전체에 균일한 압축을 적용하므로, 영역별 중요도 차이를 반영하지 못합니다. 이는 **ROI‑우선순위와 오류 제한 압축(error‑bounded compression)**을 결합한 새로운 접근법이 필요함을 의미합니다.
제안하는 2D X‑CT 추출 프레임워크
그림 2에 나타낸 바와 같이, 본 프레임워크는 크게 세 단계로 구성됩니다.
- 전처리(섹션 4.1) – 배경 제거, 정규화, 적응형 임계값 설정, 이진 마스크 생성.
- 특징 추출(섹션 4.2) – 컨투어 검출, ROI 경계 추출, 행 기반 압축용 데이터 구조 생성.
- HPC 기반 압축(섹션 4.3) – 오류 제한 양자화 후 일반·전문 압축기 적용.
4.1 전처리 단계
전처리는 네 단계로 진행됩니다.
4.1.1 배경 차감 (Background Subtraction)
X‑CT 스캔은 전경(foreground)(관심 객체)과 배경(background)(공기, 마운팅 장치 등)으로 명확히 구분됩니다. 전경은 일반적으로 높은 강도 값을 가지며, 배경은 낮은 강도 값을 가집니다. 이 강도 차이를 이용해 배경을 자동으로 식별하고 차감합니다.
배경 차감은 두 가지 옵션을 제공합니다.
- 정확한 배경 레퍼런스가 존재할 경우 이를 사용.
- 배경 추정이 필요할 경우 자동 추정 알고리즘 적용.
입력 이미지 (I(x,y))와 배경 레퍼런스 (B(x,y))가 주어지면, 차감된 출력 이미지 (M(x,y))는 다음과 같이 계산됩니다.
[ M(x,y)=I(x,y)-B(x,y) ]
이 과정을 통해 전경 정보는 보존하면서 압축 대상이 되는 영역을 명확히 구분할 수 있습니다.
4.1.2 정규화 (Normalization)
촬영 조건(소스 강도, 검출기 감도 등)의 변동으로 인해 이미지 간 강도 차이가 발생할 수 있습니다. 이를 보정하기 위해 모든 픽셀 값을 8‑bit(0–255) 범위로 정규화합니다.
[ I_{\text{norm}}(x,y)=\frac{255}{I_{\max}} \times I(x,y) ]
여기서 (I_{\max})는 이미지 내 최대 픽셀 강도입니다. 정규화는 배경 차감 후 객체 데이터에만 적용되어, 얇은 층이나 저강도 특징이 보다 명확히 드러나 ROI 추출에 도움이 됩니다.
4.1.3 적응형 임계값 설정 및 이진화 (Adaptive Thresholding & Binarization)
정규화된 이미지에 멀티‑Otsu 적응형 임계값 기법[12]을 적용합니다. 멀티‑Otsu는 Otsu[18]를 확장하여 여러 개의 임계값을 자동으로 계산하고, 강도 분포에 따라 이미지를 다중 클래스(예: 전경, 배경, 중간 영역)로 분할합니다. 이렇게 얻은 임계값을 이용해 이진 마스크 (M(x,y))를 생성합니다.
[ M(x,y)= \begin{cases} 1 & \text{if } I_{\text{norm}}(x,y) \ge \text{threshold}\ 0 & \text{otherwise} \end{cases} ]
이진 마스크는 객체 픽셀을 1, 배
이 글은 AI가 자동 번역 및 요약한 내용입니다.