항공 안전 사고 보고서의 원인 식별을 위한 약지도 의미 어휘 구축

초록

본 논문은 항공 안전 사고 보고서에서 사고 원인(형성 요인)을 자동으로 식별하는 두 가지 방법을 제안한다. 의미 어휘는 Thelen‑Riloff의 Basilisk 프레임워크에 언어학적·알고리즘적 개선을 가해 자동 구축하고, 첫 번째 방법은 어휘 매칭 휴리스틱으로, 두 번째 방법은 학습 기반 텍스트 분류기로 구현한다. 실험 결과, 충분한 학습 데이터가 있을 때 학습 기반 방법이, 데이터가 부족할 때는 휴리스틱 방법이 모두 베이스라인보다 현저히 높은 정확도를 보였다.

상세 분석

이 연구는 항공 안전 사고 보고서라는 특수 도메인 텍스트에서 ‘형성 요인(Shaping Factors)’이라는 사전 정의된 원인 라벨을 자동으로 추출하는 문제에 접근한다. 기존 연구들은 주로 전문가가 수작업으로 만든 키워드 목록이나 규칙 기반 시스템에 의존했으며, 도메인 전문 용어와 비표준 표현이 빈번히 등장하는 보고서에서는 적용이 어려웠다. 논문은 두 가지 핵심 기여를 제시한다. 첫째, 의미 어휘(semantic lexicon)를 자동으로 구축하기 위해 Thelen과 Riloff가 제안한 Basilisk 프레임워크를 기반으로 하면서, (1) 어휘 후보 추출 단계에서 명사구와 동사구를 동시에 고려하도록 확장하고, (2) 패턴 기반 후보 선정 시 ‘의미적 유사도’를 정량화하기 위해 PMI와 TF‑IDF 가중치를 결합한 새로운 점수 함수를 도입하였다. 이러한 수정은 특히 항공 분야에서 흔히 사용되는 약어·축약어·전문 용어를 포착하는 데 효과적이었다. 둘째, 구축된 어휘를 활용한 두 가지 원인 식별 전략을 비교한다. 첫 번째는 ‘휴리스틱 매칭’ 방식으로, 보고서 텍스트에 어휘에 포함된 단어·구가 등장하면 해당 형성 요인으로 라벨링한다. 이 방법은 구현이 간단하고 학습 데이터가 거의 필요 없다는 장점이 있다. 두 번째는 ‘학습 기반’ 방식으로, 라벨이 부착된 보고서를 이용해 지도 학습 및 전이 학습(Transductive) 텍스트 분류 모델을 훈련한다. 여기서는 SVM, Logistic Regression, 그리고 그래프 기반 라벨 전파 알고리즘을 적용했으며, 다중 라벨 분류를 위해 One‑vs‑Rest 전략을 사용하였다. 실험에서는 1,200건 이상의 실제 ASRS 보고서를 10‑fold 교차 검증으로 평가했으며, 휴리스틱 방법은 평균 F1 점수 0.62, 학습 기반 방법은 충분한 훈련 샘플(>600건)에서 0.78까지 도달했다. 특히, 라벨이 희소한 ‘조종사 피로’와 같은 요인에서는 전이 학습이 기존 지도 학습보다 높은 재현율을 보였다. 오류 분석 결과, 어휘가 과도하게 일반화돼 비관련 문맥에 매칭되는 경우와, 보고서에 암시적으로만 언급된 원인(예: ‘날씨 악화’가 직접 언급되지 않음)은 모두 놓치는 한계가 있었다. 전체적으로 이 논문은 약지도(weakly supervised) 어휘 구축과 두 단계의 원인 식별 전략을 결합함으로써, 도메인 특화 텍스트에서 라벨링 비용을 크게 절감하면서도 높은 성능을 달성할 수 있음을 입증한다.