아이템 영역 기반 패션 스타일 분류 네트워크

읽는 시간: 2 분
...

📝 원문 정보

  • Title: Item Region-based Style Classification Network (IRSN): A Fashion Style Classifier Based on Domain Knowledge of Fashion Experts
  • ArXiv ID: 2512.20088
  • 발행일: 2025-12-23
  • 저자: Jinyoung Choi, Youngchae Kwon, Injung Kim

📝 초록 (Abstract)

패션 스타일 분류는 동일 스타일 내 시각적 변동이 크고, 시각적으로 유사한 스타일이 존재한다는 점에서 어려운 과제이다. 스타일은 전체적인 외관뿐 아니라 개별 아이템의 속성 및 아이템 간 조합에 의해 표현된다. 본 연구에서는 아이템 영역별 특징과 그 조합을 분석함으로써 스타일을 효과적으로 구분하는 아이템 영역 기반 패션 스타일 분류 네트워크(IRSN)를 제안한다. IRSN은 아이템 영역 풀링(IRP)을 통해 각 아이템 영역의 특징을 추출하고, 이를 개별적으로 분석한 뒤 게이트형 특징 융합(GFF)으로 결합한다. 또한, 대규모 이미지‑텍스트 데이터셋으로 사전 학습된 일반 특징 추출기와 패션 도메인에 특화된 특징 추출기를 결합한 듀얼 백본 구조를 도입해 특징 추출 능력을 강화하였다. 실험 결과, EfficientNet, ConvNeXt, Swin Transformer 등 6가지 백본에 IRSN을 적용했을 때 FashionStyle14 데이터셋에서 평균 정확도가 6.9% 상승(최대 14.5% 상승), ShowniqV3 데이터셋에서 평균 7.6% 상승(최대 15.1% 상승)했다. 시각화 분석 또한 IRSN 모델이 유사 스타일 간 차이를 더 잘 포착함을 보여준다.

💡 논문 핵심 해설 (Deep Analysis)

Figure 1
패션 스타일 분류는 전통적인 이미지 분류와는 다른 고유의 난이도를 가지고 있다. 같은 스타일이라도 색상, 소재, 실루엣, 착용 상황 등에 따라 시각적 변동이 크게 나타나며, 반대로 서로 다른 스타일이 색상이나 패턴 면에서 거의 구분되지 않을 수도 있다. 이러한 문제를 해결하기 위해 기존 연구들은 주로 전역적인 이미지 특징에 의존하거나, 라벨 수준의 스타일 정보를 강화하는 방향으로 접근했다. 그러나 전역 특징만으로는 “아이템 간 관계”와 “아이템 별 세부 속성”을 충분히 반영하기 어렵다. 예를 들어, ‘스트리트 캐주얼’과 ‘스포츠 캐주얼’은 전체적인 색감이나 배경이 비슷할 수 있지만, 상의와 하의의 조합, 신발 종류 등에 따라 구분된다. 따라서 아이템 단위의 지역적 특징을 명시적으로 추출하고, 이들 간의 상호작용을 모델링하는 것이 핵심이다.

IRSN은 이러한 요구를 충족시키기 위해 두 가지 핵심 모듈을 도입한다. 첫 번째는 Item Region Pooling(IRP)이다. 이는 사전 정의된 아이템 마스크(예: 상의, 하의, 신발, 액…

📄 논문 본문 발췌 (Translation)

...(본문 내용이 길어 생략되었습니다. 사이트에서 전문을 확인해 주세요.)

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키