직업추천을 위한 선호와 자격 분리와 제약 기반 이중 관점 추론
초록
JobRec은 후보자의 지원 의향(선호)과 고용주의 자격 요건(자격)을 별도로 모델링하고, 라그랑주 제약 최적화를 통해 두 관점을 동시에 고려한 추천 정책을 구현한다. 통합 의미 정렬 스키마(USAS)로 이력서와 채용공고를 4계층 구조로 정렬하고, 두 단계 협업 학습으로 선호·자격 전문가를 학습한 뒤 정책 레이어에서 명시적 자격 기준을 제어한다. 전문가 검증 합성 데이터와 실험을 통해 기존 방법보다 정확도와 정책 제어성을 크게 향상시킨다.
상세 분석
JobRec은 기존 채용 매칭 시스템이 “매치” 혹은 “채용”이라는 단일 라벨에 선호와 자격을 혼합함으로써 발생하는 감독 혼선과 채용 퍼널 검열 문제를 근본적으로 해결한다. 첫 번째 핵심 기여는 Unified Semantic Alignment Schema(USAS)이다. USAS는 후보와 직무를 ‘기본 메타데이터’, ‘역량·자격’, ‘운영상 제약·커밋먼트’, ‘심층 의미·경험’ 네 개의 계층으로 구조화하여, 정형·비정형 정보를 대칭적으로 정렬한다. 이를 통해 LLM이 각 계층별 특징을 명확히 인식하고, 선호와 자격을 별도 추론할 수 있는 입력 형태를 제공한다.
두 번째 기여는 이중 관점 추론을 위한 문제 분해이다. 선호 점수 s_pref는 후보의 관심과 실무 가능성을, 자격 점수 s_qual은 학력·경력·스킬 등 자격 기준 충족 여부를 각각 확률적으로 예측한다. 이렇게 분리함으로써 부정적 결과가 “관심 부족”인지 “자격 미달”인지 구분되지 않는 기존의 라벨 혼합 문제를 피한다.
세 번째 핵심은 라그랑주 기반 정책 정렬이다. 최적화 목표를 “선호 최대화 + 자격 최소 기준(ε) 만족”으로 설정하고, 라그랑주 승수 λ를 도입해 제약 위반 시 페널티를 자동 조정한다. 최종 스코어는 s_final = s_pref + λ·(s_qual−ε) 로 계산되며, λ와 ε 값을 조절함으로써 고자격·저관심, 저자격·고관심 등 비효율적인 매칭을 억제하고, 운영 상황에 맞는 정책을 손쉽게 전환할 수 있다.
학습 단계는 두 단계 협업 훈련(Two‑Stage Cooperative Training)으로 구성된다. 1단계에서는 공유 트랜스포머 인코더와 두 개의 헤드로 s_pref와 s_qual을 동시에 학습하되, 동적 가중치 η₁(t), η₂(t)로 손실 균형을 맞춘다. 2단계에서는 인코더를 고정하고 정책 파라미터와 λ만 업데이트해 라그랑주 목적을 직접 최적화한다. 이는 전문가 라벨이 부족한 상황에서도 안정적인 수렴을 가능하게 한다.
데이터 측면에서 논문은 전문가‑인‑루프 합성 데이터 파이프라인을 제시한다. USAS에 기반해 구조화된 후보·직무 프로필을 샘플링하고, 규칙 기반 초기 라벨링 후 도메인 전문가가 검증·수정한다. 이렇게 만든 데이터셋은 선호·자격 라벨이 명시적으로 구분돼 있어, 기존의 관찰 라벨에 비해 학습 효율과 평가 신뢰도가 크게 향상된다.
실험 결과는 공개된 베이스라인(전통적 키워드 매칭, 단일‑목표 LLM 기반 모델 등) 대비 Top‑K 정확도, NDCG, 그리고 정책 제어 지표에서 일관된 우위를 보인다. 특히 λ와 ε를 변동시켜 후보 중심·고용주 중심 정책을 전환했을 때, 성능 저하 없이 원하는 매칭 특성을 구현할 수 있음을 입증한다. 전체적으로 JobRec은 의미론적 정렬, 이중 관점 분리, 제약 기반 최적화를 결합해 채용 매칭의 정확성, 해석 가능성, 운영 유연성을 동시에 개선한 혁신적 프레임워크라 할 수 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기