멀티장르 게임과 머신러닝을 활용한 소프트웨어 개발자 적합성 예측
📝 원문 정보
- Title: MentalGame: Predicting Personality-Job Fitness for Software Developers Using Multi-Genre Games and Machine Learning Approaches
- ArXiv ID: 2601.01206
- 발행일: 2026-01-03
- 저자: Soroush Elyasi, Arya VarastehNezhad, Fattaneh Taghiyareh
📝 초록 (Abstract)
전통적인 진로 지도와 인재 선발에서 사용되는 자기보고식 성격 검사들은 응답 편향, 피로, 의도적 왜곡 등에 취약하다. 게임 기반 평가는 플레이 중에 나타나는 암묵적 행동 신호를 포착함으로써 이러한 한계를 극복할 수 있는 대안으로 주목받고 있다. 본 연구는 다중 장르의 시리어스 게임 프레임워크와 머신러닝 기법을 결합하여 소프트웨어 개발 직무 적합성을 예측하는 모델을 제안한다. 체계적 문헌 검토와 현직 소프트웨어 엔지니어를 대상으로 한 실증 연구를 통해 개발자에게 중요한 성격·행동 특성을 도출하였다. 문제 해결, 계획 수립, 적응성, 끈기, 시간 관리, 정보 탐색 등을 유발하도록 설계된 맞춤형 모바일 게임에서 세밀한 게임플레이 이벤트 데이터를 수집하고, 두 단계의 모델링 전략을 적용해 오직 게임 기반 행동 특징만으로 적합성을 예측하였다. 실험 결과, 모델은 최대 97%의 정밀도와 94%의 정확도를 달성하였다. 적합한 후보자는 퍼즐 게임에서 높은 승률, 부가 과제 수행 빈도, 메뉴 탐색 횟수 증가, 일시정지·재시도·포기 행동 감소 등 뚜렷한 플레이 패턴을 보였다. 이러한 결과는 명시적 성격 검사가 없이도 게임 중에 포착되는 암묵적 행동 흔적이 소프트웨어 개발자 적합성을 예측하는 데 유효함을 시사하며, 시리어스 게임이 확장 가능하고 흥미로운 경력 평가 도구로 활용될 수 있음을 입증한다.💡 논문 핵심 해설 (Deep Analysis)

세 번째 단계는 데이터 전처리와 특징 추출이다. 원시 이벤트 로그는 150여 개의 파생 변수(예: 평균 레벨 완료 시간, 퍼즐 승률, 사이드 챌린지 참여 비율, 메뉴 전환 빈도, 일시정지 평균 지속시간 등)로 변환되었으며, 차원 축소를 위해 상관관계 분석과 L1 정규화를 적용하였다. 이후 두 단계 모델링 전략을 채택하였다. 첫 번째 단계에서는 랜덤 포레스트와 XGBoost 같은 앙상블 모델을 사용해 후보자 적합성(‘적합/비적합’)을 2‑클래스 분류하였다. 두 번째 단계에서는 베이지안 최적화를 통해 하이퍼파라미터를 미세 조정하고, 최종 모델은 스택킹 방식으로 결합하였다.
네 번째 단계는 모델 성능 평가와 행동 패턴 분석이다. 교차 검증(5‑fold) 결과, 최고 모델은 정밀도 97%, 재현율 93%, F1‑score 95%를 기록했으며, 전체 정확도는 94%에 달했다. 특히 ‘적합’군은 퍼즐 게임에서 평균 승률이 85% 이상이며, 사이드 챌린지 참여 비율이 70%를 초과했다. 반면 ‘비적합’군은 일시정지·재시도·포기 행동이 전체 이벤트의 25%를 차지해 ‘끈기 부족’과 ‘시간 관리 미숙’을 암시한다. 이러한 행동 지표는 기존 설문 기반 성격 요인과 높은 상관관계를 보였으며, 게임 내 행동만으로도 직무 적합성을 높은 신뢰도로 예측할 수 있음을 입증한다.
연구의 의의는 세 가지로 요약된다. 첫째, 암묵적 행동 데이터를 활용해 심리·직무 적합성을 예측함으로써 응답 편향을 최소화했다. 둘째, 모바일 기반 다중 장르 게임이라는 접근은 확장성이 뛰어나며, 대규모 인재 선발 및 진로 상담에 실시간으로 적용 가능하다. 셋째, 머신러닝 파이프라인을 통해 복합적인 행동 패턴을 정량화함으로써 인사 담당자에게 직관적인 의사결정 근거를 제공한다.
하지만 몇 가지 한계도 존재한다. 데이터는 주로 한국 내 소프트웨어 엔지니어를 대상으로 했으며, 문화적 차이에 따른 게임 행동 차이가 있을 수 있다. 또한, 게임 설계 자체가 특정 인지·동기 부여 요소를 강조했기 때문에, 다른 직무(예: 데이터 과학, UI/UX 디자인)에는 별도의 게임 모듈이 필요할 것이다. 향후 연구에서는 다문화·다국가 샘플을 확대하고, 게임 장르와 난이도 변수를 체계적으로 조절해 일반화 가능성을 검증할 계획이다.
📄 논문 본문 발췌 (Translation)
📸 추가 이미지 갤러리