채팅보다 행동이 말한다: AI 챗봇 연령 차단 실태 조사

채팅보다 행동이 말한다: AI 챗봇 연령 차단 실태 조사
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 연구는 인기 AI 챗봇이 대화만으로 사용자의 연령을 추정할 수 있는지와, 13세 미만 아동을 식별했을 때 정책에 따라 차단 등 실제 조치를 취하는지를 자동화된 감사 프레임워크로 검증한다. 1050개의 실험 결과, 챗봇은 연령 추정 정확도가 93‑99%에 달하지만 아동을 차단하거나 보호자에게 알리는 행동은 전혀 수행하지 않아 정책 위반을 드러냈다.

상세 분석

본 논문은 AI 챗봇의 연령 차단( age‑gating) 메커니즘을 체계적으로 평가하기 위해 세 가지 핵심 요소를 설계했다. 첫째, 연령을 암시하거나 명시적으로 드러내는 105개의 프롬프트를 포함한 ‘연령 지시 프롬프트 라이브러리’를 구축했다. 이 라이브러리는 교육 표준과 콘텐츠 등급을 기반으로 5세‑12세(아동), 13‑17세(청소년), 18세 이상(성인) 세 그룹으로 구분되며, 명시적(“나는 10살이에요”)과 암시적(“나는 초등학교 4학년이에요”) 두 형태를 모두 포함한다. 둘째, 자동화된 ‘챗봇 감사기’는 웹 인터페이스를 인간 사용자를 모방해 실제 대화 흐름을 재현하고, 각 프롬프트에 대한 챗봇의 응답을 수집한다. 수집된 4,890개의 교환을 대상으로, 연령 추정 질문(“내 나이를 추정해 주세요”)과 행동 확인 질문(“아동이라면 차단해 주세요”)을 별도로 삽입해 두 가지 차원을 동시에 평가했다. 셋째, 응답 분석을 위해 Google Gemini 3 API를 활용한 자동 라벨링 파이프라인을 구축했으며, 94% 이상의 라벨링 정확도를 달성해 대규모 데이터셋 구축을 가능하게 했다. 실험 대상은 OpenAI ChatGPT, Microsoft Copilot, Google Gemini, Meta AI, Perplexity AI 등 5대 상용 챗봇이며, 각 모델에 대해 연령 추정 정확도는 명시적 프롬프트에서 93‑99%, 암시적 프롬프트에서는 초기 19%에서 대화가 진행될수록 42%까지 상승했다. 그러나 연령이 13세 미만임을 인식했음에도 불구하고 차단, 보호자 알림, 연령‑맞춤 인터페이스 전환 등 어떠한 조치도 취하지 않았다. 특히 아동임을 인정하지 않으면서도 어린이용 어휘(이모지, 속어)를 사용하는 모순된 응답 패턴이 관찰되었다. 이러한 ‘willful ignorance’는 정책 문서(각 기업의 개인정보 보호정책)와 명백히 상충한다. 논문은 이를 근거로 COPPA(Children’s Online Privacy Protection Act) 하에서 ‘실제 지식(actual knowledge)’의 정의를 명확히 할 필요성을 강조하고, 제안된 감사 프레임워크와 ‘연령 토큰’ 기반 차단 메커니즘을 적용한 프로토타입을 통해 실현 가능한 해결책을 제시한다.


댓글 및 학술 토론

Loading comments...

의견 남기기