이름과 성별 역설 아이 한 명의 정체성 효과

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 ‘소녀 혹은 소년 역설’에서 이름의 희귀도가 확률에 미치는 영향을 재검토한다. 이름이 희귀하다고 해서 다른 자녀가 소녀일 확률이 변하지 않으며, 핵심은 ‘식별 가능성’—즉 한 아이를 특정 속성(이름, 연령 등)으로 구분할 수 있느냐에 있다. 동일한 이름이 같은 가정에 존재한다는 비현실적 가정을 제외하면, 이름 자체는 확률에 영향을 주지 않는다. 정보가 어떻게 제공되는가에 따라 “적어도 한 명은 소년”과 “특정한 소년(예: 장남)”이 동등하게 여겨지는 오해를 설명한다.

상세 분석

‘소녀 혹은 소년 역설’은 두 자녀를 둔 가정에서 한 자녀가 특정 속성을 가졌을 때 다른 자녀의 성별 확률을 묻는 고전적인 조건부 확률 문제이다. 전통적인 해법은 “적어도 한 명이 소년”이라는 정보가 주어지면 가능한 경우의 수는 (BB, BG, GB)이며, 이 중 두 번째 아이가 소녀일 확률은 2/3이 된다. 그러나 레오나드 몰디노우는 책에서 “한 딸의 이름이 ‘에밀리’와 같이 희귀하다면”이라는 조건을 추가해 확률이 1/2로 변한다는 주장을 제시한다.

논문은 이 주장에 대해 두 가지 핵심을 짚는다. 첫째, 이름의 희귀도 자체는 확률에 영향을 미치지 않는다. 이름이 흔하거나 드물든, ‘어떤 딸이 존재한다’는 사실은 ‘적어도 한 명이 딸이다’와 동등한 정보량을 제공한다. 따라서 사건을 정의할 때 ‘이름이 에밀리인 딸이 있다’는 사건은 ‘딸이 있다’와 확률적으로 동일하다.

둘째, 중요한 차이는 ‘식별 가능성(identification)’이다. 한 아이를 ‘첫째’, ‘둘째’, 혹은 ‘이름이 에밀리인 아이’와 같이 구체적으로 지정하면 경우의 수가 달라진다. 예를 들어 “첫째가 소년”이라는 정보는 경우를 (BB, BG)로 한정시키고, 두 번째 아이가 소녀일 확률을 1/2로 만든다. 마찬가지로 “이름이 에밀리인 딸이 있다”는 조건을 실제로는 ‘특정한 딸을 식별’하는 것이므로, 이는 ‘첫째가 딸’ 혹은 ‘둘째가 딸’과 같은 구체적 사건과 동등하게 작용한다.

하지만 이때 전제되는 비현실적 가정은 ‘같은 가정에 동일한 이름이 두 번 등장할 수 있다’는 것이다. 실제로는 같은 이름을 가진 형제·자매가 존재하지 않으므로, 이름이 중복될 가능성을 배제하면 확률은 여전히 2/3이 된다. 논문은 이를 수식적으로 보여주며, 조건부 확률 P(다른 아이가 소녀 | 특정 아이가 소년) = 1/2, 반면 P(다른 아이가 소녀 | 적어도 한 아이가 소년) = 2/3임을 명확히 한다.

또한 정보 획득 방식이 확률에 미치는 영향을 논한다. 사람들은 일상 대화에서 “우리 집에 소년이 있다”는 말을 들으면 이를 ‘적어도 한 명이 소년’으로 해석하지만, 실제로는 대화 상대가 특정 아이를 가리키는 경우가 많다. 이런 상황에서는 청자는 이미 ‘식별된’ 아이에 대한 정보를 얻은 것이므로, 확률이 1/2로 바뀐다고 착각한다.

결론적으로, 이름 자체는 확률에 영향을 주지 않으며, 중요한 것은 정보가 ‘식별된’ 아이에 관한 것이냐, ‘어느 한 아이가 해당 속성을 가졌다는 일반적 사실’이냐이다.

이름과 성별 역설 아이 한 명의 정체성 효과

초록

상세 분석

댓글 및 학술 토론

의견 남기기