(코멘트 추가) 6.3 지선 이후 불거진 논쟁, 통계학자와 미디어학자의 의견 전문가 의견 26-066(Ver.2) 선거의 수학: 일부 투표소의 '특이한 득표수'는 정말 희귀하고 이상한 일?
|
|
|
- 배경
- 지난 6월 3일 실시된 9회 전국동시지방선거 결과를 두고, "일부 투표소의 후보 득표수가 특이하며 이것을 우연으로 보기 힘들다"는 주장이 일부 정치인과 소셜미디어 등에서 제기됐습니다.
- 인천, 전남 등의 일부 투표소의 관내사전투표에서 후보 간 득표수가 일치하는데, 이것이 부자연스러우며 확률적으로 매우 희박하다는 내용을 담고 있습니다.
- 일부 정치인은 구체적인 확률 수치까지 언급하며 "의혹을 해소할 필요가 있다"고 목소리를 높였습니다.
- 하지만, 확률이라는 이름으로 숫자가 언급됐을 뿐, 확률을 산출한 정확한 근거나 구체적 도출 과정, 전문가의 해설은 전무한 상황입니다.
- 인천, 전남선거관리위원회 역시 이런 주장을 일축하며 "전체 투표 데이터는 서로 달라 특정 후보자의 득표수 일부가 일치한 것은 우연한 결과로 볼 수 있다"고 일축했습니다.
- 전문가 의견 요청 내용
- 수백~수천 명씩 득표를 한 상황에서 같은 숫자가 나오는 일이 정말 일각의 주장처럼 확률적으로 희귀하고 특이한 일일지요.
- 데이터, 수학, 통계 관점에서 이 현상을 어떻게 설명할 수 있을지요. 실제 가능성이나 확률은 어느 정도일지요.
- 이 문제는 불확실성을 둘러싼 소통의 문제이기도 합니다. 근거가 불분명한 주장이 숫자나 확률, 데이터 등의 이름으로 확산하는 양상입니다. 이 같은 양상이 가져올 문제가 혹시 있을까요. 만약 문제가 있다면, 이를 최소화하거나 극복할 방법은 무엇이 있을까요.
- 통계학자와 사회과학자의 의견을 첨부합니다.
|
|
|
기자 여러분은 아래 주의사항을 참고해 활용해주시길 부탁드립니다.
- 엠바고는 없습니다. 자유롭게 활용 가능합니다.
- 되도록 원문을 그대로 활용해주시길 부탁드립니다.
- SMCK를 꼭 인용할 필요는 없습니다. 만약 인용 출처가 필요한 경우, 아래 형식을 따를 수 있습니다.
- "ㅇㅇㅇ(전문가)는 한국과학기술미디어센터에 ㅁㅁㅁ라고 말했다."
|
|
|
장원철 서울대 통계학과 교수
*2026.6.11. 추가
동일한 득표수를 가지는 투표소 문제를 다음과 같은 문제로 잠깐 바꾸어 생각해보자.
100명의 사람이 있는데 이중 철수와 영희가 전화번호 끝 3자리가 823으로 같다. 철수가 823이라는 번호를 가질 확률은 1/1,000이고 영희도 역시 이 번호를 가질 확률은 1/1,000이니까 백만분의 1의 확률로 일어날 수 있는 일이 100명의 사람이 모인 곳에서 일어난 것이다. 철수와 영희는 이 걸 “세상에 이런 일이” 방송국에 제보하고자 한다. 하지만 정말 이건 드문 일일까? 철수와 영희에게는 안타깝지만 이런 일이 일어날 확률은 99%이다.
그럼 왜 이런 일이 드문 일이 아닌가? 우리가 생각해야 할 건 전화번호가 823번으로 고정되어 있지 않고 어떤 번호도 가능하다는 걸 생각해야 한다. 100명중 끝 3자리가 같은 쌍을 찾는다면 000부터 999까지 모든 번호를 고려해야 한다. 따라서 철수와 영희가 같은 번호를 가질 확률은 사실 1/1,000이다. 또 하나 주목해야 할 점은 우리는 철수와 영희뿐만 아니라 100명중 두 명을 선정하는 경우의 수는 상당히 많다 (정확히 4950개). 평균적으로도 약 5쌍(정확히 4.95쌍)이 끝 3자리 번호가 같을 것이라고 기대할 수 있다.
이 경우 이항분포의 포아송 근사를 이용할 경우 끝 전화번호 3자리가 같은 쌍이 적어도 하나 이상 존재할 확률은 1 - exp(-4.95) = 0.993이 된다.
인천 투표소의 경우 송도 1동과 송도 2동의 박찬대/유정복 후보의 투표수가 각각 3030, 1440표를 받은 사건의 확률만 계산하는 것은 정확하지 않다. 즉 (0, 4470)을 동일하게 받은 경우, (1, 4469)를 동일하게 받은 경우, …, (4470, 0)을 고려한다면 생각보다 송도 1동과 2동에서 두 후보가 동일한 득표를 할 확률은 일반인이 생각한 것보다 높다고 할 수 있다. 이와 더불어 송도1동과 2동과 고려해야 하는 것은 아니다. 비슷한 규모의 연수구내의 동들의 가능한 쌍을 모두 고려한다면 이 확률은 더 커지게 된다.
wcjang@snu.ac.kr |
|
|
이윤동 서강대 경영대학 교수 (Business Analytics 전공)
*2026.6.10.
인천의 송도1동과 송도2동에서 두 후보의 득표수가 3030표와 1440표로 동일하게 나온 현상이 매우 희귀한 현상으로 혹시나 부정선거에 의하여 발생한 것일 수 있다는 의혹이 제기되고 있다.
이 문제에서 따져봐야 하는 점은, 두 지역 유권자의 표심이 비슷했는지 아닌지에 대한 문제가 아니다. 설사 두 지역 유권자의 표심이 대체로 비슷했다고 가정하더라도 어떻게 득표수가 일치할 수 있는가 하는 점이다. 민주당 후보와 국힘 후보가 광주의 송정동과 대구의 관문동에서 득표한 득표수가 정확하게 같아질 확률을 계산한다면, 그 확률은 매우 낮은 값이 될 것이다. 그러나 여기서 계산해야 하는 확률은 표심이 비슷하고 투표자 수가 대체로 비슷한 지역에서 그 득표수가 일치하게 될 확률이다.
이 확률은 의외로 높다. 그 이유는 투표자수가 약 4500명 정도이고 A, B 두 후보의 득표율이 대략적으로 2:1 로 갈라지는 경우, A 후보의 득표수는 최초 0에서 최대 4500 사이의 값 중 하나가 될 수는 있지만, 중심극한정리에 따라 실제로는 2950과 3050 사이의, 약 100개의 숫자에 집중되어 발생하게 된다. 그러므로 두 지역에서의 득표수가 정확하게 겹칠 수 있는 확률은 생각보다 커진다. 정확하게 계산하자면, 가정에 따라 조금씩 달라질 수 있으나, 대력적으로 0.6% ~ 0.9% 사이의 확률이 된다.
widylee@sogang.ac.kr |
|
|
박한우 영남대 미디어커뮤니케이션학과・디지털융합비즈니스대학원・사이버감성연구소 교수, 영국 옥스포드인터넷연구소 전 방문연구원
*2026.6.10.
일부 투표소에서 특정 후보들의 득표수가 동일하게 나타난 현상은 분명 통계적으로 흥미로운 사건이며, 추가 분석의 대상이 될 수 있다. 그러나 희귀한 현상이라는 사실만으로 선거 부정을 단정하는 것은 과학적 접근이라고 보기 어렵다. 데이터과학에서는 벤포드 법칙과 같은 방법을 활용해 선거 데이터를 검증하지만, 현재 공개된 자료만으로는 첫째 자리 숫자의 분포에서 뚜렷한 이상 징후가 확인되지 않는다. 오히려 이번 사례는 단순한 확률 계산을 넘어서는 교차적(intersectional) 분석이 필요하다. 투표율, 지역 특성, 사전투표 참여 행태, 후보 경쟁 구도, 개표 과정 등 다양한 요인이 함께 고려되어야 한다. 특히 역대 최고 수준의 투표율이라는 새로운 환경에서 과거의 경험적 확률을 그대로 적용하는 데에는 한계가 있다. 중요한 것은 특정 숫자의 일치 여부가 아니라 전체 데이터 구조와 맥락을 종합적으로 검토하는 것이다.
또한 이번 논란은 선거 결과 자체뿐 아니라 선거 데이터의 해석과 소통 문제를 보여준다. 현재 선거보도 가이드라인은 여론조사 보도와 후보자 검증에 대해서는 비교적 상세한 기준을 제시하고 있지만, 개표 데이터와 출구 조사 등과 같이 통계 분석 결과를 어떻게 검증하고 보도할 것인지에 대한 기준은 상대적으로 부족하다. 향후에는 개표 과정과 선거 데이터 분석 결과에 대한 검증 절차, 확률 수치의 산출 근거 공개, 데이터 전문가 검증 등을 포함하는 방향으로 선거보도 가이드라인을 보완할 필요가 있다. 민주주의에서 중요한 것은 의혹의 제기 자체를 막는 것이 아니라, 데이터를 투명하게 공개하고 과학적으로 검증하며 사회적으로 신뢰를 구축하는 과정이다.
han.woo.park.korea@yu.ac.kr |
|
|
(참고) 허명회 고려대 통계학과 교수 페이스북 글
*2026.6.9.~10.
SMCK가 문의한 전문가 다수가 9~10일 허명회 고려대 교수의 글을 참고할 것을 추천했습니다. 이에 참고로 해당 글의 링크를 추가합니다.
|
|
|
한국과학기술미디어센터(SMCK) 소개
한국과학기술미디어센터는 근거 기반의 과학 정보를 언론에 제공하는, 과학계와 미디어 사이의 다리 역할을 하는 독립 비영리 조직입니다. 잘못된 정보와 가짜 뉴스가 넘쳐나는 세상에서, 제대로 된 전문가의 해설과 의견을 빠르고 다양하게 기자들에게 제시하고 이를 체계적으로 아카이빙하는 역할을 합니다.
2025년 7월 이사회를 구성하고(이사장 노정혜 전 한국연구재단 이사장) 센터장(이근영 전 한겨레 과학전문기자)을 선임했으며, 같은해 9월 개소식을 열며 활동을 시작했습니다.
*참고 기사:
SMCK 역할
SMCK는 세 분야 전문가인 과학자, 기관 커뮤니케이터(홍보팀), 기자에게 구체적인 도움을 드리고자 설립됐습니다. 각각 아래와 같습니다.
- 과학자, 연구자에게는 의견과 해설이 온전한 맥락과 함께 제공되는 안전한 발언 공간이 돼줍니다. 선의를 위해 한 논평이 기사화 과정에서 왜곡되거나 부정확하게 변질될 우려를 줄이는 완충 작용을 합니다.
- 기관 홍보 담당자에게는 기관의 성과를 기자들에게 보다 객관적이고 정교하게 알리고, SMC 글로벌 네트워크를 통해 영향력을 높일 기회를 제공합니다.
- 기자에게는 사안을 해석하는 데 도움이 될 치우침 없는 종합적인 정보를 빠르고 풍성하게 제공하고, 이를 통해 기사에서 과학과 기술을 보다 자유롭고 편리하게 활용하도록 돕습니다.
SMCK는 이를 통해, 궁극적으로 근거에 기반해 사안을 합리적으로 판단하고 이것이 정책에까지 반영되는 사회를 만드는 데 기여하고자 합니다.
해외 협력
사이언스미디어센터(SMC)는 2002년 영국에서 최초로 설립됐고 현재 호주와 뉴질랜드, 독일, 스페인, 대만, 아일랜드 등으로 확장됐습니다. 한국은 2025년 12월, 7번째 센터로 합류했습니다. 글로벌 네트워크에 포함된 8개 조직은 엄격한 독립성과 신뢰성이라는 가치를 공유하고 있으며 협력을 통해 주요한 국제 과학 이슈에 공동 대응하고 있습니다.
|
|
|
* 지난 의견은 '지난 의견 다시 보기'를 선택해주세요. |
|
|
내용문의: 윤신영 미디어국장 yoonsy@smck.or.kr
비상 연락(당직 전화): 010-4440-5450
한국과학기술미디어센터(SMCK)
|
|
|
|
|