본문 전 세줄 요약
1) 미시간 대학교 정치학과에서 만든 부정선거 감식 프로그램(eforensics)에 몇 개의 선거구를 넣었음.
2) 이번 21대 총선에서만 사전투표에서 부정표를 상당수 섞은걸로 판별남.
3) 간밤에 원문 삭제되서 업데이트도 할 겸 다시 올림. 내 글에 가독성 패치만해서 ㅇㅂ간 빨렙아 고맙다. 가독성 패치좀 빌릴께.
본문
미시간 대학교 정치학과 월터 미베인(Walter Mebane) 교수가 만든 R언어용(통계계산용 프로그래밍 언어) 선거감식 라이브러리(eforensic)에
이번 총선 선거구 몇 개 넣어보는 작업을 하였음. 참고로 미시간 대학교의 정치학과는 미국 정치학과 순위중 4위를 차지하고 있는 명문이며,
미베인교수는 부정선거쪽 전문가로 부정선거를 탐지할 수 있는 통계적 기법을 연구하는 학자임.

사진 1) 월터 미베인 교수에 대한 정보
일단 이 패키지는 미베인교수가 고안한 부정선거용 Finite Mixture Model을 이용해서 부정선거와 관련된 파라미터 값을
베이즈 추정(통계적 추론의 한 방법)하는 프로그램임. 또한 추출된 파라미터(모수, 모집단의 특성을 나타내는 수치)에 근거해서
각 투표단위(이 경우엔 사전투표소 및 투표소 단위)에서 행해진 투표행위를 다음과 같이 판별할 수 있다.
1) 정상적인인지 (Z=1)
2) 상당량의 부정표를 섞었는지 (Z=2, Incremental)
3) 아예 몰표를 주도록 섞었는지 (Z=3, Extreme)
우선적으로 넣어본 선거구는 다음과 같음.
종로구
중구성동구갑/을
용산구
광진구갑/을
송파구갑/을/병
양천구갑/을
고양시갑
여주시
용인시병/정
그냥 생각나는대로 선택한건데 시뮬레이션 돌리는게 꽤 오래걸려서 다른 선거구는 천천히 추가할 생각임.
첫 번째 숫자는 부정이 의심되는 투표소의 수 (= 추정된 Z값이 1이 아닌 투표소의 수).
두 번째 숫자는 부정이 의심되는 투표소 중 사전투표소의 비율.
세 번째 숫자는 각 투표소별 부정의심에 대한 확신도 중간치.
네 번째 숫자는 각 투표소별 부정의심에 대한 확신도 최대치.
결과는 다음과 같다

보는 것처럼 21대 총선에서 민주당이 이긴 구는 확연히 다르다는것을 알 수 있다.
먼저, 20대 총선은 누가 이겼는지와는 상관 없이 부정의심 투표소의 개수가 거의 0임.
그런데 21대 총선에서 민주당이 이긴 구를 보면,
1) 부정의심 투표소의 숫자가 모두 0 보다 크다. 심지어 두 자리수인 경우도 많다.
2) 모든 부정의심 투표소는 사전투표소이다.
3) 확신도가 높다. 심지어 확신도의 최대치가 100%인 투표소도 있다.
반대로 다른 정당이 승리한 곳에서는 위의 1), 2), 3)에 해당하는 경향성을 볼 수 없어.
즉, 비민주당 소속 승자에게 부정으로 주는 표를 유의미하게 탐지하지 못했다고 볼 수 있다.
만약 저 프로그램에서 승자표와 패자표를 바꿔서 돌리면, 민주당 소속 패자에게 부정으로 줬던 표를 탐지할 수도 있을거 같음.
깃헙에 코드랑 올려놨으니 코드 보고싶으면 봐.나중에 시각화도 추가하고 메뉴얼도 추가해서 보강 예정임.
깃헙 레포 주소:
https://github.com/angkimuri/SK-ElectionIrregularities2020/
그리고 투표조작 감지 패키지(eforensics) 깃헙 레포 주소:
https://github.com/UMeforensics/eforensics_public
그리고 이건 이 모델에 대한 미베인교수의 논문이랑 프레젠테이션
http://www-personal.umich.edu/~wmebane/pm18.pdf
http://www-personal.umich.edu/~wmebane/efslides.pdf
능력자들 한번 직접 시도해봐. 이미 만들어진 패키지이니까 R만 할 줄알면 쉽게 할듯.
P.S. 이건 어디까지나 이번 선거의 통계적 불규칙성일 뿐이지 부정선거에 대한 확증은 아님. 확실한 증거는 수사를 통해서만 나올 수 있음.
P.S.2 문의 및 오류제보는 위의 깃헙페이지 혹은 angkimuri@protonmail.com 로.
P.S.3 데이터 포멧알려드림.
일단 각 행은 하나의 투표단위(투표소)를 의미함. 거소·선상투표, 국외선거는 제외하고 관외사전부터 순서대로 쭉 긁었음 (선관위 자료에 나와있는 순서).
그리고 각 변수의 의미는
n.rv : 등록유권자수
n.v : 투표수
n.a : 기권수(=등록유권자수-투표수)
n.w : 승자득표수
n.o : 2등 득표수
ind : 1 이면 사전투표, 0이면 본투표
winning : 승자 소속정당 이니셜
opposing : 2등 소속정당 이니셜
다음은 정당 영문 이니셜.
DPK : 더불어민주당
UFP : 미래통합당
JP : 정의당
PP : 국민의당
SP : 새누리당
1) 미시간 대학교 정치학과에서 만든 부정선거 감식 프로그램(eforensics)에 몇 개의 선거구를 넣었음.
2) 이번 21대 총선에서만 사전투표에서 부정표를 상당수 섞은걸로 판별남.
3) 간밤에 원문 삭제되서 업데이트도 할 겸 다시 올림. 내 글에 가독성 패치만해서 ㅇㅂ간 빨렙아 고맙다. 가독성 패치좀 빌릴께.
본문
미시간 대학교 정치학과 월터 미베인(Walter Mebane) 교수가 만든 R언어용(통계계산용 프로그래밍 언어) 선거감식 라이브러리(eforensic)에
이번 총선 선거구 몇 개 넣어보는 작업을 하였음. 참고로 미시간 대학교의 정치학과는 미국 정치학과 순위중 4위를 차지하고 있는 명문이며,
미베인교수는 부정선거쪽 전문가로 부정선거를 탐지할 수 있는 통계적 기법을 연구하는 학자임.

사진 1) 월터 미베인 교수에 대한 정보
일단 이 패키지는 미베인교수가 고안한 부정선거용 Finite Mixture Model을 이용해서 부정선거와 관련된 파라미터 값을
베이즈 추정(통계적 추론의 한 방법)하는 프로그램임. 또한 추출된 파라미터(모수, 모집단의 특성을 나타내는 수치)에 근거해서
각 투표단위(이 경우엔 사전투표소 및 투표소 단위)에서 행해진 투표행위를 다음과 같이 판별할 수 있다.
1) 정상적인인지 (Z=1)
2) 상당량의 부정표를 섞었는지 (Z=2, Incremental)
3) 아예 몰표를 주도록 섞었는지 (Z=3, Extreme)
우선적으로 넣어본 선거구는 다음과 같음.
종로구
중구성동구갑/을
용산구
광진구갑/을
송파구갑/을/병
양천구갑/을
고양시갑
여주시
용인시병/정
그냥 생각나는대로 선택한건데 시뮬레이션 돌리는게 꽤 오래걸려서 다른 선거구는 천천히 추가할 생각임.
첫 번째 숫자는 부정이 의심되는 투표소의 수 (= 추정된 Z값이 1이 아닌 투표소의 수).
두 번째 숫자는 부정이 의심되는 투표소 중 사전투표소의 비율.
세 번째 숫자는 각 투표소별 부정의심에 대한 확신도 중간치.
네 번째 숫자는 각 투표소별 부정의심에 대한 확신도 최대치.
결과는 다음과 같다

보는 것처럼 21대 총선에서 민주당이 이긴 구는 확연히 다르다는것을 알 수 있다.
먼저, 20대 총선은 누가 이겼는지와는 상관 없이 부정의심 투표소의 개수가 거의 0임.
그런데 21대 총선에서 민주당이 이긴 구를 보면,
1) 부정의심 투표소의 숫자가 모두 0 보다 크다. 심지어 두 자리수인 경우도 많다.
2) 모든 부정의심 투표소는 사전투표소이다.
3) 확신도가 높다. 심지어 확신도의 최대치가 100%인 투표소도 있다.
반대로 다른 정당이 승리한 곳에서는 위의 1), 2), 3)에 해당하는 경향성을 볼 수 없어.
즉, 비민주당 소속 승자에게 부정으로 주는 표를 유의미하게 탐지하지 못했다고 볼 수 있다.
만약 저 프로그램에서 승자표와 패자표를 바꿔서 돌리면, 민주당 소속 패자에게 부정으로 줬던 표를 탐지할 수도 있을거 같음.
깃헙에 코드랑 올려놨으니 코드 보고싶으면 봐.나중에 시각화도 추가하고 메뉴얼도 추가해서 보강 예정임.
깃헙 레포 주소:
https://github.com/angkimuri/SK-ElectionIrregularities2020/
그리고 투표조작 감지 패키지(eforensics) 깃헙 레포 주소:
https://github.com/UMeforensics/eforensics_public
그리고 이건 이 모델에 대한 미베인교수의 논문이랑 프레젠테이션
http://www-personal.umich.edu/~wmebane/pm18.pdf
http://www-personal.umich.edu/~wmebane/efslides.pdf
능력자들 한번 직접 시도해봐. 이미 만들어진 패키지이니까 R만 할 줄알면 쉽게 할듯.
P.S. 이건 어디까지나 이번 선거의 통계적 불규칙성일 뿐이지 부정선거에 대한 확증은 아님. 확실한 증거는 수사를 통해서만 나올 수 있음.
P.S.2 문의 및 오류제보는 위의 깃헙페이지 혹은 angkimuri@protonmail.com 로.
P.S.3 데이터 포멧알려드림.
일단 각 행은 하나의 투표단위(투표소)를 의미함. 거소·선상투표, 국외선거는 제외하고 관외사전부터 순서대로 쭉 긁었음 (선관위 자료에 나와있는 순서).
그리고 각 변수의 의미는
n.rv : 등록유권자수
n.v : 투표수
n.a : 기권수(=등록유권자수-투표수)
n.w : 승자득표수
n.o : 2등 득표수
ind : 1 이면 사전투표, 0이면 본투표
winning : 승자 소속정당 이니셜
opposing : 2등 소속정당 이니셜
다음은 정당 영문 이니셜.
DPK : 더불어민주당
UFP : 미래통합당
JP : 정의당
PP : 국민의당
SP : 새누리당
https://youtu.be/bjA8ZVzY_sk