2016년 4·13 총선을 예측했던 선거 여론조사는 ‘폭망’했다. 더불어민주당의 선전과 새누리당의 패배, 국민의당 약진으로 인한 여소야대 정국의 출현. 절대다수의 여론조사기관은 이 ‘사변’을 예측하지 못했다. 조사기관들과 협업했던 언론사들도 “민심을 정확히 알지 못했다”며 사과해야 했다.
그로부터 1년도 채 지나지 않은 시점, ‘봄꽃 대선’ 가능성이 점쳐지면서 선거 여론조사는 어느 때보다 일찍 만개하고 있다. 누가 잘했고 누가 앞서가는지, 우열을 가려주는 여론조사의 속성상, 선거가 가까워질수록 과거의 안 좋은 기억은 희미해지면서 관심이 집중될 수밖에 없다. 선거 여론조사는 잘못된 정보로 또 유권자의 혼란만 가중시킬 것인가. 아니면 과거의 실패를 딛고 재기할 수 있을 것인가. 우후죽순 범람하는 여론조사를 정확하게 읽는 방법은 무엇일지 ‘정치BAR’에서 정리했다.
여론조사, 이번엔 믿어도 될까?
“4·13 총선에서 ‘여론조사의 재앙’을 핏대 세워 가며 개탄했던 언론은 언제 그런 일이 있었느냐는 듯 다시 대선 후보 지지도를 조사한 여론조사 보도에 열을 올리고 있잖은가. 4·13 총선에서 제기된 여론조사의 문제가 달라진 건 아무것도 없는데 말이다.”(왜 여론조사를 ‘현상 유지를 위한 매춘’이라고 하는가?: 조지 갤럽, 강준만의 인물 탐구, 2016년 <인물과 사상> 8월호)
2016년 ‘여론조사 참사’는 조사 기법이 바뀐 세상에 적응하지 못하면서 벌어진 일이다. 여론조사의 시작은 표본 추출이다. 표본 추출이란 전체 유권자 집단에 가장 근접한 ‘모형물’을 빚어내는 일이다. 가장 일반적으로 쓰이는 방식은 성·연령·지역별 비례를 맞추는 것이다. 총선은 전국을 253개로 잘게 자른 지역구 단위로 치러진다. 사용자의 지역정보가 담긴 케이티 집전화와 달리 지역정보가 전혀 없는 무선전화는 총선 여론조사에서 제한적으로만 쓰이기 때문에, 젊은층의 상당수가 조사에서 배제될 위험성이 크다. 여론조사 전문가들이 총선 여론조사가 가장 어렵다고 어려움을 호소해온 이유가 여기에 있다. 2010년에 이미 휴대전화 보급률이 100%를 돌파한 나라에서 여론조사 기법은 여전히 ‘유선전화 시대’에 머물러 있었던 셈이다.
그러면 대선은 어떨까. 대선은 총선과 달리 선거구가 하나다. 4200만명 유권자를 성·연령·지역별 비례에 따라 1000명 정도로 축소한 표본을 추출하는 데 큰 어려움이 없다. 5년 전 18대 대선 여론조사는 비교적 정확했다. 민주통합당에선 ‘골든 크로스’가 이뤄졌다며 역전을 주장했지만 대선 결과는 박근혜 후보의 박빙 우세를 점친 절대다수의 여론조사 결과대로 나왔다. 당시 새누리당 중앙선거대책본부 여론조사 위원 겸 조직총괄본부 정세분석위원장으로 활동했던 김준철씨는 자신의 책 <여론조사로 대통령 만들기>에서 재밌는 검증 결과를 내놓았다. 먼저 여론조사 공표 금지기간(12월13일 이후) 직전에 실시된 20개의 여론조사 결과를 모두 모았다. 유효 응답자 수는 3만3258명이었고 박근혜 후보 지지자 수가 1만5622명, 문재인 후보 지지자 수는 1만4527명이었다. 기타(593명) 및 모름·없음(2543명)을 뺀 모수만으로 백분율을 따졌더니 박 후보 지지율이 51.8%, 문 후보 지지율이 48.2%로 나왔다. 실제 득표율(박 51.6%, 문 48.0%)과 흡사한 결과가 나온 것이다. 지난 21일 한국언론회관에서 ‘여론조사 오용과 악용, 그리고 대안’이라는 주제로 강연한 신창운 덕성여대 초빙교수(전 <중앙일보> 여론조사 전문기자)는 “그동안 대선 여론조사 결과는 잘 들어맞았다. 이번에도 그럴 것”이라고 말했다.
조사 방법, 진화하고 있나?
지난 총선 때 새누리당의 넉넉한 과반을 점친 대부분의 여론조사기관의 예측치는 크게 빗나갔지만 정당의 자체 조사 결과는 달랐다. 새누리당 여의도연구원은 자신들이 130석을 얻을 것으로 분석했고, 민주당은 자체적으로 120석을 예상했다. 이처럼 정당의 예측이 실제 결과에 근접할 수 있었던 비밀은 안심번호에 있었다. 안심번호는 통신사가 가입자의 휴대전화에 050으로 시작되는 11자리의 가상 번호를 새로 붙여 제공하는 서비스다. 통신사는 중앙선거관리위원회에 고객의 성별·연령·지역 정보가 고르게 분포된 유권자 표본을 안심번호 형태로 넘기고 이 표본은 정당에 전달된다. 고객의 이름은 숨긴 채 성별·연령·지역 정보만 담긴 가상의 전화번호가 정당에 제공되는 것이다. 정당은 이를 지역구 공천 과정에서 여론조사 경선 및 판세 분석을 위해 활용할 수 있었다. 여론조사기관이 유선전화와 무작위 추출된 휴대전화번호로 지역구별 여론조사 표본을 수집하느라 어려움을 겪을 때 정당은 안심번호를 이용해 손쉽게 표본 추출에 성공한 것이다. 지난해에는 이 안심번호를 정당만 사용할 수 있게 했으나 올해 2월 선거법 개정으로 오는 3월13일부터는 여론조사기관도 활용할 수 있게 됐다. 앞으로 지방선거·총선 등 지역 단위 선거에서 여론조사의 정확도가 올라가는 계기가 될 것으로 보인다.
조사 방식은 사람이 전화를 걸어 질문하는 전통적인 조사원 조사와 기계음을 활용한 자동응답방식(ARS)으로 크게 나뉜다. 여론조사기관은 여기에 유·무선 전화 방식을 고려해 각각 최적의 방식과 비율 공식을 산출해낸다. 조사원 조사를 기본으로 하는 한국갤럽은 무선전화 조사가 84~85%, 유선전화 조사가 15~16% 비중을 차지한다. 자동응답방식을 주로 쓰는 리얼미터는 무선전화 자동응답 70%, 무선전화 조사원 조사 20%, 유선전화 자동응답 10%로 대선주자 지지도 조사를 수행하고 있다.
최근에는 교통카드인 모바일티머니 고객을 상대로 휴대전화로 푸시를 날린 뒤 설문 참여를 유도하는 스마트폰 앱 방식이 도입됐으나 여론조사 업계에선 찬반이 맞서고 있다. 300원에서 500원 정도의 보상을 걸고 설문 참여를 유도하는 것 자체가 무작위 추출 원칙에 위배되며 사용자의 거주지 등 잘못된 정보 입력이 가능하다는 게 반대 논리다. 그러나 모바일티머니 앱 조사의 효용성을 주장하는 쪽에서는, 보상을 좇아 달려드는 표본을 배제하기 위해 한 달 안에 중복 참여를 막고 있으며 티머니 사용 내역을 통해 실제 거주지를 검증하고 있다고 반박한다.
여론조사 ‘바로 보기’ 포인트
“이번 조사의 표본오차는 95% 신뢰수준에 ±3.1%포인트입니다.”
여론조사 기사 말미에 붙는 이런 설명에는 여론조사의 본질이 숨어 있다. 표본오차가 ±3.1%포인트라는 말은 ‘홍길동 후보’가 여론조사에서 30%의 지지율을 얻었다고 가정할 때, 실제 여론은 30%보다 3.1%포인트만큼 더 나올 수도 있고 덜 나올 수도 있다는 뜻이다. 즉, 홍길동 후보의 실제 지지도는 26.9~33.1% 범위에 분포한다는 얘기다. 95% 신뢰수준이라는 건 같은 방식으로 100번의 여론조사를 수행했을 때 95번은 홍길동 후보의 지지율이 26.9~33.1% 사이에 들어 있다는 얘기다. 같은 조사에서 ‘전우치 후보’가 24%의 지지율을 얻었다고 가정했을 때 그의 실제 지지율은 20.9~27.1% 범위에 분포한다. 통계학적으로 홍길동 후보(26.9~33.1%)와 전우치 후보의 지지율 범위가 겹치므로 두 사람의 우열을 가릴 순 없다. 그래서 여론조사 전문가들은 오차범위 바깥으로 차이가 벌어지지 않은 한 특정 후보가 “우세하다”는 식의 표현을 자제해야 한다고 입을 모은다.
표본오차의 문제는, 현재 수행되는 여론조사만으로 더불어민주당 경선 결과를 속단해선 안 된다는 경계심으로도 연결된다. <국민일보>의 의뢰로 한국사회여론연구소(KSOI)가 지난 17~18일 전국 성인 1013명을 상대로 한 조사에서 문재인 전 대표는 31.9%, 안희정 충남지사는 23.3%, 이재명 성남시장은 9.6%의 지지율을 얻었다.(표본오차는 95% 신뢰수준에 ±3.1%포인트) 그런데 1013명 중 더민주 지지자는 389명이었고 이들의 선호만 보면 문재인 전 대표 56.2%, 안희정 지사 20.8%, 이재명 시장 13.4%로 갈렸다. 표본 수가 전체 1013명에서 더민주 지지층 389명으로 줄어들었기 때문에 이때 표본오차는 ±4.98%포인트로 더 커진다. 안 지사와 이 시장의 지지도 차이(6.4%포인트)가 오차범위 안이다. 국민경선에 참여하는 유권자가 200만명을 거뜬히 돌파할 것으로 예상되는 가운데 더민주 지지층이 총결집해 치르는 경선에선 충분히 이변을 주장할 수 있는 것이다.
전문가들은 여론조사에서 중요한 건 ‘추세’라고 말한다. 누가 누구를 몇%포인트 이겼냐가 아니라 지지도 상승·하락세 등 정치인을 대하는 유권자들의 ‘분위기’가 중요하다는 것이다. 추세를 보기 위해서는 정기적인 여론조사가 필요하다. 또 이번달 ㄱ사, 다음달은 ㄴ사, 이런 식으로 각기 다른 여론조사기관의 자료를 시계열로 늘어놓고 추세를 살펴보는 건 금물이다. 여론조사기관마다 설문 문항(적합도 또는 지지도)과 조사 방식이 다 다른데 이를 비교하며 추세를 살피는 건 무의미하기 때문이다.
‘샤이 보수’가 숨은 표심?
정치 여론조사의 정확성을 항상 위협했던 요인은 조사로 잡히지 않는 ‘숨은 표심’이었다. ‘박근혜·최순실 게이트’ 이후 야당 대선주자들에게 지지가 일방적으로 쏠리는 지금 상황에선 ‘샤이(shy) 보수’라는 용어가 심심찮게 들린다. 보수 후보를 지지하는 게 부끄러워서 아예 의사표명을 하지 못하는 사람들을 이번 대선의 ‘숨은 표심’으로 상정하고 있는 것이다. 지난 22일 국회에서 자유한국당 의원들이 주최한 ‘샤이 보수, 여론조사에서 나타나는 기울어진 운동장’ 토론회에서는 이름에서부터 그들의 ‘희망’이 강하게 묻어났다. 지금의 여론조사는 야권 후보가 압도하고 있지만, 숨죽이고 있는 보수 지지층이 조용히 투표장으로 향하면 이변이 일어날지 모른다는 바람이다. 발제자로 나선 이택수 리얼미터 대표는 △박근혜 대통령의 2012년 대선 득표율과 달리 최근 여론조사에서 “그때 박근혜 후보를 찍었다”는 응답은 30%대에 그치고 있고 △박 대통령 최저 지지율 5%에 비해 탄핵 반대 여론이 20%에 육박한다는 점 등에 주목해 “10~15%가량 숨은 보수 표심이 있다고 봐야 할 것 같다”고 말했다. 다만 그는 “‘샤이 보수’가 있다 해도 ‘기울어진 운동장’이라는 표현이 나올 정도로 격차가 크게 벌어진 상황이어서 10~15% 정도 샤이 보수를 반영하더라도 큰 격차를 이겨낼 수 있을지는 회의적”이라고 말했다.
‘샤이 보수’는 미국 여론조사기관이 예측하지 못했던 트럼프 대통령 당선의 원인을 분석한 ‘샤이 트럼프’라는 용어에서 유래한 말이다. 그러나 미국과 우리나라 상황은 매우 다르다는 반론이 존재한다. 중산층에서 밀려난 분노한 백인 유권자들이 부도덕하지만 보호무역과 반이민정책으로 일자리를 약속하는 트럼프라는 ‘걸출한 인물’을 중심으로 결집할 수 있었다는 것이다. 한귀영 한겨레경제사회연구원 사회조사센터장은 “트럼프는 보수적 성향을 가진 유권자들의 강력한 구심 역할을 했지만 현재 우리나라는 그런 존재가 없다”며 “보수의 대안이 없을 때는 투표장에 안 나올 수도 있고 다른 차선을 선택할 수도 있는데 이런 변수들을 무시하고 통틀어서 ‘샤이 보수’라고 얘기하면 현실성이 떨어진다”고 말했다.
예측과 결과가 불일치했을 때 이를 사후에 설명할 수 있는 ‘샤이 유권자’ 개념이 사전적·상시적으로 쓰이는 건 문제라는 지적도 나온다. 윤희웅 오피니언라이브 여론분석센터장은 “나중에 야당 출신 대통령 지지율이 10%로 떨어졌을 때 ‘샤이 진보가 많아서 그런 거다’라고 말할 수도 있다. 여론의 지지를 받지 못하는 정치세력에 대한 비판을 봉쇄하는 문제가 발생한다”며 “여론조사는 질문에 대한 답변이기 때문에 떳떳하게 답변하지 못하는 상황도 그 자체로 의미가 있는 것”이라고 말했다.
김태규 기자
dokbul@hani.co.kr
◎ 정치BAR 페이스북 바로가기 ◎ 정치BAR 텔레그램 바로가기