‘80점인데 A 받을 수 있나요?’ 이는 시험 기간 직후 교내 커뮤니티에서 흔히 볼 수 있는 글이다. 학점 계산부터 국가 정책 수립까지 우리 삶을 더욱 편리하게 만드는 ‘이것’은 바로 통계다. 이러한 통계를 어떻게 만들고 이용할 수 있는지 알아보자.

 

세상을 계산해드립니다 
통계 자료는 오늘날 수많은 분야에서 널리 사용된다. 국가의 인구 구조나 고용 현황 등은 통계를 기반으로 파악되는데, 이는 국가 정책을 마련하는 데 사용된다. 본교 여인권 통계학과 교수는 “통계가 사회 문제 해결을 위한 선순환 구조를 만들 수 있다”고 설명했다. 여 교수는 “여성과 남성의 임금 격차를 예로 들면, 통계를 기반으로 차이뿐만 아니라 그 이유와 해결책도 찾을 수 있다”며 “통계는 문제 상황에 적합한 정책을 수립하고, 정책을 시행한 후 정책의 효과를 확인하는 데도 도움이 된다”고 전했다.

통계학에선 통계를 만드는 모든 과정을 규정한다. 먼저 연구자는 연구 주제를 명확히 해야 하는데 이는 통계 자료를 만들 때 가장 중요한 단계다. 연구 주제를 확정하면 연구 주제와 관련된 모집단(*통계 용어로, 측정이나 조사를 하기 위하여 표본을 뽑아내는 바탕이 되는 집단)을 파악해야 한다. 사회조사에서 모집단은 국민 전체와 같이 크기가 큰 경우가 대부분이다. 모집단을 전부 조사하는 전수조사를 수행하기 어려운 경우엔 표본조사를 한다. 표본조사를 할 때는 모집단의 특성을 충분히 반영한 표본을 추출해야 한다. 여 교수는 “모든 통계 분석은 표본이 모집단을 잘 대표한다는 전제 아래 이뤄진다”며 “이 과정이 제대로 이뤄지지 않으면 통계에 많은 문제가 발생한다”고 말했다. 

자료의 대표성이 증명되면 다음 단계인 자료 분석이 시작된다. 여 교수는 “연구자나 표본을 추출하는 방법에 따라 표본은 변동성을 지닌다”며 “연구자는 항상 자신의 통계 결과에 오차나 오류가 발생할 수 있음을 인지해야 한다”고 전했다. 이런 오차가 여러 사람의 표본조사 결과에서도 큰 차이가 나지 않는다면 이는 표본이 적절하게 추출됐다는 의미다. 한편, 표본을 적절히 추출해도 표본에 적합한 분석 방법을 사용하지 않으면 통계에 오차가 발생할 가능성이 있다. 이렇듯 연구 주제 선정, 모집단 설정, 표본 추출, 자료 분석을 적절히 거치면 신뢰도 높은 통계 결과를 얻을 수 있다. 

정확히 설계된 통계는 사회를 보여주는 창이 될 수 있다. 통계는 국가부터 대학까지 여러 상황에 적용될 수 있다. 통계청은 국민을 대상으로 환경, 복지 등 총 10개 부문에 관해 정기적인 사회조사를 수행한다. 사회조사 결과는 주관적인 항목에 대한 객관적인 지표를 제공하고, 이는 적절한 정책을 마련하는 데 이바지한다. 대표적으로 지난 19대 대통령선거에서 후보들이 미세먼지 해결책을 공약으로 내세운 사례가 있다. 대선이 있기 전인 지난 2016년 통계청에서 발표한 「2016년 사회조사」에 따르면, 국민의 79.4%는 황사와 미세먼지 유입에 불안을 느낀다고 응답했다. 이러한 통계가 후보의 공약에도 영향을 준 것이다. 

본교 차원에서도 학교 운영에 학우의 의견을 반영하기 위해 통계 자료를 이용하고 있다. 총학생회에서 총학생회 운영에 관한 만족도 조사를 하거나 학사팀에서 매 학기 수업평가를 하는 것이 대표적이다. 이렇게 수집된 통계 자료를 바탕으로 총학생회는 학우를 위한 사업을 펼치고 학사팀은 학우의 요구를 수렴해 강의 환경을 조성한다.

반면 정확하지 않은 통계가 사용되는 때도 있다. 대학생 일부는 학점을 예측하기 위해 학점 계산기를 이용한다. 학점 계산기에 원점수, 표준편차, 중간값, 평균을 입력하면 예상 백분위 값이 나온다. 하지만 이러한 학점 예측은 실제 학점과 다를 가능성이 높다. 여 교수는 “중간시험과 기말시험 등수가 각각 상위 30%였다고 해서 최종 등수가 상위 30%인 것은 아니다”며 “동일한 강의에서 치른 시험의 결과를 여러 차례 누적하면 학점 예측의 정확도를 높일 수 있다”고 말했다. 또한, 수강생의 성적 분포에 따라 예측한 성적의 오차 범위가 달라질 수도 있다. 여 교수는 “성적 최상위권 및 최하위권과 달리 비슷한 점수가 밀집된 중위권은 특별한 경우를 제외하면 예측한 성적과 실제 학점의 차이가 더욱 클 가능성이 있다”며 “이외에도 교수의 재량에 따라 실제 학점이 달라진다”고 덧붙였다.
 
 

이런 통계, 더 믿을 수 있어요 
본지는 통계에 대한 숙명인의 태도를 알아보기 위해 지난 12일(화)부터 14일(목)까지 숙명인 553명을 대상으로 설문조사를 실시했다.(신뢰도 95.0%, 오차범위 ±4.08%p) 설문조사 결과 통계 자료를 신뢰하게 하는 요인으로 숙명인 2명 중 1명 이상(53.2%)은 ‘통계를 발표한 기관’을 꼽았다. 또한, 숙명인이 가장 신뢰하는 통계 수행 기관으로는 ‘통계청을 포함한 정부 부처’가 69.4%(378명)로 가장 큰 비율을 차지했다. 일상에서 통계 자료를 흔히 접하는 경로 중 하나가 언론사이지만 ‘언론사 및 언론사 소속 연구소’를 통계 수행 기관으로서 가장 신뢰한다는 응답은 8.3%(45명)에 그쳤다. 

언론에서 통계 자료가 왜곡되는 사례는 종종 발생한다. 이에 본교 안민호 미디어학부 교수는 “통계는 전문적인 영역이기에 독자와 시청자는 물론 언론인도 통계 자료를 정확히 이해하기 어려울 수 있다”고 설명했다. 이어 “하나의 현상에 관해 하나의 통계만 있는 것은 아니다”며 “자신의 주장에 맞는 자료만을 이용하면 통계 자료 사용이 오히려 기사의 객관성을 떨어트릴 수 있다”고 말했다.

언론이 통계 자료를 제시하는 방법에 따라 통계 자료에 대한 일반인의 신뢰 정도가 달라지기도 한다. 안 교수는 “통계 자료의 시각화는 전문가가 아닌 일반인들이 복잡한 통계 자료를 쉽게 이해하도록 돕는다”면서도 “시청자 및 독자가 통계 자료를 이해한 정도에 따라 이들이 자료를 신뢰하는 정도가 달라질 수 있다”고 전했다. 신문에선 시각 자료만을 사용할 수 있지만 방송에선 시각과 청각 자료를 모두 사용할 수 있다. 이러한 특징으로 인해 언론은 매체마다 서로 다른 방식으로 통계 자료를 전달한다. 안 교수는 “방송에선 시간의 제약이 크기 때문에 자료를 심층적으로 분석해 전달하는 데 어려움이 있다”며 “신문보다 방송 뉴스에서 통계 자료가 잘못 해석될 위험성이 더 크다”고 말했다. 한편, 같은 매체여도 통계 자료를 표현한 그림에 따라 전달 효과가 달라질 수 있다. 더 많은 비율을 차지하는 항목의 그래프를 더 작게 그리는 등의 방법으로 결과를 왜곡할 위험성이 있기 때문이다. 

설문조사 결과 숙명인은 제시된 통계 자료의 출처가 명확할수록 더 높은 신뢰를 보였다. 여 교수는 “사람들은 통계를 발표했을 때 그 결과가 객관적이라고 생각하며 신뢰하곤 한다”며 “단순히 ‘좋다’는 표현보다 ‘몇 퍼센트이기 때문에 좋다’는 구체적인 표현을 더욱 믿음직하다고 느끼는 경향이 있다”고 전했다. 실제로 숙명인에게 설문조사를 통해 ‘창간 63주년 맞은 본지, 학우 10명 중 7명 ‘읽어본 적 없어’’와 ‘창간 63주년 맞은 본지, 읽어본 적 없는 학우 많아’ 중 더욱 신뢰가 느껴지는 문장을 선택하도록 한 결과 98%(532명)가 ‘10명 중 7명’이라는 구체적인 표현이 사용된 문장을 선택했다.



사견을 지우고 오롯한 통계로 
통계는 객관성을 보장하는 동시에 주관적으로 해석될 위험이 크다. 통계 자료를 다룰 때는 통계를 설계하고, 전달하고, 해석하는 과정에 관여하는 모든 사람의 세심한 관심이 필요하다. 여 교수는 통계 설계와 관련해 “연구 주제에 대한 고찰 없이 자료를 조사하는 때도 있다”며 “연구 주제를 명확히 정의하지 않으면 엉뚱한 곳에서 자료를 얻는 실수를 범하게 된다”고 조언했다. 

통계를 전달하는 언론에도 전문성과 책임감이 요구된다. 한편 언론은 누구나 이해할 수 있는 쉬운 말로 보도하는 의무를 지닌다. 안 교수는 이러한 현상을 ‘언론의 딜레마’라고 표현했다. 이어 “언론은 사람들의 눈길을 끌기 위해서 정보를 쉽게 전달해야 하지만, 전문적인 영역인 통계를 이해하는 일은 언론인과 일반인 모두에게 쉽지 않다”고 덧붙였다. 한편, 보도가치가 있는 통계 자료라고 할지라도 자료가 사회에 끼칠 영향을 고려해야 한다는 시각도 있다. 안 교수는 미군의 이라크 민간인 폭격을 예로 들며 “당시 뉴욕 타임스(The New York Times)에서 국민에게 이라크 폭격을 이어갈지 묻는 통계 자료를 만들었고, 이를 바탕으로 ‘그래도 폭격은 계속돼야 한다’는 내용의 기사를 보도했다”며 “언론에서 통계 자료를 이용할 때 통계를 정확히 보도하는 방법뿐만 아니라 어떤 통계에 관심을 둬야 하는지에 대해서도 유의해야 한다”고 강조했다. 

사회 각 분야에서 자료의 중요성을 강조하면서 언론도 ‘데이터 저널리즘’을 표방하고 있다. 안 교수는 “언론인은 직업 특성상 사회 각계각층의 조직을 마주하며 특정 조직의 입장을 입증하기 위한 통계 자료를 자주 접한다”며 “통계 자료를 언론인이 무조건 신뢰하면 심각한 문제가 발생할 수 있다”고 경고했다. 이어 “언론인 스스로 자료를 다루고 해석하는 전문성을 확보함과 동시에 통계 자료 중 유리한 일부를 발췌해 보도하려는 유혹을 떨쳐내야 한다”며 “언론사에서도 올바른 통계 자료를 보도하고 잘못된 통계 자료 이용을 방지할 수 있는 체계적인 지침을 마련해야 한다고 생각한다”고 전했다.
 
그렇다면 통계를 적절히 이용하기 위한 일반인의 노력으로는 무엇이 있을까. 먼저 공신력 있는 출처에서 통계를 찾는 방법이 있다. 통계청 공식 홈페이지 외에도 국가통계포털에선 통계청 및 각 시도 청의 통계 자료를 공개하고 있다. 민간 차원에서 생산한 통계의 신뢰성을 보장하기 위해 엄격한 절차를 통해 국가 통계 승인 제도가 운용되고 있다. 

이외에도 선거 기간에 정확한 여론 조사 결과를 찾기 위해 중앙선거여론조사심의위원회에서 검증한 통계를 이용하는 방법이 있다. 여 교수는 “여론조사 결과를 공표 및 보도할 때 특정 후보자의 지지도가 높으면 일반 대중이 해당 후보자를 따라서 지지하는 경향이 있다”며 “여론조사 결과 악용을 방지하기 위해 국가 차원에서 해당 기구를 운영하고 있다”고 설명했다. 중앙선거여론조사심의위원회는 선거여론조사의 객관성과 신뢰성을 확보하는 데 필요한 사항을 정해 공표하는데, 여기에는 조사 의뢰자, 표본오차, 응답률 등이 포함된다. 가장 중요하게 고려해야 할 요인 중 하나는 응답률이다. 여 교수는 “응답률이 낮으면 응답한 사람의 대부분이 조사 주제와 관련한 이해 당사자일 수 있다”며 “편향된 통계가 나올 위험이 크다”고 말했다.

 

약 5천만명이 사는 우리나라에서 구성원 모두의 의견을 반영한 정책을 만들기는 쉽지 않다. 하루에 100명의 국민을 만나도 이들을 모두 만나려면 약 1,400년이 걸리기 때문이다. 통계는 표본 조사를 통해 전체 집단의 모습을 보여주고, 불가능해 보이는 일을 가능하게 한다. 정치부터 경제까지 윤택한 삶을 만드는 통계. 한 번쯤 통계의 중요성을 떠올려 보는 것은 어떨까.

저작권자 © 숙대신보 무단전재 및 재배포 금지