BLOG main image
분류 전체보기 (177)
소개 (4)
일상 (168)
여행 (5)
Visitors up to today!
Today hit, Yesterday hit
daisy rss
tistory 티스토리 가입하기!
'통계'에 해당되는 글 2건
2009. 6. 30. 17:52
이런 기사가 나왔습니다.

"미디어법 근거 통계, 조작됐다"
[홍헌호 칼럼] "정보통신정책연구원, 통계 조작해 국민 속였다"
- 프레시안 2009.6.29

제게도 익숙한 이름인 정보통신정책연구원(KISDI)의 보고서에서 통계 수치를 조작했다는 이야기입니다. 그것도 정치적으로 민감한 미디어법의 근거가 되는 자료에서 나온 조작이기에 이 문제는 연구자들에게 큰 충격이 되어야 마땅합니다.

그러나 그리 놀랍지는 않습니다. 정책 연구가 안고 있는 오래된 문제니까요.
올해 초에 나온 이 보고서의 제목은 "방송규제완화의 경제적 효과분석"이며,
기사에서 지적한 통계 조작은 두 가지입니다. 저도 보고서를 보고 자료를 검색해 가며 조작되었다는 부분을 확인했습니다.

첫번째, 영국 방송법 개정의 효과를 보여주는 표에서 2005년 TV 시장규모 수치를 부풀려 영국의 미디어 개혁효과를 과장했습니다. 아래에 보고서의 표와 OFCOM 자료의 그림을 같이 옮겼습니다. 간단히 구할 수 있는 자료임에도 2006, 2007년 통계를 제외한 거야 어떻게 넘어가겠지만, 단순한 숫자인10,621을 왜11,251로 바꿔 썼는지는... 알고 싶지 않군요.


두번째는 우리나라 방송플랫폼 시장이 선진국에 비해 작은 규모라고 주장하는 표에서 우리나라의 GDP를 조작하여 방송시장의 비중을 낮췄습니다. 한국의 2006년 GDP는 IMF의 World Economic Outlook Database에 따르면 952,034백만USD이고, KISDI 쪽에서 말하는 ITU 자료로는 888,020백만USD입니다.
따라서 방송시장의 비중은 0.92~0.98%가 옳으며, "국내 방송시장은 꾸준히 성장하는 추세이나, GDP 대비 비중은 '07년 0.67%로 선진국 수준에 미치지 못함"이라는 주장은 말이 안됩니다.


어이없는 것은, 보고서에 이어 등장하는 <표 3-3>에서 명목GDP를 8,480,446억원으로 쓰고 있다는 것입니다. 제가 가진 <2007년 방송산업 실태조사 보고서>에 따르면 2006년도의 방송시장 매출규모는 97,199억원이고, 이들 수치로 셈한 GDP 대비 비율은 1.15%에 이릅니다. (IMF 자료로도 1.07%입니다.)

실수라고 하기에는 그 의도가 너무 뻔합니다. 저는 이런 조작이 이루어질 수밖에 없는 연구 환경이 바뀌었으면 하지만, 정해진 답을 강요하는 현실을 생각해보면 한숨만 나옵니다. 나에게 저런 일이 닥쳤을 때, 어떻게 할 수 있을까 하는 생각도 들고요.

그렇군요. 정치는 이렇게 우리의 삶 속에 깊이 침투해 있었군요. 어디선가 들은, "생각하는 대로 살지 않으면 사는 대로 생각하게 된다"는 말이 떠오릅니다.

'일상 > 잡담' 카테고리의 다른 글

둘째 공주님  (0) 2010.03.10
내 마음의 부분일식  (0) 2009.07.23
오프라인과 온라인  (0) 2009.06.03
한 사람이 남기는 부탁  (0) 2009.05.23
글과 사람 - 권정생 선생님  (0) 2009.05.23
2008. 1. 27. 22:50
[albook|small|right|8974271869|width=100]서점에서 눈에 확 띈 책이 있어 샀다.

보고 싶은 것만 보고 믿고 싶은 것만 믿게 만드는
생각의 오류, 토머스 키다

일단, 다음과 같은 경우를 생각해 보자.

바이러스 감염 검사를 했는데, 양성으로 나왔다. 감염된 것 같다. 다음과 같은 정보가 주어졌을 때, 실제로 이 바이러스에 감염되었을 확률은 얼마쯤 될까?

- 실제로 감염되었을 경우, 이 검사에서는 100% 양성으로 나온다.
- 실제로 감염되지 않았는데 검사에서 양성으로 나올 확률은 5%이다.
- 500명 중 1명 꼴로 이 바이러스에 감염되어 있다.

의료 종사자 중 절반 정도의 사람들처럼 대략 95%라고 대답한다면, 이 책은 아마도 큰 도움이 될 것이다. 정답은 약 4%이기 때문이다. 그 이유는 좀 뒤에서 살펴보기로 하자. (책 266-267쪽에서 요약)

이 책은 우리가 빠질 수 있는 생각의 오류와, 그런 오류들을 피할 수 있는 방법을 제시한다. 그리고 초상현상, 초능력, 외계인 납치, 영매, 동종요법, 대체의학, 미래 예측 등의 여러 가지 사이비 과학 또는 비과학적인 믿음을 해부한다. 때문에 이 책이 강조하는, '과학적으로 생각하는 방법'만큼이나 사이비 과학의 구체적인 사례들도 흥미롭고 유익하다.

그리고 이 책의 핵심 내용은 '여섯 가지 문제'라고 저자가 친절하게 정리해 놓았습니다.
1. 통계수치보다 이야기를 더 좋아한다 - 옆 친구의 경험이 더 그럴듯하다.
2. 확인하고 싶어한다 - 잘 들어맞는 것만 기억하고 빗나간 것들은 잊어버린다.
3. 삶에서 운과 우연의 일치가 하는 역할을 잘 이해하지 못한다 - 우연의 결과에 불과한데도 원인을 찾는다.
4. 세계를 제대로 인식하지 못한다 - 보고 싶은 것만 본다.
5. 지나치게 단순화한다 - 쉽게 떠오르는 정보만을 가지고 판단한다.
6. 잘못된 기억을 가지고 있다 - 기억이 변하고 만들어진다는 사실을 간과한다.

이런 생각의 오류들이 사라지지 않는 까닭은 인류의 진화 과정의 결과로 추측된다고 한다. 사건에 대해 어떤 식으로든 설명하려는 태도가 경쟁에 유리했기 때문에, 단순한 우연의 결과에 대해서도 불합리한 설명을 갖다붙이는 오류가 인간의 사고 과정에 깊이 자리잡고 있다는 것이다. 따라서 생각의 오류를 피하는 방법은 지속적인 훈련밖에는 없는 것 같다. 다행스러운 일은 우리에게 확률과 통계라는 과학적인 도구가 존재한다는 것이고, 안타까운 일은 보통 사람들이 확률을 제대로 이해하고 있지 못하며, 어떤 사람들은 왜곡된 통계로 사기를 치고 있다는 사실이다.

앞에 제시한 바이러스 감염 확률의 문제는 조건부확률에서 도출된 베이즈 정리로 풀 수 있다. 간단하게 생각해 보자: 500명 중 1명은 실제 감염자이므로 양성으로 나타나며, 나머지 499명 중 5%인 24.95명은 감염되지 않았음에도 양성으로 나타난다. 검사 받은 사람이 양성으로 나타난 것은 이들 25.95(=1+24.95)명에 속한다는 얘기이고, 실제 감염되었을 확률은 1/25.95=0.0385... 즉, 3.85%이다.

책에서는 이 예와 관련하여 거짓말 탐지기의 위험성을 보여주고 있지만, 나는 산부인과에서 행하는 수많은 기형아 검사들이 떠올랐다. 결국 돈이 더 드는 양수검사를 권하기 위한 목적으로 이런 검사들의 결과가 악용될 수 있겠다는 생각이 들었다.

'과학'이란 단어는 정확함의 대명사이기도 하지만, 한편으로 '한계'라는 단어와 같이 다닐 때가 많다. 그러나 과학의 한계를 가장 많이 떠드는 사람들이 어떤 주장을 펴는지, 그리고 그 주장을 어떤 근거로 뒷받침하는지를 보면 우리가 가진 불완전한 도구인 과학이 얼마나 소중한지 다시 한번 실감할 수 있다. 언제나 의심하고 끝까지 확인하는 과학적 방법 이외에 어떤 것이 우리의 삶을 조금이라도 개선시켰는지.

책에 나온 경구들 중에서 둘이 기억에 남는다.

오늘날 이 세계에서 문제가 일어나는 근본 원인은, 어리석은 자들은 확신에 차 있는 반면 지적인 사람들은 의심으로 가득 차 있기 때문이다. - 버트런드 러셀
긴 인생에서 한 가지 배운 게 있다면, 실제와 견주어볼 때 우리의 과학은 모두 원시적이고 유치하다는 점이다. 그래도 과학은 우리가 갖고 있는 것 중에서 가장 소중하다. - 아인슈타인
prev"" #1 next