정보 과잉 속 여전히 강력한 무기, 숫자
나에게 필요한‘진짜’통계를 알아보는 법
광고, 정치, 언론 등 다양한 분야에서 어떤 주장을 뒷받침할 때 구체적인 수치는 설득력과 객관성을 가진 근거로서 사용된다. 하지만 정말로 그 숫자들을 있는 그대로 믿어도 될까? 통계는 조작될 수 있고, 모든 통계가 타당한 것도 아니다.
정보가 끊임없이 생성되고 소비되는 세상에서 데이터 문해력은 필수 역량이 되었다. 쏟아지는 데이터에서 의미를 찾아내고, 이를 비판적으로 해석하는 능력인 데이터 문해력은 통계학의 몇 가지 기본 이론만 기억해도 크게 향상될 수 있다.
믿을 만한 수치와 의심스러운 수치를 구분하고, 오해의 소지가 있는 주장 속에서 진실을 찾아내며, 지나치게 긍정적인 통계에 의문을 제기하고, 통계를 이용한 터무니없는 주장을 반박해 보자. 이 책과 함께라면 얼마든지 가능하다.
상세이미지
저자 소개
저자 : 앨버트 러더퍼드
수학적 사고 능력을 길러 주는 다수의 베스트셀러를 출간한 작가이다. 여가 시간에는 가족과 함께 지내고, 최신 과학 보고서를 읽고, 낚시를 즐기고, 와인에 대해 조금 아는 척하기를 좋아한다. 또한 밴저민 프랭클린의 ‘지식에 대한 투자는 항상 최고의 이익을 가져다준다.’는 말을 굳게 믿는다.
역자 : 장영재
서울대학교에서 원자핵공학, 충남대학교에서 물리학을 공부했고 국방과학연구소 연구원으로 일했다. 글밥아카데미 수료 후에 바른번역 소속 번역가로 활동하고 있으며, 옮긴 책으로는 『한국, 한국인』, 『남자다움의 사회학』, 『신도 주사위 놀이를 한다』, 『부의 세계사』, 『기하학 세상을 설명하다』, 『창발의 시대』 등이 있다.
목 차
1장 이 책이 필요한 이유
2장 통계 분석의 기초
3장 데이터의 수집과 해석
1. 질문의 정의
2. 데이터의 수집
3. 데이터의 정리 및 요약
4. 가설의 검증과 추론의 도출
5. 결과의 적용
4장 p-값과 베이즈 정리
5장 통계적 사고
1. 데이터의 수집은 어떻게 이루어졌는가? 수집한 방법이 연구에서 파악하려는 내용과 일치했는가?
2. 연구 결과가 다른 연구에서 재현될 수 있을까?
3. 데이터를 고려할 때, 도출된 결론이 논리적인가?
4. 데이터는 어떻게 제시되었고, 어떤 식으로든 오해를 부를 소지가 없는가?
6장 실생활에 적용되는 통계
7장 시각적 표현: 이미지를 통해 이야기하기
8장 통계의 잘못된 해석: 다섯 가지 일반적인 함정
1. 축척의 무시
2. 잘못된 중앙의 척도를 바라보기
3. 상관관계와 인과 관계의 혼동
4. 편향을 알아보지 못함
5. 인과 관계를 거꾸로 이해하기
9장장 데이터 조작과 도표의 힘
10장 결론
마치며
주
참고 자료
출판사 서평
왜 옷을 살 때마다 사이즈가 마음에 들지 않을까?
왜 여론 조사와 대선 결과가 이렇게까지 다를까?
모든 게 통계와 관련돼 있다.
통계를 근거로 제시하는 홍보는 정말로 흔하게 접할 수 있다. 하지만 그 통계가 정말로 객관적이고 타당한 근거일까? 특정 주장을 포장하기 위해 편향된 건 아닐까? 과장이나 오류가 숨어 있지는 않을까? 어떤 통계를 신뢰하고, 어떤 통계를 의심해야 할까?
늘 하던 일을 하는 데 걸리는 시간을 생각해 하루의 계획을 세울 때도, 방대한 규모의 교통 패턴을 기반으로 짜인 노선대로 도착한 버스를 탈 때도, 청취자 성향을 고려해서 선택된 노래가 흘러나오는 라디오를 들을 때도, 수많은 사람들의 ‘평균’ 사이즈에 맞춰 제작된 기성복을 구매할 때도, 인터넷에서 광고를 접할 때도. 통계는 늘 우리 주변에 존재한다. 우리의 모든 생활이 통계로 둘러싸여 있다고 해도 과언이 아니다. 이 책은 그런 통계를 분석하는 데 필요한 기본 지식부터 시작해 일상 속에서 자주 사용되는 통계의 기초 이론을 이해하기 쉽게 설명한다. 간단한 예시와 실생활에 바로 대입해 볼 수 있는 활용법을 통해 어려워 보이던 개념도 자연스럽게 체득할 수 있다.
데이터가 쏟아지는 시대
점점 더 중요해지는‘데이터 문해력data literacy’
데이터를 효과적으로 이해하고 전달하는 능력, 즉 데이터 문해력의 중요성이 점점 더 강조되는 시대다. 2022년 『포브스Forbes』의 한 기사에서는 많은 경영자들이 기본적인 데이터 문해력을 갖춘 인재를 원한다고 응답했다. 매일매일 쏟아지는 수많은 정보 속에서 정확하면서도 쓸모 있는 정보를 찾아내기 위해서는 데이터가 어떻게 수집되고 분류되며, 어떤 형태로 전달되는지를 알아야 한다. 이 과정은 통계를 이해하는 것과도 연결된다.
통계는 어떻게 산출되는지, 정보 수집 단계에서 생기기 쉬운 오류는 무엇인지, 자료를 볼 때 어느 부분을 꼼꼼히 확인해야 하는지, 그래프를 해석할 때 빠지기 쉬운 함정으로는 어떤 것들이 있는지. 저자가 정리한 내용을 차근차근 따라가다 보면 통계가 오용되는 방식, 조작된 데이터를 알아차리는 방법을 배우게 된다. 정치나 광고에서 사용되는 숫자를 보다 객관적으로 이해하고 그 너머에 숨겨진 사실을 꿰뚫어볼 수 있는 지식을 얻을 수 있다. 처음에는 허황된 말처럼 들릴지 모르지만, 직접 읽기 시작하면 생각이 달라질 것이다.
책 속에서
98%를 인용한 광고는 표본으로 추출된 모집단에 상태가 호전된 사람들만 포함되었다는 사실을 알려 주지 않았을지도 모른다. 또는 살 빼는 약을 복용한 사람들이‘ 평균적으로’ 23.5킬로그램의 몸무게를 줄이기는 했지만, 68킬로그램을 줄인 사람 한 명과 전혀 줄이지 못한 사람 다섯 명이 표본으로 추출되었을 수도 있다. 통계는 온갖 종류의 주장을 제시하기 위하여 조작될 수 있고, 모든 통계가 타당한 것은 아니다.
- 10쪽
몇 가지 기초적인 통계를 알면 참된 주장과 거짓 주장을 구별할 줄 아는 더 나은 소비자가 되는 데 도움이 된다. 진실되거나 중립적인 관점을 나타내는 통계인지, 아니면 특정한 주장을 위하여 편향된 통계인지를 알게 해 준다. 정치를 더 잘 이해하고, 광고주의 조작을 더 잘 알아채고, 더 낫고 건강한 삶을 살아가는 데 도움이 되는 결론을 더 잘 도출하게 된다. 통계는 당신이 더 나은 시민이 되도록 도울 수 있다
- 14쪽
엄마의 하루에서 모든 일이, 몇 시에 일어날지부터 장을 볼 때 돈을 얼마나 쓸지를 결정하는 것까지 자신이나 다른 사람의 통계 분석에 따라 결정된다. 대부분 사람은 이런 계산이 존재하는지 또는 자신이 머릿속에서 그런 계산을 하고 있는지를 전혀 알지 못하지만, 그런 계산 없이는 우리가 사회의 구성원으로 기능할 수 없다.
- 85쪽
이 책은 통계의 어려움과 올바른 통계가 대단히 중요함을 가르치는 것을 목표로 한다. 과학자, 데이터 분석가, 연구원들은 과학 연구를 수행하는 방법에 대하여 철저한 교육을 받는다. 그들은 적절한 질문을 만들어 내는 데 몇 달을 소비하고, 정확한 데이터를 수집하는 방법을 알아내느라 몇 년을 보낸다. 오류와 마주치고, 실수를 발견하고, 때로는 수집된 데이터를 버리고 다시 시작해야 한다. 이것이 바로 세계적 생명 공학 기업들이 코로나19 백신을 그만큼 빨리 제조하고 시험하고 대량 생산한 것이 그토록 놀라운 이유 중 하나다.
- 145쪽