본문 바로가기
독서리뷰

구글 트렌드로 밝혀낸 충격적인 인간의 욕망. 세스 스티븐스 다비도위츠 지음 ⎡모두 거짓말을 한다⎦독서 리뷰

by 호수의백조 2025. 1. 29.
반응형

 

오랜만에 경제/경영 서적을 본 것 같다. 어디에선가 이 책에 대한 소개를 보고 흥미가 생겨 읽어보고 싶은 책 리스트에 올려둔 지는 꽤 되었는데 우연히 도서관에서 책을 고르다 이 책이 떠올라 선택한 책. 제목부터 책의 소개가 자극적이면서 흥미를 유발한다. 우리는 타인을 의식하며 살기 때문에 타인 앞에서 본인을 본인이 생각하는 이미지로 꾸며내기 위해 거짓말을 하기 쉽고 핸드폰이나 PC안 검색창에 솔직한 마음, 솔직한 관심사를 표현할 것이라는 가벼운 예상을 하며 책을 펼쳤다. 

 

모두 거짓말을 한다

 

 

저자 세스 스티븐스 다비도위츠

이 책의 저자 세스 스티븐스 다비도위츠는 데이터 과학자이면서 ⟪뉴욕타임스⟫ 칼럼니스트이다. 하버드대학교 경제학과 박사과정에 있으면서 '구글 트렌드'를 연구했다. '흑인 후보가 인종 때문에 손해 본 표는 얼마나 되는지'를 연구해 여론조사 전문기관도 알지 못했던 사실을 구글 데이터를 통해 밝혀냈다. 이 연구는 후에 도널드 트럼프의 지지층이 누구인지 설명하는 자료가 되면서 더 큰 신뢰를 얻게 되었다. 구글 검색어를 통해 사람들의 숨은 생각을 읽어내면서 구글 데이터 과학자로 일했고 와튼경영대학원에서 학생들을 가르치기도 했으며, 지금은 데이터 연구를 통해 검색창 속에 담긴 사람들의 솔직한 욕망에 대해 ⟪뉴욕타임스⟫에 칼럼을 쓰고 있다.

 

책 내용 리뷰

 우리는 네이버나 구글 등 검색엔진을 하루에도 몇 번씩 켜고 들여다본다. 가까운 사람에게 하지 못하는 고민 상담을 검색엔진에 할 때도 있다. 이런 우리의 활동들이 데이터로 기록되고, 쌓여서 정신질환, 성생활, 아동학대, 낙태, 광고, 종교, 건강 등에 관해 뜻밖의 사실을 드러내준다는 것이 이 책이 지속적으로 이야기하고 있는 내용이다. 이런 데이터들을 통해 다양한 분석을 할 수 있고, 그 분석을 통해 현실을 더 정확히 분석할 수 있고 그 분석 결과를 다양한 방향으로 활용할 수 있다는 데이터의 힘을 강조하고 있다. 데이터의 힘을 학술적인 이야기로만 서술하고 있는 것이 아니라 다양한 실제 분석 사례들을 소개하며 독자들을 이해시키고 있어 지속적으로 흥미를 유발해 계속 읽어나가게 하는 책이다.

 

 저자가 주장하는 빅데이터가 가진 힘은 총 네 가지 인데, 첫 번째는 새로운 유형의 데이터 제공, 두 번째는 솔직한 데이터 제공, 세 번째는 작은 집단도 자세히 들여다볼 수 있고 작은 집단에 관해 유의미한 정보를 얻을 수 있다는 것, 마지막 네 번째는 인과적 실험의 실행 가능성이다. 빅데이터의 힘을 간단히 소개하는 초반에 가장 흥미로웠던 부분은 기분 전환과 관련된 검색어의 조합으로 실업률을 추적할 수 있다는 것이었다. 포르노나 게임 등의 검색어 조합으로 그 검색 데이터들의 갖고 있는 숨은 의미를 찾을 수 있다는 부분은 오류도 많겠지만 굉장히 재미있는 분석이 될 수도 있을 것 같아 독자의 관심을 계속 붙잡아 두기에 충분했다.

 그리고 데이터 분석의 힘을 보여주는 몇 가지 사례들을 소개하고 있는 부분 또한 재미있고 데이터 분석이라는 세계로 깊숙이 빠지게 만들었다. 경주마를 분석하는 제프 세이더, 월마트가 분석한 허리케인과 딸기맛 팝타르트의 상관관계, 그리고 올리 아센펠터의 와인의 품질 분석. 유의미한 결과를 만들어내는 데이터값을 찾는 과정도 재미있었지만 목표가 미래를 예측하는 것이라면 모델이 어떻게 좋은 효과를 내는지 정확한 이유를 너무 궁금해할 필요는 없다는 점도 가볍게 뒤통수를 맞는 느낌이 들면서도 즐거웠다. 모든 상관관계에 이유가 있는 것은 아니고 그냥 그러할 뿐이라는, 정확한 수치만 얻으면 그만이라는 결론. 그리고 뒤이어 흥미를 유발하는 재미있는 그림 몇 개가 소개된다. 워드 클라우드 word cloud라고 불리는 이 그림은 성별에 따라 연령대에 따라 그 단어의 사용이 해당 성별이나 연령대에 많이 치우쳐 있다는 것을 보여주는 그림이다. 남성은 상대적으로 욕을 많이 사용하고 게임에 관심이 많다. 여성은 쇼핑, 사랑 등에 관심이 많고 이모티콘을 더 많이 사용한다. 그리고 연령대에 따른 관심사를 보여주는 워드 클라우드를 보고 저자는 이렇게 얘기한다. '마시고 일하고 기도하고' 사람들은 10대 때 술을 마시고, 20대 때는 일을 하고, 30대 이후에는 기도를 한다는 의미로 저자는 이 워드 클라우드를 줄리아 로버츠가 주연한 '먹고 기도하고 사랑하라 Eat Pray Love'에서 따와 'Drink Work Pray'라는 귀엽고 재미있는 이름을 붙인 듯하다. 한 번 사용하고 나면 흘러가 없어져 버리는 이 단어 데이터들을 통해 가볍게 연령대에 따른 성별에 따른 관심사도 분석해 볼 수 있지만 나아가서는 공화당, 민주당이 사용하는 단어가 다르고 이 단어를 어떤 언론사들이 자주 사용하는지를 분석하여 해당 언론사의 보수나 진보 등의 성향을 알 수 있다는 결론에 이르는 흐름도 매끄러웠다. 

 뒤이어 이 책에서 가장 은밀한 내용을 담고 있는 디지털 자백약 부분은 우리가 가지고 있는 인종차별, 여아 등에 대해 갖고 있는 고정관념에 대해 얼마나, 어떻게 한 입으로 두 말 혹은 세 말을 하는지 보여준다. 우리는 설문조사에 거짓을 말할 확률이 크고 구글 검색은 솔직하게 한다. 그러나 같은 인터넷 세상 속 SNS에서는 또 다르게 거짓말할 확률이 높아진다. 이걸 알고 있던 페이스북의 저커버그나 넷플릭스는 "사람들이 말하는 것을 믿지 말고 행동하는 것을 믿어라."는 결론에 다다르게 된다. 그리고 내가 여기에서 소소하게 얻은 교훈은 "당신의 구글 검색을 타인의 소셜미디어 포스팅과 비교하지 말라." 

 재미있는 데이터 분석은 끊임없이 이어진다. 14-24세의 당시 대통령의 인기를 기반으로 정치 지지당을 결정하게 된다는 것, 자녀가 중산층으로 살 확률이 높은 조건과 작가나 예술가, 비즈니스 리더 등 명예로운 성공을 할 확률이 높은 조건이 다르다는 것 등. 이렇게 많은 분석을 할 수 있는 빅데이터. 저자는 그러나 이 빅데이터의 한계점 또한 인정하고 언급한다. 빅데이터는 결국 모든 것을 보여줄 수는 없고 또 잘못된 결론을 낼 수도 있기에 결국 스몰데이터라고 불리는 설문조사와 인간의 판단이 필요하다는 것이다. 그렇기 때문에 페이스북에서도 숫자가 놓치는 것을 찾기 위해 사회심리학자, 인류학자, 사회학자 등을 고용한다는 점을 언급하며 서로의 상호 보완이 필요하다는 점을 강조한다. 그리고 빅데이터가 유발하는 윤리적인 문제도 언급하고 있다. 좋은 도구인 빅데이터를 누가, 어떻게 활용하느냐에 따라 개인을 차별하는 도구로 사용될 수도 있고 개인의 자유를 침해하는 경우도 생길 수 있으니 분석가, 사용자, 소비자 등 모두 주의해야 한다는 점은 더 강력히 강조해도 부족한, 정말 무서운 위협이 될 수도 있을 것 같았다. 

 

 여기까지는 재밌었다. 그러나 이 책의 아쉬운 점은 결론. 책의 전체적인 분위기에 맞게 결론 또한 유쾌하긴 했지만 좀 힘이 빠지는 느낌도 있었다. 경제학 책을 끝까지 읽는 사람은 어차피 소수니까 나는 그냥 이 정도로 마무리 짓겠다는 느낌? 핑계? 어쨌든 나는 다 읽었고, 아쉬운 결론까지 함께 했다.

 

 디저트가 좀 아쉬웠지만 에피타이저부터 본식까지는 괜찮았던 코스 요리였다는 것이 나의 총평.

 

기억에 남는 구절

"알고리즘은 당신보다 당신에 관해 더 잘 알고 있다." 넷플릭스의 데이터 과학자였던 그자비에 아마트리아인이 한 말이다. - 184p

 

A/B 테스트는 인터넷을 그토록 중독성 있게 만드는 데 큰 역할을 하고 있을 것이다.

⟪저항할 수 없는⟫에는 '디자인 윤리학자' 트리스탄 해리스의 말이 인용돼 있다. 그는 인터넷의 특정 사이트에 방문하지 않고 견디기가 그토록 힘든 이유를 설명한다. "스크린 뒤편에는 당신의 자기 관리능력을 허물어뜨리려는 전문가 1,000명이 있다."
그 전문가들이 이용하는 것이 바로 A/B 테스트다. - 252p

반응형