본문 바로가기
한 줄 경제

데이터분석의 중요성! 이수진 당선자, 오바마

by ▲△▲△▲△ 2020. 6. 6.

21대 총선, 서울 동작구 을, 서울 광진을.

 

이수진 민주당 당선자는 어떻게 산전수전 다 겪은 베테랑 나경원 전 한국당 원내대표를 이길 수 있었을까요?

대변인 타이틀을 달았지만 신참내기인 고민정 민주당 당선자는 어떻게 대권 잠룡 오세훈 전 서울시장을 꺾을 수 있었을까요? 

빅데이터로 이겼습니다. 빅데이터의 승리였습니다. 잉? 무슨 얘기냐고요? 2013년에 나온 <빅데이터, 승리의 과학>을 보면 대규모의 데이터를 이용하는 게 얼마나 중요한 일이고, 역사를 어떻게 바꿀 수 있는지를 보여줍니다. 

동작 을 이수진 나경원 경

당시 오마바 캠프의 선거운동 본부장인 짐 메시나는 취임하자마자 "우리는 모든 활동을 숫자로 측정할 것이다. 악순환과 선순환은 데이터가 있는지 없는지의 차이”라고 밝혔습니다. 

오바마 캠프의 전략은 빅데이터에 기반을 둔 `마이크로 타기팅`으로 요약됐는데요. 마이크로 타기팅은 유권자를 설득하고 투표 참여를 독려하고자 `전략 수립→시스템 구축→데이터 수집→타깃 설정→테스트→반복과 공유` 단계를 거칩니다. 빅데이터를 이용한 시스템 구축을 위해 오마바 캠프는 애플의 스티브 잡스와 구글의 에릭 슈미트 등 굴지의 IT 기업 수장을 만나 전략을 듣기도 했습니다.

실제로 50명의 데이터 분석가 50명의 소프트웨어 엔지니어, 200명의 디지털 미디어팀 총 300명의 전문가가 마치 과학수사대처럼 유권자 2억 명의 흔적을 모으고 분석했죠.

오바마캠프 데이터분

예를 들어 기네스 맥주를 즐기거나 현대자동차를 타는 사람은 모두 민주당을 지지하며 투표에도 적극 참여하는 사람이고, 폭스 뉴스를 즐겨보는 사람은 공화당 쪽에 기울어져 있다고 분석해내는 식이죠.

 

한국의 21대 총선도 비슷한 일이 있었습니다. 민주당 캠프는 이번 총선 박빙지에서 모두 빅데이터에 기반해 선거를 치렀습니다. 로우 데이터는 SKT나 KT 등 데이터 사업을 하는 곳에 구매 의사를 밝히면 살 수 있습니다. (법적으로 가능합니다)

 

무슨 데이 터였나고요? 예를 들면 동작구에 거주하는 사람들이 어느 역의 어느 출구를 주로 이용하는지를 보는 것이죠. 예를 들면 '사당역 2번 출구는 연립주택의 거주자들이 많은데, 이 사람들은 주로 3번 출구를 오전 6시에 이용하는 비율이 높다'라는 데이터를 뽑아내면 그 시간 때 거기 가서 집중적으로 사람을 만났다는 겁니다.

빅데이터는 어떤 층위의 소득을 가진 사람들이 어느 역의, 어느 출구를 주로 이용하는지가 디테일하게 알고 있는 것이죠. 

 

실제 이수진 당선자는 유세 동선과 현수막 설치 등을 빅데이터에 기반해 결정한 것으로 알려졌습니다. 빅데이터가 제공하는 시간대별 정보에 맞춰 아침·저녁 인사 장소 등 모든 일정을 짰다네요.

결과는 어떻게 됐죠? 초박빙을 뚫고 이수진 승. 고민정 승. 관련 기사도 이미 나와있네요.

[총선 이슈] 민주당 ‘180석’ 숨은 비결, ‘빅데이터 선거’였다

(http://www.polinews.co.kr/mobile/article.html?no=460646)

 

지난 5월 9일 자 [김지수의 인터스텔라]에도 이 같은 데이터의 힘을 강조하는 인터뷰가 실렸습니다. 구글과 스탠퍼드 공과대학에서 혁신 워크숍을 이끄는 알베르트 사보이아(‘아이디어 불패의 법칙'의 저자) 인터뷰였는데요.

한 문장도 버릴 것 없는 알찬 인터뷰였습니다. 아래 요약해놨습니다.

인터뷰의 핵심은 '의견과 생각보다는 빅데이터로 접근하고, 시장에서 내 아이템이 먹히는지 보려면 자기가 살고 있는 로컬 지역에서 그 아이템을 테스트해봐라!'였습니다.

알베르트 사보이아 데이터의 중요

마침 어제(5월 10일) 문재인 대통령의 3주년 기념 특별연설에서 정부가 '한국판 뉴딜 정책'을 언급하면서 '디지털 인프라를 구축하는 미래 선점 투자'라는 방향성을 제시했죠. 어느 분야의 빅데이터를 어떤 방식으로 얼마나 모을 것인지가 향후 국가의 어젠다로 제시된 겁니다.

 

빅데이터는 일상 속에서도 쓰입니다. 어버이날에 선물을 드릴 것이냐? 현금을 드릴 것이냐? 문제는 현금으로 결론 납니다. NHN의 데이터 분석에 따르면 그렇습니다. 현금이 더 많이 거론됩니다.

밸런타인데이에는 '초콜릿' 언급이 더 높고, 화이트데이에는 '선물' 언급이 더 많군요. 남자들은 주로 사탕보다는 선물을 여자 친구에게 건네고, 여자 친구는 남자 친구에게 초콜릿을 준다고 해석하면 될까요?ㅎㅎㅎ

 

다만, 이 인터뷰가 간과한 것은 하나 있습니다.

데이터는 로우 데이터를 어떤 방식으로 모으느냐에 따라 결괏값이 달라집니다. 21대 총선 전에 수많은 여론조사도, 질문지를 어떻게 만드느냐에 따라 결괏값이 판이하게 달라집니다.

 

A. 당신은 민주당을 지지하십니까?

B. 당신은 어느 정당을 지지하십니까? 

 

A를 먼저 묻는지, B를 먼저 묻는지에 따라 결과가 달라진다는 얘깁니다.

 

어떻게 모으느냐도 중요하지만, 어떻게 해석하느냐가 더 관건이기도 합니다. 해석에는 주관이 개입되기 마련이니까요. 데이터 값을 모아놓으면 '해석'은 개인이나 기관의 입장이 반영되죠.

돌아와서, 내 삶을 어떻게 데이터화할 수 있을까. 단순합니다. 금융은 '뱅크 샐러드' 같은 가계부를 쓰면서 모아놓으면 되고, '에버노트'를 쓰면서 회사의 자료를 정리하고요. '구글 드라이브'나 '네이버 클라우드'에 아무렇게나 올려두지 않고, 내 방식대로 정리해야 합니다. 데이터는 아무 배열 없이 쌓아두면 결국 쓰레기에 불과하니까요.

댓글