HOME  >  시사  >  종합

빅데이터에서 방탄소년단은 ‘만수르’…4차 산업혁명의 원유 뚫어라



방탄소년단은 2018년을 이야기할 때 빼놓을 수 없는 키워드가 됐다. 올해 세계에서 조회수 1억건을 가장 먼저 달성한 유튜브 콘텐츠는 방탄소년단의 ‘마이크 드롭(MIC Drop)’ 뮤직비디오다. 유튜브 본사가 있는 미국 캘리포니아주 시간으로 1월 1일 오전 7시37분에 수립된 기록이다. 방탄소년단은 그 이후부터 미국 빌보드 차트에서 순위권 밖으로 밀려나는 법이 없었다. 지난 5월 21일 빌보드 뮤직 어워드에서 ‘톱 스페셜 아티스트’에 2년 연속으로 선정됐다.

방탄소년단은 음악에 메시지를 담았다. ‘스스로 사랑하는 법을 배우자.’ 이 메시지가 세계 젊은이들을 열광하게 만들었다. 방탄소년단은 지난 9월 25일 미국 뉴욕 유엔본부 신탁통치이사회 회의장 연단에서도 ‘자기애’를 말했다. 미국 시사주간지 타임은 10월 11일자 아시아판에 방탄소년단을 표지에 실으면서 ‘차세대 리더’로 소개했다.

올해 한국을 지나간 잔상들은 많았다. 세 번의 남북 정상회담이 열렸고 평창 동계올림픽이 개최됐다. 지난여름의 폭염 속에서 한국 축구대표팀의 아시안게임 금메달로 함성이 울려 퍼졌다. 하지만 미래의 우리가 올해를 기억할 때 가장 먼저 떠올릴 장면은 어쩌면 방탄소년단의 뮤직비디오일지도 모른다. 빅데이터가 그렇게 말하고 있다.

국민일보는 지난달 27일 빅데이터 분석업체 데이터앤리서치에 의뢰해 방탄소년단의 올해 버즈량을 분석했다. 버즈(Buzz)는 빅데이터에서 특정 키워드에 대한 언급을 말한다. 국내 양대 포털 사이트인 네이버·다음의 블로그·커뮤니티·뉴스 댓글 게시판, SNS 트위터·인스타그램 타임라인, 세계 최대 동영상 공유 사이트 유튜브에서 1월 1일부터 11월 22일까지 버즈를 수집했다. 페이스북은 정보를 공개하지 않아 수집 대상에서 제외했다.

방탄소년단의 버즈량은 11개월 동안 9334만199건으로 집계됐다. 하루 평균 28만건, 월평균 848만건씩 언급된 셈이다. 이 추세가 유지되면 방탄소년단의 올해 버즈량은 12월 중으로 1억건을 넘어설 것으로 보인다. 이미 지난해 12개월을 모두 합산한 버즈량(7675만5879건)의 1.2배 수준으로 늘어났다. 지난해 증명된 방탄소년단의 인기와 성공이 올해에도 상승 곡선을 그리고 있다는 사실을 이 지표에서 확인할 수 있다.

방탄소년단의 버즈에서 66.8%는 긍정적 반응이었다. 사람들은 방탄소년단을 떠올리면서 ‘행복’(69만5809건) ‘사랑’(63만6392건) ‘감사’(58만6076건)를 이야기했다. 지난해의 경우 ‘귀엽다’(48만3460건) ‘응원한다’(48만576건)와 같은 아이돌 팬들의 보편적 반응이 대부분이었다. 부정적 여론은 8.7%에 불과했다.

방탄소년단의 버즈량은 문재인 대통령의 5배를 웃도는 수치다. 문 대통령은 김정은 북한 국무위원장과 판문점 군사분계선에서 처음으로 손을 맞잡은 지난 4월 27일, 66만1014건의 버즈량을 기록했다. 하지만 평소의 일평균 버즈량은 5만건을 하회한다. 그나마 문 대통령의 버즈량은 국내 정·재계 인사나 문화·체육계 스타들보다 많은 편이다.

더 이상 ‘포털 검색 결과’가 아니다

우리 사회는 데이터를 활용하지 않아도 정상적으로 작동한다. 방탄소년단이 올해 이룬 성과와 인기는 굳이 빅데이터 분석 과정을 거치지 않고도 인지할 수 있다. 버스에서 하차할 때 자전거에 치일 확률을 계산하거나 공원에서 토스트의 가격을 비교하는, 이렇게 시시각각 벌어지는 여러 변수를 데이터 분석으로 대응하지 않는다. 데이터는 그저 ‘포털 사이트 검색으로 수집하는 참고자료’ 정도로 여겨졌다. 이것이 데이터에 대한 과거 우리의 관점이다.

하지만 2010년대 들어 데이터의 개념과 활용 방식은 달라졌다. 스마트폰 보급을 계기로 세상을 보는 창이 유튜브로, 소통의 창구가 SNS로 바뀌면서다. 현재 데이터의 크기와 분량은 기하급수적으로 늘어났다. 미국 컴퓨터업체 델EMC의 ‘디지털 유니버스 보고서’를 보면 2012년 한 해 동안 세계적으로 생성된 데이터의 양은 2.8제타바이트(1조1000억 기가바이트)로, 인류가 그 이전까지 생성한 데이터 총량을 합친 것보다 많았다. 이를 DVD에 저장하면 지구에서 달까지 두 줄로 쌓을 정도의 분량이 된다.

데이터가 빅데이터(bigdata)라는 새로운 개념으로 확대된 이유는 여기에 있다. 2010년대 들어 축적된 데이터의 양은 기존의 방식으로 수집·저장·분석이 불가능한 수준으로 방대해졌다. 국립중앙과학관 연구 결과에 따르면 1분 동안 구글 검색 횟수는 200만건, 트위터에 작성되는 글은 27만건이다. 그동안 유튜브로 72시간 분량의 영상이 올라오고 있다. 그 규모는 최소 수십 테라바이트에 이른다. 더 이상 포털 검색에만 의존할 수 없는 분량이다. 인터넷망 보급 초창기인 2000년 전후 ‘디지털 노마드(유목민)’가 모여 ‘디지털 메트로폴리스(대도시)’를 이룬 셈이다.

빅데이터는 인공지능(AI)의 의사결정과 자율주행차의 운행을 가능하게 만들었다. 쇼핑몰의 상품 제안과 SNS의 팔로어 추천은 이미 실생활로 파고든 빅데이터의 산물이다. 이용자의 관심사와 시선의 동선은 모두 빅데이터로 축적된다.

통계 기법에 의해 표본집단을 구성하고 질의응답하는 방식으로 이뤄지는 여론조사와 다르게 빅데이터는 그 자체로 모집단이 돼 대중의 선호를 정확하게 읽어낼 수 있다. 방탄소년단의 인기를 ‘응답자의 몇 퍼센트’라는 식의 모호한 비율로 가늠하지 않고 ‘몇 명의 지지를 얻었다’고 정확하게 말할 수 있는 세상이 다가오고 있다는 얘기다. 이렇게 빅데이터는 4차 산업혁명 시대에서 모든 기술의 원천이 된다. 미국 IT 리서치업체 가트너는 빅데이터를 ‘21세기의 원유’에 비유했다.

‘빅브라더’ 오용되지 않을까

미국 미니애폴리스의 대형마트 ‘타깃’으로 한 중년 남성이 들어왔다. 그는 고등학생 딸에게 배송된 광고물에 육아 상품만 소개됐다는 이유로 마트 직원을 붙잡고 항의했다. 그는 “고등학생에게 임신을 권유하느냐”며 호통을 쳤다. 하지만 이튿날 마트에 다시 전화를 걸어 사과했다. 딸은 임신 중이었다. 아버지도 몰랐던 딸의 정보를 마트는 알고 있었다. 2012년 2월 16일 미국 일간 뉴욕타임스에서 소개된 이 해프닝은 빅데이터의 일상화를 설명하는 동시에 ‘빅브라더’로 오용될 가능성을 경고하고 있다.

빅브라더는 조지 오웰의 디스토피아 소설 ‘1984’에 등장하는 독재자. 정부의 감시를 상징하는 가상의 인물이다. 포털·SNS·쇼핑몰에서 이뤄지는 모든 상업 활동, 여기서 쌓이는 개인정보는 4차 산업혁명의 동력이 되기도 하지만 권력의 감시체계에 악용될 수 있다. 빅데이터의 이런 단면은 빅브라더에 비유된다. 빅데이터가 악의를 품은 절대 권력자에 의해 사회를 완벽하게 통제하는 수단으로 악용될 수 있다는 얘기다.

시장을 50조원 규모로 육성한 미국을 제외한 나머지 국가들이 빅데이터를 적극적으로 활용하지 못하는 이유는 여기에 있다. 우리나라에서는 빅데이터의 양면을 고려한 논의가 점진적으로 이뤄지고 있다. 정부와 여당은 지난달 21일 ‘개인정보 규제 3법’(개인정보보호법·정보통신망법·신용정보보호법) 개정안에 합의했다. 개정안은 주민등록번호와 같은 신상정보와 구분되는 개념으로 가명·익명정보 도입을 골자로 하고 있다. 가명·익명정보는 산업·연구에 활용될 수 있어 빅데이터 시장 확대의 원천이 될 수 있다.

박인복 데이터앤리서치 대표는 “빅데이터가 산업 생태계의 중심으로 들어갔다. 한국의 정책은 앞서가는 시장을 뒤쫓는 수준”이라며 “IT 강국인 한국은 어느 나라보다 많은 데이터를 축적했다. 이를 어떻게 활용할지 정부와 민간에서 고민해야 한다”고 말했다.

김철오 강문정 기자 kcopd@kmib.co.kr


트위터 페이스북 구글플러스
입력