본문 바로가기
Online_journalism

"데이터 저널리즘은 혁신 저널리즘 그 자체여야 한다"

by 수레바퀴 2018. 5. 14.

사이버커뮤니케이션학회 춘계학술대회 기획세션. 데이터 저널리즘의 현황과 과제를 주제로 발표했다.

사이버커뮤니케이션학회 춘계학술대회에서 언론현장과 또 데이터저널리즘의 미래를 이야기할 수 있는 기회를 얻게 돼 감사하게 생각합니다.

많은 사람들이 데이터 저널리즘은 언제 시작되었는지 알게 된다면 놀라는 경우가 많습니다. 사이먼 로저스(전 가디언 기자, 구글 뉴스랩)는 한 저술에서 19세기 초 가디언에서 이미 시작되었다고 밝힌 바 있습니다. 19세기 말 통계는 이미 많은 신문 기사에서 일부가 되었습니다. 

다우 존스 앤 컴퍼니 (Dow Jones & Company)는 1884 년에 주식 시장 평균을 발표하기 시작했습니다. 1952 년 CBS는 컴퓨터를 사용해 대통령 경선의 결과를 예측합니다. 30년 전 일부 언론사에 선구적인 컴퓨터가 도입된 조사방법론에 획기적인 향상을 이끌었습니다.  

CAR가 뉴스 생산 과정에 깊이 도입되었고 인터넷 이후 데이터 저널리즘은 더 맹렬히 성장했습니다. 2008년 프로퍼블리카도 그랬지만 데이터의 공개도 확대되었습니다.  2014년 워싱턴포스트, 뉴욕타임스는 물론이고 신생 미디어들의 품에 데이터 저널리즘이 본격적으로 다뤄졌습니다. 그리고 오늘날 클라우드 컴퓨팅, 모바일, 오픈소스, AI, Iot 등 연결 혁명은 '뉴스의 시대'를 더 극적으로 바꾸고 있습니다.

특히 지난 10 년 동안 데이터 저널리즘은 크게 발전해왔습니다. 예술적인 인터랙티브 및 시각화, 스토리텔링 플랫폼 개발, 오픈 소스 소프트웨어 등 강력한 도구들과 함께 성장했습니다. 이것들은 데이터 저널리즘에 대한 업계 안팎의 관심을 확장시켜왔습니다. 직업기자들은 데이터를 이해하고 탐색하며 또 이를 통해 통찰력을 제시하는데 주목하기 시작했했습니다.


현장의 고민과 내일의 과제에 초점을 맞춰 발표하겠습니다.

연결, 데이터, 독자 이 세 가지는 오늘날 저널리즘에서  가장 뜨거운 주제입니다. 그 가운데 '연결'은 레거시 미디어의 오랜 담론입니다. 네트워크화 된 일상과  소프트웨어(어플리케이션:메신저, 커머스, 금융) 그리고 뉴스조직보다 더 짜임새 있는 기업과 정부의 콘텐츠들, 개인의 이야기들이 매일 쏟아집니다. 그리고 그것이 연결된 채로 뉴스와 경쟁하고 있습니다. 더 정확하게는 기존의 뉴스를 압도하고 있습니다. 

이것은 뉴스조직의 리소스, 기자의 기술 스킬과 노동, 개인정보보호 등 안팎에 위기를 일으킵니다. 그러나 현명한 독자들 간의 연결은 동시에 큰 잠재력을 안고 있습니다. 이것은 저널리즘의 위기-신뢰와 명성의 저하, 전문성의 실추, 비즈니스모델의 붕괴를 근본적으로 재정의하는 원천이 될 수 있습니다. 그리고 가장 가능성 있는 주제입니다. 

또 다른 이슈는 데이터입니다. 인류 역사상 전례가 없는 데이터가 생성되고 있습니다. 데이터의 생성과 연결은 뉴스조직에 과제를 제시합니다. 의미있는 데이터의 발견과 재구성, 설득력 있으며 신속한 전달이 필요합니다. 

이것은 뉴스조직에 새로운 변화를 촉구합니다. 기술의 구분이 필요 없고 기자의 구분이 따로 없습니다. 모든 시스템은 투명하며 절차를 존중하는 방향입니다. 그러나 데이터를 다루는 사람과 조직, 비중과 가치는 여전히 논쟁적인 주제입니다.

독자도 중요합니다. 무엇보다 소극적인 뉴스 소비에 머물렀던 독자는 이제 그들의 열정과 에너지를 나누고 있습니다. 설득력 있는 스토리를 만드는 도전에 나서고 있습니다. 그들 스스로 미디어의 힘을 이해하고 움직이는 의미를 가다듬고 있습니다. 오늘날 언론이 주목해야 하는 것은 당연히 현명한 독자들입니다. 

이렇게 '뉴스의 시대'는 쏟아지는 데이터, 많은 사람들의 현명함을 일으키는 연결, 그리고 매 순간 참여와 에너지를 가진 독자들로 수놓입니다. 저널리즘은 이것으로부터 위기와 기회를 공유합니다. 혁신의 속도와 강도에 따라 변화의 에너지는 다르겠습니다마는 중요한 것들이 있습니다. 

먼저 '독자의 영향력'입니다. 캐서린 바이너(katherine viner) <가디언> 편집장은 '독자의 부상 : 오픈 웹 시대의 저널리즘'(2013) 에서 기자들이 "진실을 말하는 사람, 감각이 있는 사람, 설명자"로서 그 어느 때보다 더 많은 필요가 있는 사람인지 질문합니다.

기자와 독자 간의 관계, 독자의 위상, 직업기자의 역할에 대한 사회적 인식과 위치를 근본적으로 돌아봐야 합니다. 저널리즘은 인터넷을 통해 관객과 상호 작용하고 새로운 방법으로 스토리를 발견, 배포 및 토론할 수 있습니다. 그리고 독자 가운데 일부는 실제로 직업 기자와 뉴스조직보다 더 많은 것을 다루기 시작했습니다.

둘째, 기술의 활용입니다. 기자들은 온라인 커뮤니케이션을 통해 더 많은 정보를 확보할 수 있게 되었고 뉴스 생산 단계를 넘어 검색엔진 최적화(Serch Engine Optimize) 등 배포의 문제를 인지하고 있습니다. 다양한 소프트웨어를 직접 사용하는 기회도 증가하고 있습니다. 

뉴스 생산 과정에 적용된 기반 기술과 생산 이후 시장 및 고객 친화적 방향을 위해 고안되는 다양한 통계 분석들은 미래 경쟁을 위해 필수적인 것으로 부상하고 있습니다. 

셋째, 뉴스의 변화입니다. 캐서린 <가디언> 편집장은 '독자의 부상 : 오픈 웹 시대의 저널리즘'(2013)에서 "인터넷 이후 '정보'는 신문-서적처럼 견고하고 경계가 확실한 포맷에서 액체처럼 유동적이고 무한한 확장성을 띤다"고 말합니다. 이제 기사는 라이브 영상, 트윗, 짧은 비디오(짤방), 오디오, 포토 슬라이드, 인터랙티브 스토리 텔링또는 데이터 자체로 다가옵니다. 더 나아가 어떤 것은 모바일 앱과 그 독자에게만 푸시되기도 합니다. 

정보를 담은 종이신문이 만들어지면 그것 자체로 끝났지만 디지털 뉴스는 끊임없이 업데이트되고, 개선되고, 변경되고, 이동되고, 개발되고, 또한 대화와 협업이 계속 이뤄집니다. 그것은 살아 있고, 진화하고, 무한하며, 끊임없이 살아 갑니다.

이러한 변화는 뉴스 시장을 둘러싼, 익숙하지만 치열한 이슈들과 조응하고 있습니다.

디지털 생태계의 오랜 이슈들.

첫째, 유료화를 위한 기술장벽(paywall)입니다.  프리미엄 콘텐츠를 생산하고  특별한 마케팅으로 유의미한 성과에 근접해가야 합니다. 개별 언론사 단위 그러나 이 뿐만 아니라 더 나아가 전체 언론사의 관점에서 뉴스유통과 경쟁환경은 재설정될 필요가 있습니다. 

이 과정에서 우리는 보다 근본적이고 복잡한 질문들에 귀기울여야 합니다. 언론이 가진 답이 불충분할수록 우리는 저널리즘의 신뢰에 초점을 둬야 합니다. 그리고 우리는 이 방향으로 가야만 합니다. (키워드) 신뢰의 저널리즘, 지헤의 저널리즘

둘째, 하이퍼링크로 대표되는 유연성입니다. 디지털 생태계에서 뉴스의 가치를 더 끌어올리는 것은 뉴스조직이 가진 다양성과 관용성 같은 철학입니다. 독자들에게 더 많은 경험을 제공할 수 있는 폭넓은 변화는 왜 더딥니까? (키워드) 사용자 경험을 제공하는 서비스

셋째, 독자와의 상호작용에 대응해왔습니까? 독자는 세련되고 현명하지만 언론사는 그렇지 못합니까? 아니면 그 반대입니까? 우리는 독자와의 연결과 관계의 가치와 위험성에 얼마나 깊이 고민하고 있습니까? (키워드) 독자외의 관계

넷째, 오늘의 주제입니다만 '데이터'를 바라보는 언론의 인식과 태도에 어떤 변화가 형성되고 있습니까? FT의 제품 책임자 가디 레이바브(Gadi Lavav)는 '데이터'에 대한 뉴스조직의 각성의 전모를 보여줍니다. 언론기업의 성격, 구독자에 대한 목표 등 대전환의 어젠다가 공유될 때 의미가 있기 때문입니다. 데이터는 보다 확장된 융합적 방식의 모습을 제시할 수 있습니다. . 

이러한 생태계의 이슈는 언론의 혁신을 둘러싼 가장 확실한 장면을 갖고 있습니다. 이중에서 데이터가 갖는 의미와 영향은 무엇일까요?

먼저 뉴스조직에 기술 업무가 부상하고 있습니다. 위계적이며 관행적인 판단과 지시에서 공개적이며 협력적인 업무가 확대되고 있습니다. 기술 수준도 고도화하고 있습니다. 기존 기자 업무에도 변화가 일어나고 있습니다. 

데이터와 기술, 데이터와 예술 등 다양한 데이터 기반 뉴스가 안팎의 데이터 접근성과 비례해 시도되고 있습니다. 

독자 참여는 두 가지의 양상입니다. 독자와 직접적 커뮤니케이션이 없더라도 독자와 뉴스의 접점에서 확보되는 데이터를 통해 뉴스와 그 서비스가 수렴되고 있습니다. 독자가 뉴스에 가하는 압력과 방식이 커지면서 독자의 역할과 책임이 커지고 있습니다. 독자 댓글을 활용하는 워싱턴포스트의 '코럴 프로젝트'를 비롯 독자가 직접 생성하는 데이터에 주목하고 있습니다.  

기자들은 데이터에 빈번히 접근할수록, 데이터 해석에 시간을 투여할수록 취재원이나 제한된 구조에서 만드는 뉴스의 한계를 인식합니다. 이것은 기자나 뉴스조직에 설정해준 세계관 즉, 프레임을 위협합니다. '데이터'에 의존할수록 기자의 노동 성격에 변화가 일어납니다. 기술을 고려하는 작업 과정 때문입니다. 수학적이고 과학적인 사고도 필요로 합니다. 

뉴스는 더욱 변화합니다. 데이터가 뉴스 스토리에 미친 영향은 첫째, 심미성(형식성) 둘째, 맥락성(심층성) 셋째, 기획성(협력성)에 둡니다. 이것은 한마디로 '독자 관점'의 뉴스를 제작하게 됐다는 의미이기도 합니다. 그 어느때보다 뉴스의 완성도 신뢰도를 고려합니다. 유용성(데이터 개방)도 마찬가지입니다. 예를 들면 2007년 창간한 비영리 인터넷언론 <프로퍼블리카>는 탐사보도 전문업체로 '데이터 스토어'를 개설했습니다. 데이터셋, api, 데이터 문서 등 유료 판매 및 무료제공 등 부가가치를 집적합니다.

데이터가 몰고온 영향을 뉴스조직 안팎에서 정리해보면 업무과정의 투명성, 기술 중요성, 저널리즘의 양방향성이 커졌습니다.

독자는 언제 어디서나 다양한 기기로 최적의 콘텐츠 이용 환경을 경험하기를 원합니다. 가급적이면 이러한 뉴스들은 잘못된 디자인이나 데이터에서 통계 수치의 변경은 물론 독자의 아이디어나 제보, 의견을 수용해서 지속적으로 내용을 업데이트하는 소통 창구로 자리매김해야 합니다. 실제 이 과정에서 특정 데이터를 잘 다루는 독자가 직접 참여할 수도 있습니다. 사이먼 로저스가 말하는 '데이터의 민주화'라고 할 것이다.

동시에 뉴스를 만드는 언론사의 기존 정체성을 넘어 콘텐츠 기업, 다양한 산업과의 연계를 검토하는 계기를 제시해줍니다. 활용할 데이터는 많고, 분석 툴은 증가하고 있지만 이의 담론화는 언론의 고유 영역입니다. 외부 전문가 및 독자와 협력을 통해 새로운 저널리즘의 가치를 보여주는 것이 관건입니다. 가짜뉴스를 제지하는 신뢰의 저널리즘, 지혜의 저널리즘 등 저널리즘의 원칙과 미래 책무에 눈을 뜨게 합니다.

저널리즘의 보폭도 넓힙니다. 오픈 소스 문화운동, 개인정보보호와 산업화를 둘러싼 사회적 논의들, 전례없는 기술 전문가들과의 협력 등 다양한 파트너십을 고안하게 됩니다. 이 과정에서 창의적이며 집중된 신생 미디어와 훨씬 자유로운 개발자 그룹들을 만날 수 있습니다.

10여년간 저널리즘 이슈도 확장됐습니다. 

우선 기술입니다. 최근 5년 사이 AI(인공지능), 로봇, 알고리즘 등 데이터 과학이 번성하고 있습니다. 많은 언론사에서 데이터 기반의 뉴스를 제공하고 있습니다. 여기에는 디지털 데이터의 개념, 수집과 정제 등의 새로운 뉴스 생산 과정이 포함돼 있습니다. 

그리고 콘텐츠 측면입니다. 기본적으로 빅 데이터는 다양한 사회문제를 푸는 재료로서 접근합니다. 이를 활용하는데 있어 뉴스조직의 사례연구가 이어지고 있습니다. 인프라적인 측면, 서비스적인 측면, 뉴스의 형식과 내용 등 많은 이슈들이 존재합니다.

세번재는 데이터 환경의 윤리적 문제들입니다. 프라이버시 침해, 데이터 의존의 위험성을 검증합니다. 신뢰성, 정확성, 책임성을 고려합니다. 

끝으로 저널리즘의 철학에 관한 것입니다. 로봇의 관여와 알고리즘의 판단이 기자의 권위, 정체성을 어떻게 변형시킬지 여부를 따져봅니다. 예를 들면 자동화 된 뉴스의 영향은 첫째, 단조롭고 오류가 발생하기 쉬운 일상 업무의 자동화로 효율성과 직무 만족도가 향상될 수 있습니다. 반면 저널리즘 작업의 자동화로 인해 기자 일자리가 손실될 있다는 우려도 여전합니다. 그 대신 전산적인 사고가 필요한 새로운 직무가 부상했습니다. 

이렇게 저널리즘에서 데이터가 갖는 가치는 의미가 남다릅니다. 신뢰성, 효용성, 독보성, 객관성, 융합성 등은 대표적입니다.

우선 빅 데이터는 더 엄격하고 광범위한 규범에 근거합니다. 저널리즘 과정에서 더 책임을 주문합니다. 가령 대중의 관심사나 움직임을 숫자로 전하는데 그칠 것이 아니라 누가, 언제, 어디서, 어떻게 보다 '왜'라는 질문과 그 '답'을 제시하는 것처럼 구체적인 근거와 배경을 풀어서 해설해야 합니다. 전망과 대안을 함께 제시해야 합니다. 

(육하원칙 중 ‘누가’, ‘언제’, ‘어디서’, ‘무엇을’ 같은 요소는 갈수록 중요성이 떨어지고 있습니다. 인터넷과 웹이 보편화되면서 독자들은 그런 정보를 기자보다 더 손쉽고 빠르게 접할 수 있어서입니다. 독자들이 궁금해하는 것은 언제, 어디서, 무엇을 같은 피상적 보도를 넘어서는 왜(why)라는 질문에 대한 답입니다. 인터넷이 더욱 더 고도화되고 검색엔진은 더욱 더 똑똑해져 가는 가운데 독자들은 단순한 팩트들을 모아 둔 기사보다 분석, 의미, 맥락 같은 한층 더 수준 높은 정보가 담긴 기사를 원하기 때문입니다. 앞으로 뉴스의 경쟁력은 표면에 드러난 사실을 넘어 숨어 있는 가치나 맥락을 알려주는 일입니다.)

미국언론연구소 데이터저널리즘보고서(2016)에 따르면 저널리즘에서 데이터가 갖는 유용성에 주목합니다. 데이터를 바라보는 공감성이 높기 때문에 구체성을 곁들이면 평면적인 사실관계 보도에 비해 독자가 실제로 이를 활용할 가능성이 높다는 것입니다. 

특히 빅 데이터에서는 기존의 정보원과 취재력으로 알아낼 수 없었던 의외의 것을 찾아낼 수 있습니다. 시계열적인 데이터는 새로운 사실관계와 패턴을 보여주고 우리가 놓쳤던 진실을 알려줄 수 있다는 것이죠. 

미첼 스티븐스 뉴욕대학교 저널리즘학과 교수는 저서인 '비욘드 뉴스(Beyond News)'(2014)에서 앞으로의 저널리즘은 어떤 일이 벌어지고 있는 지에 관한 팩트를 전해 주는 것을 넘어 전체 상황에 대한 통찰력 있는 인식을 제공해야 한다고 주장합니다. 독자가 인터넷으로 기자보다 더 빠르게, 실시간으로 소식을 듣고 또 전하는 세상에서는 단편적인 속보는 의미가 낮다는 것입니다. 반면 풍부한 데이터는 완성도 있는 이야기거리를 제공하고 보다 사안의 본질에 다가설 수 있게 해줍니다. 

데이터 기반의 뉴스 생산 과정이 투명할수록, 또 독자들이 그 데이터를 이용해 진실성 여부를 검증할수록 객관성은 더 돋보입니다. 오늘날 만연한 가짜뉴스를 봉쇄하는 기본적인 재료입니다. 물론 그것은 현명한 독자들과 만날 때입니다. 

동시에 건실한 융합기술들과 만날수록 경제적 가치는 커집니다. 게임업체 '엔씨소프트'는 미디어를 넘어 다양한 산업과의 새로운 접목에 주목합니다. 

데이터 기반의 뉴스는 실제 수집 단계, 다양한 데이터를 연결하고 정돈하는 단계, 그리고 이를 효과적으로 표현하는 단계, 최종적으로 서비스하는 단계를 거칩니다. 최근에는  스토리를 타깃화하고 효과적으로 전달하는 쪽으로 주목하고 있습니다. 데이터 홍수가 계속되면 개인화된 콘텐츠가 부상합니다. 

앞으로 저널리즘에서 우리는 이 주제가 갖는 의미와 문제들을 효과적으로 점검해야 합니다. 가령 알고리즘으로 배열된 뉴스는 특정한 기호를 갖거나 연령대의 이용자에게 우리 공동체가 나아가야 할 뉴스에 노출될 기회를 제한할 수 있습니다. 수많은 데이터를 탐색하고 선별해서 그것을 의도적으로 해석하는 과정도 마찬가지입니다. 우리는 데이터 기반의 뉴스 스토리를 생성하는 것 못지않게 더 확대된 투명성과 개방성, 참여성에 주목해야 합니다.

데이터 저널리즘이 일어나는 현장에서 만난 데이터 저널리즘 종사자들은 데이터 수집과 정제에 많은 시간을 쓰고 있다고 말했습니다. 그리고 또한 그것은 전통적인 직업기자가 취재력을 발휘할 수 있는 영역이기도 합니다. 하지만 데이터의 수집과정에서 빚어지는 문제들은 이어지고 있습니다. 국내에서는 심각한 이슈이기도 합니다.

데이터의 수집과 검증, 통계처리 그리고 일목요연한 시각화 등 기본적인 데이터 저널리즘의 수준을 넘어선 노력들도 있습니다. 원천 데이터 공개를 비롯 분석에 사용된 방법론 및 코드의 게시 등의 더 투명한 노력도 주의를 끌고 있습니다. 하지만 간과할 수 없는 것은 데이터를 이해하고 스토리를 만드는 사람에 대한 것입니다. 훌륭한 데이터 기자가 되려면 훌륭한 기자가 되어야 합니다. 

또한 데이터는 사실 그 자체가 아닙니다. 사람들이나 체제로부터 완전히 독립적인 것은 아닙니다. 데이는 명백히 사회적(인 이해관계에서)으로 구성됩니다. 따라서 데이터 저널리즘을 구현하는 기자들은 '사람들'을 이해하는 것부터 시작해야 합니다. 그들이 무엇을 하려고 했는지, 그들이 무엇을 발견하려 했는지에 관해서 더 진지해져야 합니다. 

데이터 저널리즘은 독자에게 정보를 제공하고 재가공하는 것 이상을 필요로 합니다. 방대한 데이터의 함정, 허구의 사실과 정확한 좌표를 드러내려면 이 부분에 전략적인 집중과 선택이 필요합니다. 가령 저널리즘의 사회적 공헌과 미래의 위상을 특별히 생각할 수 있는 사람들과 대화하는 전담 조직이 필요합니다. 

데이터 저널리즘의 과정 역시 크게 다르지 않습니다. 기자, 개발자, 디자이너, 편집자 및 커뮤니티 관리자가 공동으로 뉴스 스토리 텔링을 작업할 때 서로 상호보완적이어야 합니다. 전통적인 직업 기자들의 역할 혹은 비기자인 개발자들의 역할이 제한되면 완성도를 높일 수 없습니다. 특히 뉴스조직 전체적으로도 부서 또는 건물에 의해 분리되는 것이 아니라 핵심적 위상과 역할로 설계돼야 합니다. 그래야 데이터 저널리즘의 의미가 커질 수 있습니다. 하지만 국내 언론사의 경우 기자의 역할이 대표성을 띠는 반면 어시스턴트들은 보조적이고 수동적입니다. 기술적인 업무에 국한되고 있습니다. 보도국 혹은 편집국과 뉴미디어국 사이의 칸막이가 여전합니다. 

바로 데이터 저널리즘에서 가장 취약한 부분이 '데이터 과학' '기술과 저널리즘'의 부분입니다. 데이터 과학은 인재에 대한 투자가 필요하고 '기술과 저널리즘'의 결합에 있어서는 인식과 철학의 변화가 시급합니다. 

데이터 저널리즘의 위상.

데이터 저널리즘의 위상은 일반적으로 CAR(기사작성 때 컴퓨터를 활용하는 탐색적 방법), 데이터저널리즘(개방,참여), 전산저널리즘(자동화) 등에 걸쳐져 있습니다.

저널리즘 목표를 달성하는 데있어 전산 도구 및 방법의 적용을 강조하는 컴퓨터 기술 저널리즘(computational journalism)은 대체로 컴퓨터 활용 취재보도(CAR, Computer Assisted Reporting)와 데이터 저널리즘을 아우릅니다. 특히 저널리즘의 책임성 기능을 보완하기 위해 알고리즘, 데이터 및 지식의 결합을 강조합니다. 

컴퓨터 기술 저널리즘은 컴퓨팅의 처리 기능 특히 집계, 자동화 및 정보 추출에 중점을 둡니다. 물론 데이터를 분석하고 제시하기 위해 전산도구와 협업 프로세스를 사용하는 것은 데이터 저널리즘과 공통점이 있습니다. 

하지만 컴퓨터 기술 저널리즘은 주로 정보를 추출하여 계산 가능한 모델을 산출하는데ㅔ 초점이 맞춰져 있습니다. 빠른 속도로 대용량 정보의 자동화 프로세스가 핵심입니다. 

반면 데이터 저널리즘은 주로 데이터 집합을 분석해 숫자로만 이야기하거나 데이터 기반의 스토리를 만듭니다. 한국에서는 데이터 시각화에 기반한 데이터 저널리즘이 10여개 언론사에서 비교적 정기적으로 다뤄지고 있습니다. 

사실 데이터 저널리즘의 범위는 큰 편입니다. 일반적으로는 저널리즘 과정에서 데이터를 처리하는 모든 활동입니다. 공개 데이터 및 오픈 소스 도구를 사용해 데이터를 분석하고 서비스하는 활동이지요. 

의미 있는 이슈라고 하면 이 과정에서 데이터 소스를 상세하게 분석하고 관련 정보를 찾고 내용을 확인하고 일반적으로 받아들여지는 가정을 확인, 비교할 수 있게 함으로써 이전에 사용된 자원, 도구, 기법 및 방법, 의미에 도전하는 대목입니다. 

이를 위해 더 많은 협력이 필요하고 일부에서는 이런 성격에 힘입어 공공의 이익과 관련된 소재를 다루는데 적합하다고 봅니다. 즉, 데이터 저널리즘은 참여성 개방성 융합성 등을 지향합니다. 즉, 독자 스스로 자신의 이해를 향상시키고 공공의 문제에서 의미를 이끌어내는 유용한 방법을 보다 쉽게 제공함으로써 대중의 역할을 더 직접적으로 유도하는 게 특징입니다. 

여기서 강조할 부분은 데이터 저널리즘의 목표입니다. 독자를 대신하여 데이터에 액세스하고 제시하는 역할을 하는 데이터 저널리스트의 역할과 함께 대중이 데이터 자체를 분석하고 이해하도록 허용하는 것인데요. 가디언의 데이터 블로그가 대표적입니다. 데이터 자체를 제공하는 방식으로 데이터를 직접 검색하거나 내려받을 수 있도록 해뒀습니다. 더 나아가 독자가 데이터를 가공해 새로운 가치를 창출할 수 있도록 했습니다. 

이것은 데이터 저널리즘의 프로세스에 상당한 영향을 미치며 사용자를 위한 유틸리티를 만드는 데 중점을 둡니다. 데이터 저널리즘이 내놓는 제품-종종 데이터 시각화 또는 웹 응용 프로그램은 독자에게 얼마나 유용한지가 가장 중요한 고려 사항입니다. 그러나 국내의 경우 독자의 참여 기제는 소극적입니다.  

참조로 데이터 저널리즘과 컴퓨터 기술 저널리즘을 이끈 CAR는 전문적인 데이터 분석용 컴퓨터 소프트웨어를 활용해 온라인 혹은 오프라인 작업을 통해 획득한 기초 데이터를 정밀 분석해 의미 있는 기사를 발굴, 보도하는 것을 의미합니다. 기자들이 중대한 공공의 관심사를 해석해내는 조사 저널리즘의 전통에서 출발했습니다.

이처럼 데이터 저널리즘은 형식적으로 내용적으로 상당히 많은 영역과 중첩됩니다. 기술적인 측면에서는 센서와 저널리즘까지 나아가고 있고, 형식적인 부분에서도 디지털스토리텔링의 대표주자처럼 다뤄지고 있습니다. 독자와의 관계에서도 협력 저널리즘과 닿아 있습니다. 

데이터 저널리즘은 기술, 형식, 독자와 관련 특히 강조하는 방향들이 있습니다. 그리고 그것은 또 지향하는 내용들이 있습니다. 

가령 정밀 저널리즘(필립 메이어 Philip Meyer, 1973)은 사회적 및 행동 과학 연구 방법을 사용하여 데이터를 수집하고 분석하여 엄격히 사실을 드러냅니다. 

또 스트럭쳐 저널리즘은 데이터 조각을 재구성해 새로운 의미의 콘텐츠를 만듭니다. 에버그린 콘텐츠는 하나의 경향이 되었습니다.

맥락 저널리즘(contextual journalism, 존 파블릭(John Pavlik))은 저널리즘과 기술이 융합되면 데이터를 시각화하고 인포그래픽을 삽입하는 정도로 그치는 것이 아니라 데이터를 통해 맥락을 전합니다.

미첼 스티븐슨은 '지혜 저널리즘(wisdom journalism)'에서 팩트에 천착한 나머지 전망을 보여 주지 못했기(failures of perspective) 때문에 저널리즘이 위기에 봉착했다고 진단합니다. 빅 데이터 분석으로 복잡다기한 세계를 이행하는 독자의 능력을 한 단계 격상시켜 줄 수 있는 새로운 저널리즘을 의미합니다.

세라 코언 교수는 "저널리즘이 단순한 답을 주기보다 어떤 사회적으로 중요한 이슈를 찾아내고 담론의 물꼬를 터야 한다(From finding answers to finding questions)"고 강조합니다.

이렇게 데이터 저널리즘은 최신의 저널리즘 경향을 수렴할 뿐만 아니라 저널리즘의 원칙에 근접하는 활동이라고 할 수 있습니다.

특히 데이터 저널리즘은 독자에게 맞춤형 개인화 서비스를 제공하는 초석이 될 것입니다. 연령대별, 성별, 기호나 취미 등 성향별 콘텐츠 기획과 서비스 저널리즘(service journalism)으로 확대될 것입니다. 이는 독자의 삶에 밀착한 아이템을 적극 발굴하고 특정 사안에 가장 적절한 선택의 기준을 제시하는 솔루션 저널리즘(solutuin journalism)으로 진화합니다. 이는 데이터 자체의 유료화나 고급 정보 서비스 제작 같은 뉴스조직의 수익 다각화 문제에 좋은 배경이 될 것입니다.

데이터 저널리즘의 역사를 살펴보는 것도 흥미로운 이야기거리를 제공합니다. 

국내 언론사들은 2014년 전후 본격적으로 데이터 저널리즘을 수용했습니다. 발단은 2012년 12월 <뉴욕타임스>는 미국 워싱턴주 캐스케이드산맥에서 발생한 재앙적인 눈사태를 '인터랙티브 저널리즘(interactive journalism)'으로 구현한 '스노우 폴(Snow Fall)이었습니다. 인터랙티브 저널리즘은 비디오와 오디오, 슬라이드 쇼 드 다양한 멀티미디어 기술을 접목해 독자와 교감하는 스토리텔링 방식을 말합니다. 

독자의 주목도를 높이는 실험에 눈을 뜨기 시작한 국내 언론사들은 새로운 뉴스 서비스를 검토하면서 '데이터 저널리즘'에 주목합니다. 2013년 공공 정보를 적극 개방, 공유할 것을 담은 '정부 3.0 추진계획'을 전후로 정보공개 관련 법제도의 진화, 공공 데이터 개방, 오픈 소스 증가 등 데이터 관련 환경도 긍정적으로 기여했습니다. 2014년 <연합뉴스>의 '미디어랩(Media Lab)'은 '데이터'라는 별도 공간에서 서비스를 선보였고, 비영리 독립 미디어를 표방한 <뉴스타파>는 한국탐사저널리즘센터를  표방하면서 '데이터 저널리즘' 영역을 앞세우기 시작했습니다. 

불과 4~5년 전만 해도 언론사 뉴스 페이지에는 일차원적인 인포그래픽 이미지나 통계수치를 임베디드하는 것이 일반적이었습니다. 신문의 경우 탐사보도, 기획보도에서 다뤄진 데이터는 기사화 이후 그대로 버려졌고, 인터넷에는 지면에 나간 그래프나 도표 같은 요소(이미지)를 아카이브에서 불러와 온라인 편집자들이 배치하는 정도였습니다. 

최근에는 '데이터'가 하나의 스토리로 부상하고 있습니다. 무수한 데이터에서 발견한 새로운 사실관계를 스토리로 만드는 것입니다. 예를 들면 대안미디어 <뉴스타파>는 9년치 가격정보를 수집, 비교분석해 국토부가 공개하는 실거래가 부동산 시세 정보의 오류를 짚었습니다

하지만 국내 언론의 데이터 저널리즘은 데이터 시각화에 치중하고 있습니다. 다루는 툴이나 완성도는 하루가 다르게 올라가고 있지만 새로운 사실을 찾는 '데이터 해석'은 다소 부족합니다. 다루는 데이터의 규모는 점차 늘고 있지만 데이터 수집 분류 정제에 시간이 너무 오래 걸리고 있습니다. 개인화한 뉴스 서비스나 타깃 서비스가 아직 본격적으로 제시되지 못하고 있습니다. 데이터 공개나 데이터 활용에서 독자들과 함께 하는 노력은 부족합니다. 

풀어가야 할 데이터 저널리즘의 과제가 많습니다. 우선 인재 확보에 관한 부분입니다. 소프트웨어를 활용하고 데이터에 접근할 수 있는 기초적 기술역량은 확보했습니다만 인적 물적 토대는 여전히 불충분합니다. 뉴스조직의 투자가 필요합니다. 

조직적인 측면에서는 처우 문제나 매체 전략 측면에서 진정성 있게 다뤄야 합니다. 산업적 활동과 국제적 교류도 더 활발히 필요합니다. 또한 내부에 큰 연구개발 선도조직을 갖는 해외 언론사와 보조를 맞추기 어려운 국내에서 적극적으로 타진해봐야 할 과제입니다. 글로벌 이슈가 됐던 조세 회피처 '파나마 페이퍼' 보도처럼 국제적 협업 체계를 맞아들일 준비가 중요합니다. "취재원의 신변을 보호하면서 국제적인 이슈에 대응하기 위해 다수 데이터 전문가 사이의 신뢰" 관계는 더욱 필수적인 능력으로 부상합니다. 

내부에 큰 규모의 연구개발 선도조직을 갖는 해외 언론사와 보조를 맞추기 어려운 국내에서 적극적으로 시도해봐야 할 부분입니다. 데이터 저널리즘이 다루는 데이터와 기술은 누구나 공유할 수 있도록 공적인 플랫폼으로 확장하는 데도 산학연계는 중요합니다.

언론사와 대학 및 연구기관, 시민운동단체 사이의 공동 프로젝트 등 협업 사례가 더 많이 나올 수 있도록 뉴스조직의 외부 네트워킹은 더 빈번하게 일어나야 합니다. 데이터 저널리즘이 다루는 데이터와 기술은 누구나 공유할 수 있도록 공적인 플랫폼으로 확장하는 데 산학연계는 하나의 열쇠가 될 수 있습니다. 

2014년 부산일보-부경대 '석면 쇼크' 프로젝트, 2015년 로봇 저널리즘에서 뉴스조직과 외부의 협업이 있었습니다만 단발적으로 그쳤습니다. 송 교수 팀은 당시 정보 및 데이터베이스시스템 연구실에서 DB응용프로그램 개발, 통계 추출, 센서와 데이터 간 매칭, 인터페이스 등을 연구, 개발했습니다. "웹 기술 이해도의 차이로 소통에 다소 어려움은 있었지만 협업에 큰 장애물은 없었다"면서 "언론사는 공개된 데이터를 어떤 단계에서 어떻게 응용할지 제대로 모른다. 전문가들이 어디에 있는지도 모른다. 반면 대학 연구자들은 항상 관심을 갖고 있다. 언론사가 외부 협력에 유연한 태도가 필요하다."고 말했습니다. 

결과물의 확산, 검증, 평가도 데이터 저널리즘 활성화에 긴요합니다. 유통 플랫폼의 협조가 절실합니다. 뉴스조직 내부에서도 기존 뉴스와 동등한 비중과 위상으로 다뤄야 합니다. 언론계도 이러한 결과물을 상호 평가하는 노력이 필요합니다. 이를 위해 데이터 저널리즘 분야의 커뮤니티가 활성화돼야 합니다. 선거 뉴스와 데이터를 집적한 일렉션 랜드(electionland)나 데이터 스토어, 뉴스 앱처럼 데이터의 부가가치화를 위한 특별한 배경이 마련돼야 합니다. 

또 데이터 저널리즘은 언론사 뉴스조직만의 문제는 아니고 사회적인 과제도 있습니다. 누구나 데이터에 접근할 수 있는 것 이상으로 사회적으로 가치 있는 데이터를 확보할 수 있는 토양을 만드는 것이 중요합니다. 정보 불평등의 해소를 위해서다. 정제된 데이터와 직관적인 시각화 그리고 이를 뒷받침하는 구체적인 이야기는 데이터 접근성이 낮고 이해도가 부족한 사람들도 쉽게 다가서게 해줍니다. 

데이터 저너리즘의 과제.

뿐만 아니라 시민들과의 데이터 공개 및 데이터 분석이란 공유된 장을 보장하고 있는 데이터 저널리즘의 특징은 참여자들에게 데이터 관리, 처리 및 해석에 관한 기회를 제공해줌으로써 데이터를 활용할 수 있는 능력을 키우는 교육의 장으로 이용될 수 있습니다. 특히 데이터 저널리즘은 오픈 데이터 운동-'열린 정부'에 대한 관심과 병행돼야 합니다. 진정한 데이터가 쌓이고 공유될 수 있도록 뉴스조직의 적극적인 사회적 참여가 필요합니다.

‘데이터 파트너십’을 확대해야 합니다. 데이터 저널리즘은 언론사 뉴스조직만의 문제가 아니라 사회적인 과제를 안고 있습니다. 데이터 접근성이 낮고 이해도가 부족한 사람들도 쉽게 다가설 수 있는 ‘데이터 채널’ 구축은 하나의 방법이다. 동시에 누구나 데이터에 접근할 수 있도록 하는 ‘오픈 소스 캠페인’에 적극 참여함으로써 ‘데이터 사회’의 일원으로 자리매김해야 합니다. 데이터를 활용할 수 있는 능력을 키우는 ‘데이터 리터러시’ 보급과 확산은 ‘신문 읽기(NIE)’에 머물고 있는 잠재 독자와의 관계를 고려할 때 더 절실합니다. 

일부에서는 데이터 저널리즘을 굉장히 거대하고 기술적인 것으로 간주합니다. 하지만 데이터에 대한 열린 태도, 인식 전환이 중요한 것이지 아주 전문적인 코딩 등 기술 능력인 핵심은 아니라는 지적도 있습니다. '데이터 저널리즘은 논리를 갖춘 사람이면 접근이 가능한 영역'이라는 것입니다. 물론 전문적인 특별한 기술을 보유한 데이터 전문기자의 필요성이 사라지는 건 아닙니다.

현재 10여개 국내 언론사들이 데이터 저널리즘 서비스를 지속적으로 제공하고 있지만 안팎의 체계적인 집중과 선택은 잘 보이지 않습니다. 투자 수익률(ROI)의 불확실성 탓입니다. 디지털스토리텔링 방식의 다양한 시도가 네이티브 애드 등으로 매출을 일으켰지만 말입니다. 매체 브랜딩, 독자 충성도 제고 등 장기적 전략이 없이 '실험'의 반복만 되풀이하고 있습니다. 전사적인 '데이터 경영'의 관점에서 다뤄야 합니다. 

데이터 저널리즘 활성화와 미래지향적인 전망이 가능하려면 뉴스조직의 본질적인 접근이 필요합니다. 첫째, 디지털 저널리즘의 원칙을 수렴해야 합니다. 독자 지향적인 서비스에 다가서야 합니다. 

둘째, 데이터 저널리즘의 수준을 높여야 합니다. 

셋째, 혁신 저널리즘 그 자체여야 합니다. 언론사의 데이터 저널리즘은 직업기자들이 유지해온 높은 수준의 직업 윤리와 언론의 사회적 책임과 긴밀하게 닿아 있습니다. 많은 경우에서 ‘저널리즘 혁신’은 ‘디지털 저널리즘’ 분야로 좁혀지거나 뉴스 형식의 파괴, 멀티미디어 서비스로 국한되어왔습니다. 

그러나 ‘저널리즘 혁신’은 바로 이와 같은 저널리즘의 원칙에 기초한 뉴스 생산과 유통, 독자 관계를 만드는 것입니다. 데이터 저널리즘이 만약 독자의 호기심과 관심을 받는 ‘스토리텔링’의 하나쯤으로 치부되고, 기술과 과학을 수용한 결과물로만 비쳐지는 것을 경계해야 합니다. 

데이터 저널리즘은 기존의 저널리즘의 문제를 성찰하고 치유하는 ‘혁신 저널리즘’일 때 그 의미가 반듯해집니다. 데이터 저널리즘은 권위적이고 폐쇄적인 뉴스조직을 유연하고 개방적이며 투명하게 이끄는 동력으로 네트워크의 집단지성과 커뮤니케이션하는 협력 저널리즘의 패러다임을 열어야 합니다.

'토우 센터'의 데이터 저널리즘에 대한 몇 가지 정리를 들려드리는 것으로 마칠까 합니다.

1) 디지털은 이제 데이터 중심적이고 모바일 친화적인 것을 의미합니다.

2) 데이터는 미디어를 위한 전략적 자원으로 더욱 중요해질 것입니다.

3) 데이터 기술을 민주화하는 더 나은 도구가 등장할 것입니다.

4) 보안 및 데이터 보호 역량은 더욱 중요해질 것입니다.

5) 독자는 독자 데이터 수집 및 사용에 대한 투명성을 제기할 것입니다.

6) 독자와의 연결과 관계 그리고 스토리텔링은 여전히 ​​중요합니다.

7) 웨어러블 인터페이스에서 데이터 기반 개인화 서비스와 과학적인 예측 뉴스가 활발하게 다뤄질 것입니다.

고맙습니다.

덧글. 이 포스트는 5월11~12일 사이버커뮤니케이션학회 춘계학술대회에서 '데이터저널리즘의 가치'를 주제로 한 기획세션 발표자료입니다. 현장에서는 모든 내용이 전달되지 않았으며 파워포인트 자료로 보여졌습니다.



댓글