央视 l 大数据新闻的开创和探索

  “戴玉数据圈”是资深数据新闻人戴玉创办的数据新闻群,里面汇聚了各类数据报告发布方、数据媒体主编和记者、高校数据新闻教师、可视化人员、数据行业人员等等,旨在搭建切实推动数据新闻行业交流与合作的平台。

  【数据圈那些人】系列沙龙,主要用来初步介绍群内伙伴们各自的工作,形成初步了解。

  分享人:郭俊义

  央视新闻联播编辑部副制片人

  央视大数据新闻创始人

  分享时间:2017.02.23下午8点

  嘉宾分享环节

  各位群友大家好,今天晚上跟大家分享一下央视大数据新闻的开发和探索。我主要想讲几个案例,从开创到我们做得比较好的案例,再到最新的一些状况。最后再讲讲对大数据新闻未来的一些想法。

  1. 《据说春运》系列

  大家比较清楚的是,之前戴玉也在预告中提到的,我们最早做的跟百度合作的《据说春运》系列。

(案例二维码)

  很多人都记得百度的迁徙图,但是并不知道当时我们这个新闻是怎么做出来的,今天晚上可以给大家揭秘一下。当时是2014年1月的时候,临近春节,当时百度开发的一个产品是百度春运迁徙图。在三年前大家可能会觉得这个迁徙图很酷炫,但是它是一款可视化产品,还不是一个新闻作品。我特别强调一下,做一个可视化产品,它不具有新闻性也就不会吸引大家来看。必须从百度的大数据里面挖掘出新闻,才会有人来看。所以当时我们更多的是着重于怎么从百度大数据里面挖掘出新闻来。

  当时我主要从两个方面来着手,因为我们不管做传统的新闻报道还是电视新闻也好,包括现在新媒体新闻也好,无非从两个方面,一个是从内容,另外一个是从报道的形态,所以怎么从大数据里面挖掘出新闻,当时也是非常费脑筋。与百度合作时对方并没有给我们提供新闻点,所以全靠我们自己挖掘。所以当时我从这个百度春运迁徙图里面仔细看了很多城市的流入流出,热门线路等等。花了很长时间发现了一个新闻点。

  我们中国的春运以往的特点主要是从特大城市向中小城市迁徙,东南沿海到中西部城市迁徙,一般是这种规律。但是这种规律就不是一个新闻点,只有新的迁徙的变化才可能会有新闻点。当时发现,从成都迁往北京流出量非常大,北京迁往成都的迁徙量也是非常大,当时连续几天都是排行前三名。当时我们就从这个数据的变化发现了跟以往春运迁徙不同的一个变化——出现了逆向迁徙,即从中西部城市向特大城市的迁徙量比较大。当然这仅仅是从百度给我们提供的LBS也就是基于手机定位的大数据来分析的。

  因为当时第一次做大数据新闻,我们从一家商业公司给我们提供的迁徙大数据得出了一个新闻点,心里并不踏实。作为国家媒体央视来说,这么轻率的发布是不是有权威性?所以我们当时还利用了传统的调查方式,请我们四川记者站的记者采访了成都铁路局的工作人员。发现他们得到的数据也支撑了我们的新闻点,即从实际售票的情况来讲,当时成都迁出数量确实非常大。

  基于成都铁路局给我们提供的售票数据,我们当时觉得还是不踏实。因为电视的话我们需要有一个直观的画面证实我们的新闻点。我们请来成都火车站的工作人员给我们拍了一些成都火车站候车大厅的现场实况。这个现场实况当时也是非常支持我们的新闻点。因为当时在画面中,比较明显的有很多老人要出行,这个时候还有六天就要除夕了,老人为什么要出行?他们不可能出去打工也不可能出去旅游。更多的可能是逆向迁徙到子女所在的城市,去过年。

  所以我们第一期节目的内容就是通过多种交叉印证的方法确定了新闻点,支撑了我们的内容。接下来就是如何把它变成比较酷炫的可视化产品搬上屏幕。当时想到很多办法,比如翻拍、直接接入演播室大屏等等,但是效果都不好。后来想了一个办法——现在看也是比较简单的一个办法,就是通过录屏的方式。我们直接用录屏软件把百度迁徙图flash格式的动态图转换为一个视频软件,就可以直接在电视屏幕上呈现了。

  当时我们第一期节目从内容到形态成功地推出后,影响是非常大的,因为很多观众也好,学界业界的朋友也好,从来没看过这种形式,所以反响是比较大的,我们也是比较鼓舞,所以后来我们接连做了很多个以《据说》为名称的系列报道,有据说春运、据说春节、据说两会、据说世界杯、据说APEC等等。

  2.大数据人群画像

  再跟大家分享一个我自己觉得做得比较好的一期节目。这期节目就是我们跟360合作的一期两会的节目。当时两会比较重要的一个热点就是网络诈骗。当时我们与360的安全首席科学家裴博士商量怎么用360的安全大数据来做与网络诈骗相关的报道。

  当时360的裴博士和我说,我们有很多安全大数据,是不是可以任由我选。但是这些技术性很强的大数据并不能成为新闻。就是说我们自己还要在选题上去想办法。后来我就想了个办法,我请裴博士用360安全大数据做一个画像,给我描述一下什么样的人上网最容易上当受骗。当时360觉得画像的这个办法挺好的,就花了两三天时间做了这个画像。

  360帮我们画出了关于什么样的人上网容易上当受骗的人群画像。画的结果是广东地区的九零后,经常网络兼职、聊天、游戏等,这样的人群容易上当受骗。画像出来之后我们觉得很有意思,但是它毕竟只是从大数据画像得来的一个人群特征,现实中是不是真的是这样呢?也是同样的,我们觉得还不太靠谱,我们报道的话要慎重,要找到比较好的案例才行。

  当时也是很凑巧,在360在给我们做出这么一个人群画像的前一天,中山大学的官方微博就发了一条微博:“近期本校有多位男生,因为上网找工作找兼职等,上当受骗。少的被骗四五万元,多的被骗四五十万元。”这个案例我们一看到就发现与大数据挖掘出来的人群画像百分之百吻合,所以说大数据真的很神奇。

(案例二维码)

  3.上海外滩踩踏事件

  我还想跟大家分享一个案例,上海外滩的踩踏事件。大家都知道。2014年的最后一天12月31号,上海外滩,发生了踩踏惨剧,当时踩踏死亡四十九人。第二天我听说了这个惨剧之后想到,大数据有预警功能,我们能不能使用大数据来对相关的大型活动人群聚集做一个大数据的预警。

  人流密度,我们现在叫热力图,其实它也就是来源于基于手机定位的LBS大数据。当时我找到腾讯地图,把我的这个需求想法跟他们交流了一下,他们配合我做了一个上海外滩踩踏事故当天也就说2014年12月31号和前一天12月30号,以及后面一天2015年1月1号元旦上海外滩的人流变化。

  

  外滩人流变化趋势图

  

  外滩人流热力图

  当初我们根据这三天的上海外滩的人流变化做了两个图,一个人流变化趋势图,另外一个就是热力图,这两个图都能够非常明显的看到踩踏当天和头天以及第二天人流变化。如果说我们上海外滩所在的黄浦区的相关部门能够早做大数据预警的话,这个惨剧有可能会被避免。

  这种人流聚集的防踩踏的大数据的挖掘我觉得很有现实意义,所以后来我就跟中国移动的相关领导聊了这么一个想法。中国移动后来请北京移动公司专门做了一个北京庙会的防踩踏的软件,2015年春节应用在地坛庙会,作为防踩踏预警,效果很好。

  4.数据微述评

  接下来我想讲一下我们最近的一个新的做法。新闻联播在16年底做了一个年度报道,《点点改革年度账》。这个系列报道做了八集。在这里我们有个新的探索,可以跟大家分享一下。

(案例二维码)

(专家对该案例的研讨)

  在《点点改革年度账》这个系列报道,前面一个点是盘点,后面一个点是点评。盘点就是用数据来盘点成功改革的措施、成果等等。点评就是我们根据每一个数据都附上一句话点评。我们后来把它总结为叫做数据微述评,这个形式在新闻报道中比较少见,算是有一点新的突破。

  做三年数据新闻后我有些体会和想法。大数据新闻有门槛,需要大数据来源的同时,也需要工程师、数据分析师等专业性比较强的专业人员,需要一个团队去操作。大数据遇冷也很正常,未来希望与相关大数据公司合作,组成大数据新闻团队,能挖掘出有新闻价值和实际价值的数据新闻产品。

  提问交流环节

  Q1 您觉得电视媒体做数据新闻跟其他形式、媒体相比有什么优势和劣势?

  优势是视觉效果,可以运用多种动态可视化效果;劣势是深度报道推理不易展开,制作成本较高。

  Q2 在操作流程中用大数据和小数据分别做成的新闻或产品有什么共同点或区别吗?

  大数据的来源和挖掘分析要与大数据公司合作,小数据可以自己做一些收集分析。个人觉得大数据新闻产品的新闻价值相对也较大,因为全样本代表性更强、覆盖面更广,能够挖掘出一般人想像不到的结果。

  Q3 学术界是否有关于数据来源科学性的讨论?

  人民大学新闻学院曾专门召集北大、清华和中传学界老师们为我们开了一个大数据新闻研讨会,反映热烈,我也常跟学界老师交流。我觉得对大数据来源的选择,一是要权威,在各自领域领先,另外媒体可以利用传统调查、交叉印证等手法规避来源的片面性。

  Q4 大部分学者并不认可数据的科学意义,仍然认为只有传统社会田野调查才更真实一些,不知道您怎么看?

  我不是社会学家,但我知道传统的社会调查都抽样,而大数据是全样本,我觉得更有价值。我曾跟我的大学同学、现法学教授探讨过运用大数据研究法学,他们没听说过,后来真有运用大数据研究法学的相关论文出现。我也不是统计学家,也不敢否认抽样调查的价值,但是既然有了大数据及挖掘分析能力,为什么不能尝试分析一下海量的大数据?

  Q5 去年两会期间,清博大数据和央视四套合作,在“我有问题问总理”栏目,每天播出数据新闻,确实挖掘出很多想象不到的结果。但是,对于大数据公司来讲,很多未被采用的结果就浪费了,不知对如何处理这些结果有什么建议?

  作为媒体来说,新闻价值是第一选择,当然媒体版面也有限,如果郎总觉得还有很多有价值的结果,可以放到贵公司的若干公号上发布。对,大数据新闻的投入是比较大,百度跟我们合作最多时安排了20多人的团队,不过社会影响力也很可观。这可能需要相互更好地沟通,如果媒体选题纬度需求更精准,就可避免浪费。如同我前面说的跟360的合作案例,我提出的人群画像需求很明确,他们完全没有重复劳动,也没有浪费数据挖掘结果。(关于大数据记者的培养,)中国传媒大学已经有数据新闻本科专业,再加一些大数据的挖掘分析能力培养就可以了。

  Q6 央视做数据新闻更多是基于社会价值而不是商业价值?和大数据公司合作,费用是如何支出呢?

  新闻媒体做数据新闻第一考量肯定是新闻价值,我们跟大数据公司合作不涉及经费,我们要新闻价值,大数据公司要传播价值。不是央视财大气粗啦,其实除了制作成本没花多少钱,但是确实有平台大的原因。

  整理/高赫

  排版/肖喻心

  一图观政

  微信号:P100017

  “图天下,政乾坤”

  我们是专业的时政数据报道机构

  用数据揭露政圈规则

  用图表解读时政要闻

  如果您愿意支持我们

  请将“一图观政”推荐给您的朋友

声明:本文由入驻搜狐公众平台的作者撰写,除搜狐官方账号外,观点仅代表作者本人,不代表搜狐立场。
推荐阅读