12月12日 ,由广东外语外贸大学新闻与传播学院与美国密苏里大学新闻学院主办的“2016广外-密苏里媒体融合与数据新闻工作坊”拉开帷幕。密苏里新闻学院Reuben Stern教授,在本次工作坊中带来了题为《大数据和大数据时代导言》的演讲。
密苏里新闻学院Reuben Stern教授
下午两点,密苏里新闻学院Reuben Stern教授准时出现在广东外语外贸大学八角楼,打开一道通往大数据的机关。Reuben Stern教授是美国密苏里大学新闻学院未来实验室副主任,此次广外之行是为致力于2016广外-密苏里媒体融合与数据新闻工作坊的举办,该工作坊由广东外语外贸大学新闻与传播学院和其长期合作伙伴——美国密苏里大学新闻学院携手举办,旨在破解媒体融合与数据新闻中业界和学界共同关心的热点和难点问题。
Reuben Stern教授在接下来三个小时的演讲中,着重围绕大数据的基础性知识展开讲解,全面透析何为大数据。
在介绍了大数据的概念后,他用传统数据和大数据进行对比,认为传统数据组织规范、严密,可以进行人为的分析,并且比较容易梳理。而大数据则把人类所有的活动都以数据的形式保留下来。可见大数据的“大”在于数量之大、种类之多、速度之快,同时,大数据这样的特征也造成我们在分析速度方面难以赶上。
Reuben Stern教授还罗列了大数据的种类,主要有:网络行为(Web behavior)、社交媒体活动(Mobile /social media activity)、经济行为(Financial transactions/purchases)、个人行为(Personal activity stats)、位置路径数据(Location/ route data)、气象数据(Weather)、家庭数据监测(Household sensor data)、经济和政府数据(Economic and government data)、健康数据(Health data)、商品追踪(RFID data)。
Reuben Stern教授解释道,对这些数据进行整合,就可以较全面的了解一个人的行为,甚至可以预测行为偏向。各种数据之间形成的相关性,我们过去可能没有意识到。他表示,一切数据都可以通过网络进行连接,甚至没有一件商品不和互联网相连,几乎所有商品都具有互联网的背景。当人类不断进步,数据可以改变很多,甚至可以控制很多。“大数据的目标就是揭示隐藏的模式和关系”
在Reuben Stern教授的引领下,得以深入洞悉大数据,他将大数据分为以下类型:描写型的数据,即使我们不在场,同样可以通过大数据得到精确的描述,例如交通数据;诊断型数据,即数据呈现的从过去到现在的过程;预测型的数据,通过数据分析达到预测的目的;还有处方式的数据,要求我们具有海量数据,才能提出相关建议。
将大数据联系到新闻,Reuben Stern教授提到了数据新闻,他对数据生产过程做以介绍,理想的过程是:收集数据——数据清理——数据探究——形成模型——数据产品,数据清理则是十分重要的一环,他解释道,“避免在数据链中出现不正确的数据,要确保所有的数据可靠,否则之后可能要重新进行数据清理。” 对记者来说,可以在数据产品中找到数据线索,帮助新闻报道。数据产品也可用数据可视化的形式进行数据报道。所以,这一过程中,对数据进行整体处理,原始状态的数据才能变成我们必需的数据。
在接下来的一周时间中,Reuben Stern教授将对数据做进一步的解释。
演讲现场