订阅

多平台阅读

微信订阅

杂志

申请纸刊赠阅

订阅每日电邮

移动应用

专栏 - 技术掘金

大数据是谁的工具

熊伟 2013年11月28日

熊伟,财富中文网专栏作家,现任《中国信息化》杂志执行社长,电子工业出版社研究院首席分析师。微信公号:蛮夷大熊。
大数据为企业了解变幻莫测的潜在用户提供了一组新工具。政府机构或非政府组织同样也能用大数据来了解市民,合理配置资源,改善教育、医疗、交通、消防等等公共服务的质量。

    企业永远不会忽视的环境是市场环境,大数据为企业了解变幻莫测的潜在用户提供了一组新工具。它其实还可以做得更多。

    引用所谓的经典案例是为了把问题形象化和简化,最被津津乐道的案例常常具有娱乐功能,满足广泛存在的八卦需求。在人们热烈讨论的大数据话题中,八卦精神十足的案例也已经诞生了,那就是著名的“塔吉特-怀孕少女”案例。如果没听说过而且有兴趣,请自行搜索详情。我试着用两句话介绍一下:美国零售商塔吉特百货通过分析用户的购买行为判断哪些用户已有身孕并向她们推荐母婴商品;一个高中女生的爸爸发现女儿收到婴儿用品优惠卷反复询问终于发现女儿怀孕大吃一惊。

    怀孕少女的父亲显然获得了重要情报,但我们从这件事可以有什么收获呢?分析得到三个推论:用户的购买行为可能是有关联的;由于购买行为的相关性,尚未发生的购买行为是可预测的;对用户购买行为的预测能有效促进销售。

    只用三个如此浅显的推论就想宣告揭开了大数据的秘密过于轻率,有人会反驳说,这就是最近说得热闹的大数据?没听说大数据的时候也有类似案例,多年前同样富于娱乐性的“尿不湿-啤酒”案例不也是这个意思吗?

    没错,大数据的新瓶常用来装一些旧酒。因为这个词的流行,它已经被随意使用到涵义含混的程度,有必要稍加厘清。人们谈论的“大数据”至少有两个意思,不妨分别表示为狭义大数据和广义大数据。狭义大数据是指非结构化的数据,包括任何载体上以任何形式保存的没有进入数据库的数据,未加整理的图片、音频、视频文件都属于狭义大数据。广义大数据则指海量的、广泛应用的数据,其中大部分是狭义大数据,小部分(全球而言,约10%)是经过整理的保存在数据库中的数据。

    “塔吉特-怀孕少女”案例和“尿不湿-啤酒”案例中零售商使用的数据均已结构化,保存在数据库中,属于广义大数据。但即使从“狭义大数据”的视角考察,这两个案例也可以用来说明大数据的应用,因为非结构化的数据(狭义大数据)要经过处理,结构化之后,才能进行分析、挖掘、应用。“塔吉特-怀孕少女”案例中超市使用的结构化数据,也部分地来自对非结构化数据的整理。

    由于有将非结构化数据转化为结构化数据的需求,这本身也成了一种生意,分布全球的数据技术公司和劳动密集型的手工分拣数据公司靠这种生意赚钱。

    除了超市,还有谁需要大数据工具呢?首先是那些像超市和网上商场一样,需要准确描述用户特点的企业。其次,是面向人群的政府机构或非政府组织。举个例子,“智慧城市”的服务对象是市民,使用大数据工具,描述市民人群的特性,有助于合理配置资源,改善教育、医疗、交通、消防等等公共服务的质量。

    企业、政府机构和非政府组织处在更广大的背景中。大数据工具正在用于评估行业环境、文化环境和政治环境的变化。如果某个组织的管理者察觉到大数据工具对把握环境——不仅仅是用户环境——的作用,他们可能已经开始尝试使用它。举个例子,品牌成衣企业如何管理自身技术子系统的重要组成部分——服装设计?由于大数据工具的引入,品牌成衣企业的产品设计风格决策过程和五年前相比发生了显著的变化。过去的成衣设计参考数据来自两个地方,时装周的T台,散发和回收调查问卷的大街;现在增加了更重要的一个,那些爬虫机器人光顾过的网页,主要用来提供文化环境的信息。

    大数据工具还能用于内部管理。很多企业使用内部即时通讯软件,如果管理者有心分析哪些员工在工作联系之外频频通过即时通讯软件保持沟通,很容易发现企业内部的非正式组织,小伙伴的圈子,派系之类。因为大数据的理论和方法,商业组织的可管理性增加了。其他类型的组织,哪怕规模大到国家,也是如此。(财富中文网)

我来点评

  最新文章

最新文章:

中国煤业大迁徙

500强情报中心

财富专栏