解读“大数据” 须掌握4种关键数据(图)
2015 年,全球掀起了一股大数据热潮。(图片来源:Adobe stock)
文/高端训
还记得2015 年,全球掀起了一股大数据热潮,无论是台湾的主流杂志,以至于世界的媒体,“大数据”(Big Data)都曾登上主流媒体的封面报导。这个现象,引起我极大的好奇。我工作了近30 年,为何突然出现这个新物种,而我对它好像有一点陌生。所以,我决定放下手中的工作,到大数据的源头,去一探究竟。
很幸运的,我申请到加州大学尔湾分校的大数据学程:Data Science and Predictive Analytics。这并不是一个传统的、充满数学、资讯的大数据课程,而是整合资讯、统计、企业应用领域,也是尔湾分校第一次开出的课程。学校为了让这个学程能够成功,直接找来多位教科书的作者,在课堂上现身说法,当然课后也变成另类的粉丝与作者的见面签名会。
大数据跟我们原来认识的有何不同。我们都读过一个成语,叫“瞎子摸象”。一群瞎子遇到一头象 ,摸到象腿的人,觉得大象像根柱子;摸到象鼻的人,觉得大象像根水管;摸到象耳朵的人就说:“你们都错啦!大象,其实像把扇子!”
大数据,就像一头闯入商业丛林的大象。大家都想知道,“大数据,到底是什么?”这个问题,问不同背景的专家,回答也不一样。所以,大数据真的是头大象,每个人说的都不一样。
许多人以为,网络上的数据,才叫大数据,恐怕这就见树不见林了。大数据主要有四种来源:
第一种,是企业内部的数据。像是企业资源规划ERP(Enterprise Resource Planning)系统里,就有许多企业采购和生产的数据。
第二种,是企业从外部搜集的数据。像是顾客关系管理CRM(Customer Relationship Management)系统里,就有各种关于顾客购买行为的数据;还有各种官方发布的社会、经济指标,以及民间组织所发布的市场及消费者研究报告等。
第三种,是网络数据(Web Data)。像是会员登入官网的时间、网友浏览网站、在电商购买产品,以及各种网络付款资讯等,都算网络数据。
第四种,是网络数据(Network Data)。它跟网络数据最大的不同,是除了电脑、平板、手机、电视等四屏产生的数据之外,还有物联网(日常物品或设备透过网际网络连接在一起)、智慧制造等网际网络以外所搜集到的资讯都是属于网络数据。
所以,企业的内部与外部,以及线上和线下,这四种数据加起来,才是大数据的全貌。有人说,大数据早就存在,我们也已经在使用了,只是讲对了一部分的事实,那是传统的企业内部的ERP 及CRM 顾客资料。对于网络公司来说,则偏重在网络上的数据。
现在实体企业也有网络上的分身(如官网、粉丝页、顾客线上消费行为等),只有整合了企业内、外,以及线上、线下,才能发挥大数据应有的价值,当然也是最困难的一步。因此,马云才说“大数据是未来的石油”,比的是谁先把它开采出来!
本文整理、节录自高端训《大数据预测行销》一书。由时报文化授权转载,欲阅读完整作品,欢迎参考原书。