影视:老公亲我的小花园最火的一句,讲述了 "
克里斯:最终,所有这些数据都被用于提高洞察力、提高利润,以及加快决策制定。而这其中面临的挑战之一是消除信息孤岛并有效地组织数据。
信息有不同的来源。一个销售公司可以将数据存储在三个环节——发货、收货和客户支持。每一个环节都是一个不同的信息孤岛(information silo)。为了获得最大的价值,重要的就是能够通过引用来自这三个孤岛的数据来看到更广阔的图景。
当你考虑到还有不同类型的数据时,这就变得更加复杂了。对于客户,你需要存储他们的电话号码(这是一种简单的数据类型)和销售历史记录(这是一组更复杂的数据)。
基本上有两种类型的数据集。结构化数据(structured data)是以易于理解的格式存在的,例如姓名、年龄、性别和日期。非结构化数据(unstructured data)则有多个来源,并且有不同的格式。YouTube视频、Twitter推文、Facebook帖子和评论都是非结构化数据。
据美国数字营销公司万扑网(OneUpWeb)报道:
非结构化数据基本上就是一切——如果数据不能容易地被分类,那么它就是非结构化的。用户生成的内容和用户活动是非结构化数据的很大一部分。这包括上传到YouTube上的视频(每分钟上传100多个小时)和在社交媒体账户上发布的评论(2012年仅在Facebook上每分钟就有51万条评论被发布)。非结构化数据还包括被动生成的信息,如手机生成的GPS定位数据。5
.