大数据来源的类别有哪些

1.流数据

流数据是指由数千个数据源持续生成的数据,通常也同时以数据记录的形式发送,规模较小(约几千字节)。流数据包括多种数据,例如客户使用的移动或Web应用程序生成的日志文件、网购数据、游戏内玩家活动、社交网站信息、金融交易大厅或地理空间服务,以及来自数据中心内所连接设备或仪器的遥测数据。

可以在数据到达时对其进行分析,并决定要保留哪些数据,不保留哪些数据以及需要进一步分析的内容。

2.社交媒体数据

社交媒体数据来源于社交系统,例如微信、QQ、微博、博客、新闻网站、朋友圈等。

社交互动数据是一组越来越有吸引力的信息,特别是对于营销,销售和支持功能。它通常采用非结构化或半结构化形式,因此在消费和分析方面提出了独特的挑战。

3.开放数据

互联网上的“开放数据”来源,包括政府机构、非营利组织和企业免费提供的数据。如美国政府的data.gov,CIA World Factbook、欧盟开放数据门户等。

延伸阅读

大数据具有的五大特征

1.数据类型多样

富媒体(Rich Media)大大扩展了人们的数字化生活体验,多样性成为大数据的显著特征。大数据包括网络日志、音频、视频、图片、地理位置信息等等,多类型的数据对数据的处理能力提出了更高的要求。

2.数据量超规模

大数据的规模从一般意义上讲具有大规模、海量的含义,但是没有绝对的量纲标准,而是和领域及其问题相关。超规模是指超出了原有领域和问题的大规模。比如企业大数据,与之前不同的一个地方在于,此时的数据规模常常超越了企业本身传统的内部数据边界,而是延伸到了企业外部,成为一种社会化的企业数据。每个人作为终端使用者,既是数据的使用者,又是数据的创造者。

3.数据价值密度较低

如随着物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,如何通过强大的机器算法更迅速地完成数据的价值“提纯”,是大数据时代亟待解决的难题。

4.实时性强

信息就像开着的水龙头一样,源源不断地出来。人们打开手机看新闻,支付账单,都需要得到及时响应,而不是等到晚上再看新闻,要排个队才能支付账单。数据是连续的,实时的,流涌的。这种流数据是时时刻刻(Real-Time)的,构成了大数据之“大”和无时不在。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注