大数据特征为:大量、高速、多样化、有价值、真实。大量,指大数据量非常大。高速,指大数据必须得到高效、迅速的处理。多样化,体现在数据类型的多样化,除了包括传统的数字、文字,还有更加复杂的语音、图像、视频等。有价值,指大数据的价值更多地体现在零散数据之间的关联上。真实大数据,指与传统的抽样调查相比,大数据反映的内容更加全面、真实。
大数据,或称巨量资料,指的是所涉及的资料量规模巨大到无法透过主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。
最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”“大数据”在物理学、生物学、环境生态学等领域以及军事、金融、通讯等行业存在已有时日,却因为近年来互联网和信息行业的发展而引起人们关注。