简单的来说,大数据就是通过分析和挖掘全量的非抽样的数据辅助决策。
大数据的特征
大数据是指以服务于决策为目的,需要新型数据处理模式才能对其内容进行采集、存储、管理和分析的海量、高增长率和多样化的信息资本。
大数据具有如下特征:
根本目的是服务于决策,大数据能够帮助各类组织和个人大幅度提升决策能力,做出更好的决策和判断;
量度大,大数据通常是指100T以上的数据量,这难以依靠传统的计算手段有效计算,而必须依靠新的计算手段和数据挖掘工具;
频率高,大数据是用户参与与互动而产生的数据,根据用户的网络痕迹来及时地了解用户的相关数据,这种数据是按照天甚至小时来计的高频数据。而传统的数据频率都很低,很多数据是按照月甚至按照年份来计算的;
速度快,大数据是实时性的数据,能够实时反应。例如,在百度搜索框输入一个关键词,能够瞬间呈现,而传统的数据收集方式则是严重滞后的;
永远在线。在线是大数据的前提条件,从这个角度来说,大数据是永远在线的,能够随时被调用的。大数据通过分析各种网络终端上的用户痕迹,能够更好地分析用户的行为、情感、思想、爱好与需求,来更好地进行决策和分析。
大数据的关键点
数据的可获得度。目前在国内,大数据的发展严重受制于政府信息的公开性不够,很多数据难以获得,导致难以实现真正的大数据挖掘和分析,这就要求政府及时开放更多的数据,以提高数据的可获得度。
进行科学的模型建构。模型的科学性直接决定着数据分析的质量,这就要求有高超的建模水平,当然数据量越多也有助于模型的合理构建。
利用专家对观点进行提炼。为决策提供依据的基于数据挖掘的独到、高质量的观点,高度依赖于高质量的数据解释,这就体现了行业专家的价值。