从原始定义来说,在计算机科学中,数据是指所有能输入到计算机并被计算机程序处理的符号的介质的总称,是用于输入电子计算机进行处理,具有一定意义的数字、字母、符号和模拟量等的通称。
而信息,是指音讯、消息数据信息、通讯系统传输和处理的对象,泛指人类社会传播的一切内容。
进入到大数据时代,数据和信息之间的转换,其实就是大数据处理需要解决的重要问题。互联网、移动互联网的发达,带来了数据的爆发式增长,而这些数据当中包含的信息,价值线索,也变得越来越难提取,这就是大数据要解决的问题。
数据不断增长,被大量积累以后就形成了数据资源。这些数据资源当中蕴含的价值线索,被提取出来,就是信息。
比如你的百度搜索记录,在后台的服务器都有记录,这些都是数据。然后根据这些数据能够推测出你的喜好,年龄,性别等,这些就是信息。也就是说数据里面有无用的,提炼出有用的就是信息。