如果仅仅认为大数据是利用计算机系统来存储并快速查询数据,也就是说将其看作为一个高效大型数据仓库,就差之甚远。就是人脑子对付不了的一大堆数据让电脑根据某些设置去自己找数据。比如,某个网站去年被访问了一百万次,现在设置查找标准为访问频率最高的ip段,然后让电脑去找出来。当然这只是个简单的例子。
大数据系统不光是一个仓库更是一座生产厂房。她以原始数据为材料加工制造出新的产品。也就是生产制造出原始数据所没有的信息。
如果仅仅认为大数据是利用计算机系统来存储并快速查询数据,也就是说将其看作为一个高效大型数据仓库,就差之甚远。就是人脑子对付不了的一大堆数据让电脑根据某些设置去自己找数据。比如,某个网站去年被访问了一百万次,现在设置查找标准为访问频率最高的ip段,然后让电脑去找出来。当然这只是个简单的例子。
学东西,不要指望一步到位,先理解浅显的,容易接受的,深刻的东西要自己慢慢钻研和体会。很多教科书一上来就是一堆高大上的理论,看似头头是道,其实对初学者来说看不见摸不着,云里雾里,没啥用。如果仅仅认为大数据是利用计算机系统来存储并快速查询数据,也就是说将其看作为一个高效大型数据仓库,就差之甚远。
大数据系统不光是一个仓库更是一座生产厂房。她以原始数据为材料加工制造出新的产品。也就是生产制造出原始数据所没有的信息。
学东西,不要指望一步到位,先理解浅显的,容易接受的,深刻的东西要自己慢慢钻研和体会。很多教科书一上来就是一堆高大上的理论,看似头头是道,其实对初学者来说看不见摸不着,云里雾里,没啥用。
再举个例子,面向对象编程,也有一大套理论,其实初学者也不必关心这些东西。记得当年不知道从哪里看来的比喻,说对象就象一盏电灯,它提供开关这个方法,你一按开关,触发事件,灯就亮了。这就很好理解。虽然这当然只是对于面向对象很粗浅的解释,但初学者了解这些,能入门,就够了。