Skip to Content

超越Hadoop的大数据技术:用Spark 和Shark进行基于内存的实时大数据分析

Hadoop将MapReduce并行计算带入主流应用。然而,随着大数据需求和使用模式的扩大,Hadoop已暴露出诸多局限性。特别是,越来越多的组织需要对大数据进行实时的、迭代式和交互式的分析和挖掘;但是今天的Hadoop无法有效的支持这些新的应用场景。本讲座将介绍我们与大学合作伙伴为超越Hadoop的这些局限性,而在基于内存的分布式计算系统(如Spark和Shark)上所进行的合作;我们还将着重介绍英特尔中国使用Hadoop、Spark和Shark技术开发的,基于内存的实时大数据分析平台(包括数据的实时导入、分析和展现),以及我们和业界合作伙伴一起将其应用到生产环境所进行的努力。 新浪微盘下载:http://vdisk.weibo.com/s/FE6V1

View this Document

Former Member

No comments