For investors
股价:
5.36 美元 %For investors
股价:
5.36 美元 %认真做教育 专心促就业
随着互联网的不断发展,越来越多的人都在学习大数据架构技术,下面我们就通过案例分析来了解一下,大数据Kappa架构应用优缺点分析。
Kappa架构核心是通过改进流式计算架构的计算、存储部分来解决全量的问题,使得实时计算、批处理可以共用一套代码。Kappa架构认为对于历史数据的重复计算几率是很小的,即使需要,可以通过启用不同的实例的方式来做重复计算。
其中Kappa的核心思想是:
用Kafka或者类似MQ队列系统收集各种各样的数据,需要几天的数据量就保存几天。
当需要全量重新计算时,重新起一个流计算实例,从头开始读取数据进行处理,并输出到一个新的结果存储中。
当新的实例做完后,停止老的流计算实例,并把一些老的结果删除。
Kappa架构的优点在于将实时和离线代码统一起来,方便维护而且统一了数据口径。
Kappa架构与Lamabda架构相比,其优缺点是:
Lambda架构需要维护两套跑在批处理和实时流上的代码,两个结果还需要做merge,Kappa架构下只维护一套代码,在需要时候才跑全量数据。
Kappa架构下可以同时启动很多实例来做重复计算,有利于算法模型调整优化与结果对比,Lamabda架构下,代码调整比较复杂。所以kappa架构下,技术人员只需要维护一个框架就可以,成本很小。
kappa每次接入新的数据类型格式是需要定制开发接入程序,接入周期会变长。
Kappa这种架构过度依赖于Redis、Hbase服务,两种存储结构又不是满足全量数据存储的,用来做全量存储会显得浪费资源。
【免责声明】本文系本网编辑部分转载,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与管理员联系,我们会予以更改或删除相关文章,以保证您的权益!更多内容请加danei0707学习了解。欢迎关注“达内在线”参与分销,赚更多好礼。