For investors
股价:
5.36 美元 %For investors
股价:
5.36 美元 %认真做教育 专心促就业
Apache Spark是一种通用处理引擎,开发用于执行批处理(类似于MapReduce)和工作负载,例如流、交互式查询和机器学习 (ML)。
Kafka的架构是分布式消息传递系统架构,将记录流存储在称为主题的类别中。它不是用于大规模分析作业,而是用于高效的流处理。它旨在集成到应用程序的业务逻辑中,而不是用于批量分析作业。
Kafka最初是在社交网络LinkedIn上开发,用于分析其数百万用户之间的联系。也许最好将其视为能够从众多来源实时捕获数据,并将其分类为要分析的主题以深入了解数据的框架。
这种分析可能会使用Spark等工具执行,Spark是一种集群计算框架,可以执行用Java、Python或Scala等语言开发的代码。Spark还包含Spark SQL,它支持查询结构化和半结构化数据;以及Spark MLlib,用于构建和操作ML管道的机器学习库。
【免责声明】本文系本网编辑部分转载,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与管理员联系,我们会予以更改或删除相关文章,以保证您的权益!更多内容请添加danei0707学习了解。欢迎关注“达内在线”参与分销,赚更多好礼。