玉林社区   玉林天天茶座   看看比较Hadoop、Spark和Kafka大数据框架
返回列表
查看: 396|回复: 0

看看比较Hadoop、Spark和Kafka大数据框架

[复制链接]

1299

主题

1299

帖子

5011

积分

论坛元老

Rank: 8Rank: 8

积分
5011
发表于 2022-2-25 17:45:47 | 显示全部楼层 |阅读模式

马上注册玉林红豆网会员,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

大数据框架最初用于数据仓库或数据湖中的静态数据,但最近的趋势是时处理来自多个源的数据。大约十年前,大数据开始流行。随着存储成本不断下降,很多企业开始存储他们获取或生成的大部分数据,以便他们可以挖掘这些数据,以获得关键的业务洞察力。[url=http:///www.wangsu.com/]IPv6[/url]的相关资讯可以到我们网站了解一下,从专业角度出发为您解答相关问题,给您优质的服务![align=center]

                               
登录/注册后可看大图
[/align]


企业分析所有这些数据的需求推动着各种大数据框架的开发,这些框架能够筛选大量数据,从H开始。大数据框架最初用于数据仓库或数据湖中的静态数据,但最近的趋势是时处理来自多个源的数据。





什么是大数据框架?
大数据框架是一组软件组件,可用于构建分布式系统以处理大型数据集,包括结构化、半结构化或非结构化数据。这些数据集可以来自多个来源,大小从TB到PB到EB不等。


此类框架通常在高性能计算(HPC)中发挥作用,该技术可以解决材料科学、工程或金融建模等不同领域的难题。寻找这些问题的答案通常在于筛选尽可能多的相关数据。


最著的大数据框架是AH。其他大数据框架包括S、K、S和F,它们与H一样都是由A软件基金会开发的开源项目。AH最初由F开发,也是一个大数据框架。


S相对于H的优势是什么?
AH的主要组件是H分布式文件系统(HDFS)和数据处理引擎部署MR程序以过滤和排序数据。还包括YARN,它是H集群的资源管理器。


AS也可以在HDFS或替代的分布式文件系统上运行。它的开发速度比MR更,通过在内存中处理和保留数据以供后续步骤使用,而不是将结果直接写回存储。对于较小的工作负载,这会使S比H100倍。


但是,HMR可以处理比S大得多的数据集,尤其是那些整个数据集的大小超过可用内存的数据集。如果企业拥有大量数据并且处理对时间不敏感,那么H可能是更好的选择。


S更适合企业需要速答案的应用程序,例如涉及迭代或图形处理的应用程序。这种技术也称为络分析,该技术分析客户和产品等体之间的关系。


H和K的区别是什么?
AK是分布式事件流平台,旨在处理时数据源。这意味着数据在通过系统时被处理。


与H一样,K在服务器节点集群上运行,因此具有可扩展性。有些服务器节点形成存储层,称为代理,而另一些则处理数据流的连续导入和导出。


严格来说,K不是H的竞争对手平台。企业可以将它与H一起用作整体应用程序架构的一部分,在该架构中,它处理传入的数据流并将其输入到数据湖中,以供H等框架进行处理。


由于其每秒可处理数千条消息,K对于活动跟踪或大规模物联部署中的遥测数据收集等应用非常有用。


K和S的区别是什么?
AS是一种通用处理引擎,开发用于执行批处理(类似于MR)和工作负载,例如流、交互式查询和机器学习(ML)。


K的架构是分布式消息传递系统架构,将记录流存储在称为主题的类别中。它不是用于大规模分析作业,而是用于高效的流处理。它旨在集成到应用程序的业务逻辑中,而不是用于批量分析作业。


K最初是在社交络LI上开发,用于分析其数百万用户之间的联系。也许最好将其视为能够从众多来源时捕获数据,并将其分类为要分析的主题以深入了解数据的框架。


这种分析可能会使用S等工具执行,S是一种集群计算框架,可以执行用J、P或S等语言开发的代码。S还包含SSQL,它支持查询结构化和半结构化数据;以及SML,用于构建和操作ML管道的机器学习库。


其他大数据框架
以下是其他你可能感兴趣的大数据框架。


AH使SQL开发人员使用H查询语言(HQL)语句,类似于用于数据查询和分析的标准SQL。H可以在HDFS上运行,最适合数据仓库任务,例如提取、转换和加载(ETL)、报告和数据分析。


AF将有状态的流处理与处理ETL和批处理作业的能力相结合。这使其非常适合事件驱动的工作负载,例如上的用户交互或在线采购订单。与H一样,F可以运行在HDFS或其他数据存储层上。


AS是分布式时处理框架,可以与带有MR的H进行比较,不同之处在于它时处理事件数据,而MR以离散批次运行。S是为可扩展性和高级别容错而设计。它对于需要速响应的应用程序也很有用,例如检测安全漏洞。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

收藏:1 | 帖子:8万



侵权举报:本页面所涉内容均为用户发表并上传,岭南都会网仅提供存储服务,岭南都会网不承担相应的法律责任;如存在侵权问题,请权利人与岭南都会网联系删除!