玉林社区   玉林商家自荐   说一说让云原生超级计算挺进千万数据中心
返回列表
查看: 194|回复: 0

说一说让云原生超级计算挺进千万数据中心

[复制链接]

1384

主题

1384

帖子

5270

积分

论坛元老

Rank: 8Rank: 8

积分
5270
发表于 2022-2-22 21:59:52 | 显示全部楼层 |阅读模式

马上注册玉林红豆网会员,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

“云原生超级计算挺进千万数据中心”作为主题,宋庆春围绕会计算的络、U一体云原生架构、零信任云原生个话题展开探讨。【51CTO原创稿件】后疫情时代,企业正在积极采用云计算、大数据、AI、物联等新技术,加速数字化转型步伐,以此来推动业务模式的创新,让企业保持可持续发展。在企业数字化转型过程中,既需要数据中心高性能的计算资源,又需要借助云的弹性和灵活性,以面对不同业务对于计算、存储、络等需求,提高效率并降低IT成本。[url=http:///www.wangsu.com/]cdn[/url]的相关资讯可以到我们网站了解一下,从专业角度出发为您解答相关问题,给您优质的服务![align=center]

                               
登录/注册后可看大图
[/align]


那么,如何将数据中心与云更好的结合在一起呢?在近期NVIDIA组织的一次线上媒体沟通会上,NVIDIA络事业部宋庆春就此与媒体进行了深入的交流与沟通。本次媒体沟通会以云原生超级计算挺进千万数据中心作为主题,宋庆春围绕会计算的络、U一体云原生架构、零信任云原生个话题展开探讨。他表示,在当前的大环境下,企业既需要数据中心里的限算力,又需要高安全、高隔离,基于零信任(Z-)的络,而采用云原生技术,则能够满足企业的各种诉求。





NVIDIA络事业部宋庆春


借助云原生将超算带入数据中心


大数据分析、人工智能等技术的应用落地,需要超算进行支撑。然而,由于超算的使用成本过高,大部分企业更需要云计算的弹性和灵活性。那么,如何将超算的性能和云的灵活性整合在一起,以一种全新的架构来满足不同业务的需求呢?宋庆春认为,借助云原生超算技术,即能够将超级计算技术带入千家万户的数据中心,因此云原生将会是未来提供算力平台的发展趋势。


如何将各种云原生的设备高效的连接起来,是NVIDIA着力解决的技术难题,而IB络即是目前最贴切、最合适的络。


IB是会计算的络,能够非常容易的扩展到几万、几十万、上百万的节点规模,采用软件来定义的方式也使其变得更易于管理。宋庆春表示,IB络非常适合云原生架构,为此NVIDIA推出了Q-2平台,为企业更好的应用IB络提供很好的支撑。


据介绍,NVIDIAQ-2平台有个非常重要的产品,分别是Q-2交换机、CONNECTX-7IB卡和基于BF-的IBDPU,这款产品拥有多租户、性能隔离、拥塞控制、超高精度计时器等关键功能。


宋庆春告诉,Q-2是一个会计算的络,真正现了数据在哪里计算就在那里,契合了超级计算和云原生对络的需求。Q-2不但能够现GPUDRDMA对AI业务至关重要的技术,增加了PDA(PDA)来对特定流量进行编程和加速,而且还对各种通信模型进行了专门优化,提高了A--A通信时的通信效率。


在微软AZURE公有云上测试结果显示,使用IB动态路由和拥塞控制技术,现了云上性能的保障,同时成功对不同的业务进行了隔离,使得业务之间不会相互影响,达到了B-的性能。


U一体云原生架构赋予限算力资源


DPU等专用芯片的加持,赋予了络全新的生命。


谈到NVIDIAU一体云原生架构,宋庆春首先介绍了NVIDIADPU产品。他表示,DPU的出现弥补了数据中心I加速能力不足的问题,现了DPU、GPU、CPUU一体的新型数据中心架构,让数据中心成为新的计算单元,给数据中心算力优化提供了全新的资源。因此,U一体已经成为数据中心必然架构,并通过DPU、CPU和GPU的分工合作现数据中心最优性能。


DPU的出现,为用户提供了另外一个对业务性能进行优化的思路,由DPU来运行通信框架,由CPU和GPU执行浮点计算,通过DPU加速HPC业务中的通信,现了计算和通信的重叠。


宋庆春通过一组数据,详细介绍了U一体云原生架构的重要性。A是HPC应用、AI推荐时经常用到的通信模型,通过用DPU和CPU现计算通信重叠,让A性能得到44%的提升。A是做大规模模型训练时用到的一个通信模型,通过DPU和CPU计算通信的O,能够让A性能提升6%。


DPU的出现,弥补了数据中心对于I加速能力不足的问题,现了DPU、GPU、CPUU一体新型数据中心架构,让数据中心成为新的计算单元,给用户优化算力资源提供了想像空间。宋庆春如是说。


云原生软件定义为零信任提供安全保障


在远程办公成为新常态的今天,用户需要随时随地的访问企业内部数据中心与云上的应用和数据,处不在的连接,使得络安全面临着越来越大的挑战,零信任络则成为保障络安全的必选项。


传统的络架构,如果发现问题需要200天,修复问题需要70天,那么数据中心将非常不安全。宋庆春表示,借助NVIDIADOCA12面向零信任(Z-)的安全框架,即可以很好的保障连接的安全。


据介绍,在DOCA12中提供了LB、DPI、IPS、IDS、下一代防火墙,设计安全软件的用户或者安全软件的供应商,可以直接通过DOCAAPI调用在GPU里的硬件加速引擎,让数据中心更安全。


际上,在今年的GTC上,仁勋专门针对M安全框架进行了讲解。M对未来数据中心提供了一个更新的思路,即通过M利用AI的方式进行安全防御,而不必根据传统的安全顾问对于恶意攻击或者是其他安全特定模型的识别来进行有限的安全防御,利用AI深度学习的方式可以让数据中心得到全方的保护,让数据中心自动侦测恶意行为,并采取措施,防止络受到攻击。


据介绍,NVIDIA以太和IB络都现了与M的整合,特别是IB络的UFMC-AI与M进行联合,不但现了对络中异常行为的识别处理,同时也现了对于未来络中有可能出现的异常情况进行推测,并进行自我预防保护。


宋庆春表示,借助NVIDIAM的零监督自学习的框架,能够现600倍的遥测数据处理速度,生成超过百万甚至超过千万的模型,与数据中心里面进行匹配,现数据中心异常监控与处理。


【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO】
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

收藏:1 | 帖子:5万



侵权举报:本页面所涉内容均为用户发表并上传,岭南都会网仅提供存储服务,岭南都会网不承担相应的法律责任;如存在侵权问题,请权利人与岭南都会网联系删除!