加入收藏 | 设为首页 | 会员中心 | 我要投稿 PHP编程网 - 金华站长网 (https://www.0579zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 云计算 > 正文

2022年阿里云峰会纪要

发布时间:2022-10-31 11:22:25 所属栏目:云计算 来源:
导读:  【主旨演讲:聚焦核心技术】

  嘉宾:张建锋 阿里云智能总裁 阿里巴巴达摩院院长

  1、 背景

  1)当前数字经济已经成为全球发展的关键引擎。云计算作为数字经济的重要基础设施,正在源源不断
  【主旨演讲:聚焦核心技术】
 
  嘉宾:张建锋 阿里云智能总裁 阿里巴巴达摩院院长
 
  1、 背景
 
  1)当前数字经济已经成为全球发展的关键引擎。云计算作为数字经济的重要基础设施,正在源源不断地为社会提供像水电一样的基础的算力资源。
 
  2)阿里云是云计算市场的一支重要力量。成立到今天,阿里云已经成立了 13 年,服务了全球 400 多万客户,包括 26 个国家部委、80%的中国科技企业、60%的 A 股上市公司、65%的国家级专精特新小巨人企业。在他们当中涌现出了众多的数字化先行者,这些企业已经在云上完成了多方面的数字化转型实践,并开始探索更深层次的价值。
 
  3)为了向全球用户提供随时随地的云计算服务,阿里云建立了覆盖全球的算力基础设施。在四大洲的 27 个国家和地区,84个可运区、2800个网络节点,运营着超过百万台服务器。如此大规模的基础设施,给稳定性和能耗也带来了巨大的挑战。在稳定性方面,阿里云部署了超过 2000 万个监测点,覆盖率达到100%,服务器的非预期宕机率低于万分之一。这个代表着目前领先的一个水平。
 
  4)在绿色低碳方面,我们坚持投入技能技术的研发。自研的单相浸没式液冷技术是使PUE低至1.09,我们自研的数据中心电源系统是配电效率高达97.5%。我们也致力于清洁能源的使用。2021年阿里云的绿电交易量为 2.69亿千瓦时,位列中国绿电采购企业排行榜第一。
 
  5)这几年云计算也进入了新的一个发展的关键,我们越来越接近于下个时代,我们可能需要定义全新的技术体系。所以我们今年的策略是 back to basic 回到云计算的本质,云计算的核心竞争力是技术,云计算也是一种公共服务产业,数字化的发展推动着云计算规模成倍增长,人工智能、大数据、物联网等新技术要求云的形态也同时不断演进。
 
  2、 云计算发展历程
 
  1)第一阶段的关键技术是分布式架构。这个阶段互联网企业高速成长,单一业务的算力要求都超过万台规模的服务器,于是催生了云计算技术。在互联网企业的推动下,快速地完成了从传统的大机向分布式系统整个迁移的过程。过程当中也发展出了非常多的一些新的技术和新的生态,其中最重要的一个生态,我认为是开源生态。
 
  2)第二阶段是以 CPU 为中心的云计算体系架构。企业不断提高着对算力可用性和可靠性的要求,云计算公司通过软件定义的方法,把以 CPU 为中心构建的分布式的计算存储分裂的架构,对资源统一的调度编排,提供给客户。云原生方式重新设计的整个架构和软件。同时客户也不断地提高了对这个云计算提供的低时延、高带宽的需求,这些需求很难通过传统的体系机构的优化去满足。
 
  3)总结如今云计算面临的几大挑战。
 
  第一是计算和网络传输的时延大。以前可能不明显,但是随着我们的体系结构越来越分布式,即一个大型应用会分散成多个子系统去部署,这些系统之间高速互联需要非常低的延时。
 
  第二是随着大数据应用的不断增长, RDC内部的东西向的流量越来越大。所以我们需要满足流量增大之后的网络的一些新的要求。
 
  第三我们现在的系统规模大,越来越复杂。所以我们面临一个超大规模基础设施的复杂管理问题,还有云内部的超大应用的复杂的应用管理问题。
 
  云计算公司的未来发展:过去从分布式到以 CPU 为中心的云时代,事实上也完成了非常多的一些创新,特别是像资源池化等等。但是随着数据的增长,随着规模的变大,随着延迟的要求越来越高,需要呼唤一个全新的技术体系,去满足下一阶段的这个要求。我们认为需要从计算机的RDC内部的体系结构里面做一些全新的创新,从以往的以 CPU 为中心的体系架构,进入以云的整个操作系统,加一个新的硬件为中心的体系架构。云计算最重要的特点是它把所有的东西通过软件来重新定义,提升了整个云资源利用的这个敏捷性,带来的问题会有一定的性能损失。所以云计算又要满足大规模的要求,又要满足软件定义灵活性的要求,又要有原来硬件原生的性能,则需要综合地来解决这些问题。
 
  3、CIPU云基础设施处理器
 
  今天我们要发布下一代的云计算的基础设施:CIPU。以前的CPU就是我们讲的中心处理器,它是以单机为核心的构建起来的。那 CIPU是云时代的整个IDC的内部的处理核心。在这个全新的架构下,计算、存储和网络,我们一旦接入CIPU,资源皆可被高效地云化管理,通过CRPU的硬件的加速实现超高的性能。所以我们可以把云计算的操作系统和新的硬件体系结构做完美的融合,既有高效性又有灵活性。
 
  1)四个特点:
 
  网络资源云化加速:CIPU用网络集合,对高带宽物理网络进行硬件加速,通过建设大规模的eRDMA分布式高新的网络,实现 RDMA 技术的普惠化。在数据中心以及网络领域,要提高到非常高的性能,就需要新的一些结构。RDMA 是其中一个非常有前景的技术,但这个技术非常难被作为一个服务提供给客户,通过我们的CRPU我们就有这个机会。
 
  存储资源云化加速:进行硬件加速,提供超高性能的云盘。资源池化是云计算领域最重要的一个特征,就是把我们的存储给池化,客户不需要关心我订购的服务器里面有多少存储。一个存储池里面可以灵活地提供海量的存储,但这就要解决一个带宽跟延时的问题,所以CIPU对这个领域有一个非常好的解决方案。
 
  计算资源云化加速:快速接入不同类型的自研的神龙服务器,代理算力的零损耗以及硬阶级安全的加固隔离。因为云计算的发展过程中就是算力不断地被虚拟化的过程,为了完善虚拟化,服务器需要额外的开销。那今天通过CIPU可以把这个开销降低到零,而且提供非常高的一些安全的硬件的隔离的性能。
 
  云化资源控制器:被CIPU云化的算力资源,再通过我们的飞天操作系统进行规模化、灵活高效地管理和调度,客户就能够享受到跟物理机一样的性能,却有远超物理机的敏捷性,也有享受到云计算的弹性。
 
  2)夯实技术底座
 
  CIPU新型计算机的体系技术之上,阿里云还积极夯实技术底座,建立了自研的芯片、服务器、计算、存储、网络等一体的基础设施:
 
  倚天710芯片:去年我们发布了倚天 710 芯片:针对通过计算、云原生、安卓、 encloud 等场景,大幅提升了算力性价比。
 
  磐久服务器系列:同时我们还发布了磐久服务器系列,通过软硬件融合和模块化设计与风能、液冷主板归一化,更好地支撑下一代云原生系统架构,交付效率提升了50%。
 
  SNA超融合网络设备:我们在业内首创的可编程 SNA 融合算力网关,单网关吞吐提升了 20 倍,转发性能提升了 70 倍,已经在于中兴云和边缘云大规模部署。
 
  绿色低碳数据中心:同时阿里云自研的绿色技能技术也在大规模的应用。我们在浙江仁和建立了全国最大的一轮数据中心集群,让数据中心碳排放下降了 20% 多。
 
  3)洛神网络:
 
  要让千行百业享受到无处不在的云服务,首先需要一张网络。无论是分布式的基础,还是下一代的云,把这么多的服务器要连接起来,必须要有一张非常可靠的、高性能的、灵活的、网络系统:洛神网络。阿里云持续投入了自研交换机、光模块、RDMA 网络技术端研发,建立了高性能低时延的大规模网络基础设施。最大的特点是在低延时、高性能的基础上实现了规模化,因为RDMA非常难以实现规模化,今天阿里云的整个 RDC 都是通过这样的技术把它串联起来的。
 
  指标:40Mpps网络转发性能;99.995%负载均衡可用性;百万VPC单地域网络规模
 
  特点:高性能;低时延;灵活部署;简单开放
 
  洛神网络还是基于软硬一体的云网络系统,依托遍布全球的超高性能网络基础设施以及全栈自研的能力,为客户提供超大规模丰富的网络服务,同时也支撑人工智能、大数据等新型算力的需求。我们也始终坚持推进网络设备的标准化和开放性。今天我们的交换机、NAT SLB 上所有的网络设备服务计算 云计算,大部分都可以通过软件来灵活定义。我们大力地简化了这个硬件的结构以及模块的标准化,使我们大量的供应商都可以非常方便地来提供这个服务,也来提供这样的产品进入到阿里云整个系统中。在客户上云时,陌生人可以快速构建一张全球化网络,用户还可以一键打通云上和云下的业务。客户本地的或者是分布在全球全国的这个云下业务,包括自己的这个 IDC 站点、分支站点都接入阿里云,享受统一的管理和一致性的业务体验。洛神网络具有业界领先的创新技术能力,连续四年我们每年都有多篇论文入选国际顶会SIGCOMM,在 2021 年获得中国通信学会创新科技成果奖和中国计算机学会技术发明一等奖。网络从物理网络到在云计算,帮助客户快速构建自己的虚拟网络,再到我们提供虚拟网络之上的丰富的网络产品与服务,为我们的客户提供一个完整的高性能、高可靠的基础的网络服务。
 
  4)盘古存储:
 
  云计算还有另一个重要的基石就是这个存储。盘古存储提供了一个非常高的数据可靠性的存储系统。超大规模存储的稳定性与可靠性通常是比较矛盾的一个技术难点:又要实现超大的规模,我又要实现高稳定性,特别是云商提供服务的话,还要提供高性价比。盘古存储,将所有的磁盘虚拟成了一个超大规模的稳定可靠的磁盘,所以用户眼里你实际上面对的是一个超级大的存储的湖或者一个池或者这个海,他并不需要关心这个物理位置或者是机器类型,只要随着数据的增长,他一直可以申请到一个更大规模的一个存储。我们在上面可以根据我们的快存储,来构建其他更加丰富的应用类的存储产品,从而支撑各类场景的存储需求。
 
  目前盘古存储系统管理着数十 EB 的存储规模,提供 12 个 9 的可靠性,保证提供 10 万经典的线性扩展能力,盘古存储协同CIPU和洛神网络,让延迟降低到 30 微秒。也就是说我今天访问一个在远端的盘古的存储,我的延迟比我访问本地的个硬盘还要更低。同时我们还能够提供百外级SSD快存储服务。我们为生态伙伴和客户的数据管理类产品提供云原生的存储解决方案,客户他可以把自己的存储需求构建在阿里云提供的盘古存储之上,存储海量能够带来一个非常非常大的便利性。原来存储没有这么大的规模的时候,我们需要在数据库上面做一些分库、分表等复杂的一些操作,才能够满足这个需求;今天这个存储可以完全看成海量的,可以无限扩充的。过去十年,通过软硬件协同创新,阿里云存储的性能和可靠性提升了有 1000 倍以上。
 
  5)神龙计算:
 
  云的整个体系里面,最核心的就是计算。神龙计算平台管理着百万级的服务节点,管理的超过 100 万个服务器的资源,大规模的自研神龙服务器通过CIPU云化记录,在神龙的调度编排下,为客户提供大规模的弹性计算服务。基于CIPU和飞天操作系统加速的神龙弹性计算集群,无论是在分布式应用还是人工智能的场景测试中都展现了优越的性能。例如 Redis 的性能提升了 68%,MySQL 提升了60%,在医院上用之后,比自建物理机的集群吞吐量提升了30%,业务高峰期延迟下降了90%。
 
  指标:百万级节点超大规模弹性形调度;99.975%软件一体单点高可用;“0”损耗CPU虚拟化加速;安全隔离CPU安全加固隔离
 
  特点:飞天云操作系统+云基础设施处理器CPU
 
  高稳定性是基础服务设施的一个关键。在GPU服务器、CPU服务器和其他的异构服务器这些关键计算服务中,阿里云神龙服务器的各项性能始终处于一切的领先的水平。除此之外,神龙计算平台可以提前预测 80% 的硬件故障,并进行无感热迁移规避,从而实现了一线领先的高可用 SLA 。值得一提的是,CIPU为神龙服务器接入的硬件提供了安全加固隔离、存储和网络链路的硬件加解密能力,从而实现了业界领先的租户计算安全的隔离性。云计算从开始一直到今天,整个虚拟化是核心中的核心,也经历了几代的变迁,一直到今天是通过硬件来卸载云的管理服务,也来卸载云的服务器的计算节点的计算、隔离、虚拟化的一些服务。阿里云在这方面也是始终走在前面,我们从 18 年开始正式商用,到今天为止,在这个领域走在技术的前头,也处在业界的前头,我觉得是一个全新的里程碑。
 
  5)云安全:
 
  安全又是云上客户最为关心的这个内容。阿里云将安全列为首要责任,建立体系化安全能力为客户提供安全保障。阿里云将安全内置在基础设施中,建设云原生的安全平台,做好自身平台的安全防护,提供从底层芯片到系统、网络、数据和应用等全链路的安全能力。同时严格遵守软硬件安全开发生命周期管理流程,做好产品开发各个环节的安全保障。
 
  指标:60亿日均攻击拦截;2Tbps单IP防御能力;20亿日均有害传播拦截;600万年平均漏洞修复
 
  特点:安全服务化SECaaS;原生安全云平台
 
  阿里云将安全能力向云上客户开放,让云上客户不用做复杂的部署和测试,尽量享受和阿里云一样的安全能力。同时我们把自己的能力做成一种便捷的服务,即使上万台的服务器也能在小时级实现安全能力覆盖。阿里云每天保护着全国 40% 的网站,拦截6亿次攻击,20亿次有害传播,为客户提供全面的安全防护。把客户的应用都搬到云上来之后,我认为比客户在原来线下零散的管理自己的服务器的安全等级和性能都提升了无数倍,因为在云上有更统一的安全的漏洞的扫描、软件的检测跟更新,也提供统一的一些防护的服务。另一方面我们除了这些安全的云产品之外,服务型的、应用型的一些产品里面也植入了我们自己的安全技术,比如说我们的数据库我们也提供加密数据的服务,我们的网络我们也提供端到端的全加密的一个网络的服务等等。
 
  5)飞天云操作系统:
 
  过去 13 年,阿里云通过自研云操作系统平台成为全球最大三朵云之一,当前的市场领先地位是我们长期坚持投入核心技术的这个结果。今天我们的飞天云操作系统运行在我们的CIPU之上,管理和调度被CIPU云化的底层物理资源,统一提供高性能、高弹性、安全稳定的算力资源。所以今天的阿里云是一个软件和硬件的完美的结合。我们的飞天云操作系统加上通过CIPU整合的各种资源,是一个有新的基础技术架构支撑的一个云系统。
 
  飞天云操作系统主要包含有三层架构,飞天内核包含神农计算、盘古存储、洛森网络和安全内核,代表了全球云计算领域的领先水平。我认为不仅代表领先水平,也代表着这个云技术接下去的一个发展的趋势。
 
  2021 年年底,国际权威机构 gartner 发布报告,阿里云IaSS基础设施产品能力全球第一。我们在这四个领域里面都拿到了全球第一的排名,这四个领域都是云计算领域的一个关键的组成部分(计算、存储、网络和安全)。
 
  6)无影:
 
  特点:自适应;高画质;低延迟;跨生态
 
  介绍:云计算在自身技术演进的同时,我认为也跟云计算之外的传统的计算机机构,包括我们的应用的架构,也带来了影响或也带来一些变革的机会。我们创新了新的一个平台:无影。无影就是我们希望通过云的技术跟传统的 PC 的技术做结合,无影的整个算力就完全是在云上面。我们客户端接触的是我们的键盘,我们的屏幕,还有我们的一些周边的设备,然后通过高速的网,络包括现在的高速的网络或者是 5G 这样的宽带网络,接到我们的云服务器上来完成这个计算。
 
  作用:所以今天无影可以随时随地的多屏接入,它具备云上的算力弹性和网络的就近接入,让客户可以灵活配置,并通过云源三化实现多三态应用的部署跨端的分发。此外,我们自研的这个流化的协议率先支持 8k 的无损画质,带来更好的视觉体验。它带来的好处是比你以前的 PC 的解决方案可能要好无数倍。无影我认为是在今后可能会深刻地影响我们 PC 端的整个体系结构,让我们的办公、家用或者是工厂工业企业里面的各类应用都通过无影这样一些设备,把云端跟终端能够更高效更安全地连接在起来。
 
  举例:云上的算力给无限扩充,特别是一些办公应用,比如说我们有个客户叫妙智科技,今年深圳疫情期间,通过无影构建的云上一体化的办公解决方案,在家研发了高精度搜索机器人,既保证数据安全,又确保了研发进度。居家办公结束后,公司全员人寿态物营可以随时在东莞、深圳两地协同办公,并将一台手速工制单替换为无影,增加了手术及器染的产品的灵活性。
 
  4、产品和服务
 
  1)技术创新始终是阿里云实现行业领先新的根本保证。我们的技术能力和产品始终以客户为导向,为客户提供基于云原生架构的云边端一体化产品与服务。那目前我们阿里云有六大的产品线,分别为基础产品,边缘云与云通讯、数据管理服务、 AR 与机器学习、企业与媒体服务和 IoT。这些丰富而全面的产品,围绕客户场景与行业需求,提供政务、城市治理、医疗、交通、制造、零售等各个行业的解决方案。
 
  2)各行各业的数字化才刚刚开始。云计算是各行各业走向数字化的重要基础设施,全行业的数字化需要产业链各方携手,共同攻克技术难关,加速人才培养,共同构建繁荣的行业生态。尤其是云计算既有的基础的 IaSS的服务,这方面我们通过提出CIPU这样为核心的新的架构,把整个软件和硬件更标准化,来提供更加快捷便捷的服务。我们也希望有更多的合作伙伴一起,通过把更多的行业化的应用在云上来实现,来繁荣起这个生态。我们和生态伙伴站在一起,共同共建数字创新生态,繁荣云上产业链,共创数字新世界。
 
  3)为了无法计算的价值,是阿里云不变的使命,也是阿里云对客户的承诺。在今天这样一个充满变化的时代,我们更需要坚持 B2B 就是 back to basic 聚焦云计算的本质,在技术的长征路上不断取得新的突破。
 

(编辑:PHP编程网 - 金华站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!