阿里云孙成浩:打造万物智联的智能云网络
撰文 | 田小梦
题图 | IC Photo
在数字化浪潮下,智能云网络价值逐渐最大化。
云计算发展早期,云主机、虚拟化可能是被大家最先熟知的概念,它们更多的聚焦于计算和存储。除两者外,云计算的“三大件”之一——网络,也是不可忽视的。
网络的发展相对前两者有所滞后。从2015年开始,随着各大云服务商数据中心和网络能力的需求快速变化,网络虚拟化开始不断跟进。SDN/NFV、SD-WAN、云网融合、算力网络、智能云网络等一系列和云网相关的产品和服务,成为云服务商交付客户的一项重要内容。
阿里云作为国内四大头部云厂商,在推动云网络发展的道路上,一直期望连接是足够简单可靠,甚至是高效的连接。其中从0到3.0的阿里云洛神云网络,则是最有力验证。
2010年的洛神1.0——云数据中心网络;2016到2020年的洛神2.0——云广域网络;2020年开始的洛神3.0——应用-云-边-端一体的智能网络,在不同发展阶段皆满足用户的网络需求。
现如今,智能云网络发展如何?它又将如何定义下一代云网融合?未来将呈现怎样的发展趋势?近日采访了阿里云智能云网络产品线产品总监孙成浩,他以上问题进行了解答。
智能云网络演进与价值
智能在云网络领域中并不是全新的概念,而是一直伴随云网络的发展。原因在于,云网络本身提供给使用的体验、配置的体验和原本的传统网络就有很大的差异性。
在孙成浩看来,如果把云网络理解成网络的数字化转型,智能便是网络技术数字化转型的一个非常关键的技术。尤其是进入到云网融合阶段之后,当网络需要更好的、更简单的、更可靠的、更稳定的去连接云边端的各个生产节点,并且在去传输生产节点里面的关键数据,或解决网络越来越复杂的问题时,智能起到非常重要的作用。
回过头来看,云网络究竟是如何发展起来的呢?
“毫无疑问,是消费互联网这波浪潮带起来的。”孙成浩说道,随着企业数字化的深入,越来越多的传统企业开始上云,并从原本的部分上云发展到今天的全量上云,甚至触发了全产业上云的趋势。云网络逐渐转向解决企业内部或者是企业间的深度连接问题为重心。
从整个行业趋势来看,随着物联网、车联网等智能化发展,云网络已经从过去的连接以公共云为中心的云网络,发展到连接从应用到云到边到端一体的分布式网络。
同时,云原生也成为云网络发展中的关键趋势之一。云网络发展需要投入非常大的能力去满足云原生相关应用的一些需求,从原本的云网络去解决OSI二三层连接的能力,到现在深度解决应用连接的能力,以及更多的感知应用的能力。
在企业、市场和行业三驾马车的拉动下,孙成浩认为,智能云网络也凸显出其自身的三大价值。
价值一,云网络是依靠整个分布式云的概念存在的,因此云网络具备对整个全球化分布式云的智能组网能力。结合近期热议的算力网络而言,算力网络里的关键的技术,就是如何对网络做全局化的、自动化的调度,以及算力感知的编排和适配。
价值二,支持云上云下网络设备一体化的管理,自动化的配置等需求。这是因为在整个云的发展阶段中,混合云是发展阶段中重要的一环,在云下存在着各种各样不同的节点、各种各样丰富的设备,以及各种各样连接的方式,因此实现一体化管理尤为重要。
价值三,在云网络的运维和使用上,故障的自动诊断、自动恢复、定位等是智能云网络的三个重要的价值点。诚如,对于整张网络健康度的检查管理、网络联通性的验证、预先的配置检查、模拟,故障提前发现、排除,通过云网络的API使用方式,降低用户运维成本,降低OPEX。
智能云网络的四大挑战
理论是产品的基础,产品是理论的验证。
当问及智能云网络当前处于怎样的发展阶段?孙成浩坦言称,目前智能化产品处在相应比较初级的阶段。正如在故障预测、故障发现这样的场景里面,想要靠智能化、自动化100%的去发现问题,其实是非常难的。
在孙成浩看来,传统大数据技术和AI技术直接搬进云网络里面使用不是特别合适的,云网络有它自己相应的特点,大数据技术在云网络场景中需要进行非常多类似于模型的建立、调优甚至于建立一些知识图谱,故障预测等相应的模型才能去解决的问题。当下智能云网络的发展也存在四大挑战:
一是规模。因为数以百万计用户的流量做拟合和测定,带来的挑战巨大,同时测定故障的定位和发现速度要求高,很多业务对网络非常敏感。
二是网络链路。网络链路非常长,尤其是涉及到在云场景里面的某些互联网链路,还会有跨地域、跨区域访问,如何在链路里面找到出现问题的节点,并且尽快把流量切走,这是一个端到端的链路复杂度问题,也是一个非常大的挑战。
三是故障模型。如何发现单客户的问题还是批量客户的问题,故障的影响面到底有多大?如何快速恢复?这对于传统的大数据技术需要去做适配与网络相应特征的变化和调优。
四是用更低的成本解决网络可靠性问题挑战。整个产业的链路数据量巨大,如何更高效更低成本提升网络的可靠性、可用性,是一个很大的挑战,也是需要从技术视角里面去做相应的适配和提升的。
但不可否认的是,往往挑战和机遇是并存的。对于智能云网络的发展,作为产业的参与者,阿里云有着与时俱进的发展动力。
据介绍,2018年阿里云发布了第一款SD-WAN产品——智能接入网关,其主要卖点就是线下网关一键上云能力。2021年阿里云对该产品进行升级,把单一的智能接入网关设备升级到了整个分支网络,如电子价签、AP、交换级网关等设备,不仅具备了对于线下分支各种不同设备的管理能力,同时继承了原来一键连接阿里云的能力。
为了解决更大规模的网络组网问题,阿里云在2017年发布了一款全球各区域虚拟网络组网产品——云企业网,主打让用户可以快速地自动构建一张连接全球的网络,换言之,线上和线下可以自动的把网络连接起来。
去年4月份,阿里云对云企业网进行全新的升级,首先是对于规模复杂的组网升级,满足用户组网要求下的一些细粒度、精细化的网络调度的诉求,同时还支持基于意图的Network Policy以及安全服务链等相应的能力提升。此外,云企业网2.0在配置的基础上基于全网链路的分析优化网络,提升利用率,降低用户成本。
值得一提的还有,上文所描述的阿里云洛神云网络产品。
智能云网络的发展趋势
智能化的云网络的是当前的新趋势,未来又将如何发展?
“比如,算力网络对于端到端云边端算力的调度、协同,然后云网络的感知算力,云网络的意图化和智能化,甚至是跨云的、跨厂商的算力的抽象和调度,这都是智能云网络未来趋势之一。”孙正浩说到。
孙正浩举例表示,如今正火的“元宇宙”概念,它涉及AR/VR、游戏等应用,它体现出未来云网络所要去cover的范畴,或者说未来趋势就是一个复杂的端到端的,涉及到云边端算力连接的一张网络,同时它要去做更好的体验,更低的延迟,做就近的渲染等相应的技术,保证了端到端类似于真人的体验。
从技术发展来看,智能云网络的发展导致技术架构的升级演进。
结合场景来看,一是从数据采集、分析到故障发现、处理、恢复,都是基于大数据的一套整体的链路;二是全球组网的相应的产品体系,一类是数据面的基础架构,会落到区域网关之间的网络协议,基于区域网关的路由同步协议,实现全球路由的同步,另一类是控制面会有全球路由管理器,来管理全局的路由,会涉及到网络子网路由收敛相应的一些动作;三是线下设备的管理,需要在抽象层去适配线下各种不同的设备类型,然后在云上去提供统一管理和配置的控制器,去做相应的控制;四是诊断相应的能力,需要确保整个网络系统可靠运行的能力。
孙正浩认为,简单来看,这四类技术还都不太一样,但都会有一些不同的技术在其中有一些应用的空间。
回归云网络的本质,孙正浩表示还是在做云服务。作为客户,所期待的未来云网络,是在没有感知到网络的变化的时候,它可以提供更高效的、可靠的、更智能的云服务体验。正如阿里云Slogan,期望面向未来的智能社会,提供一张或者说打造一张满足万物智联、万物上云的智能云网络。