《云原生降本增效大咖说》是企业网d1net与腾讯云联合策划出品的访谈栏目,我们期望通过深度专访,挖掘企业应用云原生技术的驱动因素,探索各自的应用历程,了解企业面临的技术痛点以及解决之道,梳理云原生技术应用最佳实践的一系列方法论,向外界展示云原生技术的价值,为中国企业的云历程再添助力。
本栏目采访了腾讯云、蒙牛、中国黄金集团、海尔、石化盈科5家企业技术大咖,来分享企业在部署云原生背后的思考、实践效果和方法沉淀。
在本期“云原生降本增效大咖说”中,企业网d1net采访了腾讯云云原生凯发在线的产品中心总经理邹辉。
邹辉认为:只有iaas层面远远不够,云计算厂商需要跟企业的众多生产业务相结合,结合一些新的技术,在paas和saas有更大的投入。面对传统企业,云厂商需要投入更多资源,覆盖售前、售中、售后等从交付到落地的各个阶段,帮助客户能够将产品用起来,还要用的很好。同时,他也为传统企业在云原生实践层面指明了最佳路径:首先,传统企业上云前期的决策和规划非常关键,要按照规划和节奏分步落实;其次,思维方式、组织架构和流程规范需要转变,要以更加云原生的理念去实践;最后,要注重云原生技术储备,提升技术团队和业务团队的综合能力。
(腾讯云云原生凯发在线的产品中心总经理邹辉)
以下是企业网d1net对腾讯云云原生实践采访内容的整理报道。
q1:有人说,当前云厂商之间的竞争已经不再是单纯的计算、存储的性能竞争,而是服务、生态、落地的综合实力比拼,是iaas paas saas组合拳的竞争。您是否认同这一观点?您觉得当前云计算市场的发展趋势是怎样的?
邹辉:我非常认同这一观点。伴随云计算市场的飞速发展,近几年国内大部分企业的上云进程都在加快,尤其是泛互联网行业上云已经趋于饱和,同时传统企业也在提速,国内整个云计算行业已经进入下半场。
过去企业上云最先用到的是iaas,它是云计算里最基础的一层。iaas层的技术非常成熟、商业模式清晰,所以iaas对云厂商而言是兵家必争之地。经过多年来的发展,云厂商的iaas产品和技术相对同质化,企业在iaas这里使用也越来越普及,极大地帮助企业提升了资源层面运维和开发效率。
但除了资源层面,云计算在企业内部的应用还远远不够,特别是和企业的生产业务结合这里,仍然有很长的路要走。同时我们也看到,一些新的技术如大数据、ai、ar/vr、元宇宙、脑机、机器人……正在与不同行业逐步融合,诞生出非常新的应用场景;在这些领域,云计算将会对企业业务,产生更大的价值和想象空间。比如iot、ai跟汽车行业结合可以实现自动驾驶,5g、机器人跟医疗行业结合可以实现远程手术。因此,我认为未来云计算需要跟企业的众多生产业务相结合,结合一些新的技术,在saas和paas领域会有更大的发展空间,这也将成为未来云厂商赢得竞争的关键落脚点。
至于您所说的服务、生态和落地的综合实力比拼,这也是一大趋势。当前,国内泛互联网行业的云化进程已经非常成熟,但是传统行业上云仍然处在初期阶段。传统行业的细分领域非常多,对云计算的要求差异更大。从云厂商的角度来看,如果想打磨出一款标准产品来满足传统行业各个细分领域的需求,完全不现实;但如果厂商想深入各个细分领域,满足不同领域的深度定制化需求,从人力成本和技术积累的角度来看也不是一个最佳的选择。因此,云厂商如果想要深耕传统行业客户,就必须与每个行业细分领域的凯发在线的合作伙伴一起,关注客户在落地实践过程中的所有环节,服务好客户,最终让客户收获价值,才有可能赢得未来的市场竞争。
q2:今年6月腾讯宣布自研业务完成全面上云,已累计节省成本超30亿元,这是腾讯自研上云战略的一个里程碑。腾讯自研业务上云经历了怎样的过程?
邹辉:过去三年,腾讯把自研业务全部搬到了公有云上,并且完成了云原生改造。“这一决策”背后其实有非常多的历史原因和深度思考,总结来看有两点,一是内因,另一个是外因。移动互联网时期,腾讯内部业务团队为了满足业务的快速增长,赢得市场竞争,每个业务都有自己专属的技术团队,久而久之就导致不同业务的技术栈自成体系,技术烟囱林立。同时为了服务好业务,腾讯内部技术团队积累了非常多的“亿”级架构技术理念,有着非常强的自豪感;越是成功的组织越会有强大的惯性,随着开源软件和云原生技术的兴起,腾讯内部主流技术仍然停留在上个时代,内部开发人员存在深深的技术焦虑感。这是内因。另外早期我们云去服务外部客户时,很多客户总是会问“你们腾讯内部的业务是否在用你们的云”,面对这种问题,我们很难回应。这是外因。
所以在这两个因素的促进下,腾讯做出了“自研上云”的重要技术战略;既然要上云,那上云上到什么程度,当时也有一番争论;很多业务的意见是用云上的iaas层就好,原因是很多业务已经有很完善的调度技术和paas组件;后来拿到腾讯决策层去讨论时,决策层提出“上到虚拟机这一层根本就不是真正的上云”和“部分业务技术运行的很好,局部最优但不代表着全局更优”两个观点,于是最终讨论下来,我们定下来,不光要上云,还要完成云原生技术改造,彻彻底底完成技术的升级换代,而不只是换一个轮子。
不过也恰好因为,腾讯内部技术团队对技术这里自主性非常高;所以云原生技术刚出现时,腾讯内部部分团队就开始引入并尝试在业务中落地。当时最典型的场景有两个:
一个是离线计算平台,我们基于docker构建了一个离线任务平台,docker的可移植性让不同的底层异构资源能加入到离线算力集群;同时docker的隔离性,让更多的细粒度任务可以跑在同一台机器上,提升利用率。
另外一个是游戏场景,游戏业务有一个特点,上线初期,如果火爆可能有大量扩容操作,运行一段时间后,如果效果不行,可能会频繁合服和下线。而k8s pod的快速启停,动态升降配的能力非常符合这个场景,于是我们将k8s引入,运行了很多游戏业务。
早期经过这一系列腾讯内部业务试点,腾讯在云原生技术这里的积累逐步成熟;之后我们逐步将云原生技术放到腾讯云上对外部客户输出,同时进一步在腾讯内部自研业务中全量推进云原生技术升级换代。
正是因为腾讯内部在前期做了这些技术试点,使得腾讯的云原生技术能力能够快速走向成熟,并将其应用到腾讯云上输出给外部客户,锤炼腾讯云的产品、技术和综合服务能力,最终实现内部海量自研业务的全面上云。经过三年的努力,现在腾讯内部所有核心业务全量完成了云原生改造。腾讯通过k8s技术将内部分散在不同业务、不同事业群的几千万核心资源全部拉通到统一的资源池,由统一的容器技术进行调度和管理,有效地减少了资源浪费,累计节省成本超过30亿元。同时我们也进一步通过容器的在离线混合部署等技术,使资源利用率得到质的提升。
除此之外,在自研上云的过程中,我们进一步将微服务技术、devops等研发效能方面的工具体系在内部统一,实现了开发和运维效率的大幅提升。在服务腾讯内部业务的同时,我们还将这些技术以标准产品的方式放到腾讯云上,对外部客户输出。可以看到,越来越多的开发者和企业用户正在基于腾讯云的衍生产品去构建应用,如今腾讯云原生产品已服务300万外部开发者,拥有国内最大的微信小程序开发平台和开发者平台。
q3:您认为企业云原生化改造的最佳技术路径是什么?腾讯可以提供哪些产品支撑?
邹辉:企业云原生化改造的过程并非一蹴而就,过程中会考虑改造对业务的冲击,会衡量资源投入的产出比,会担心技术积累是否足够支撑改造;所以企业云原生改造,往往会选择一种稳妥的方式逐步迭代进行;过程中先拿一些简单的模块试水,逐渐积累云原生相关的技术经验和信心,最终一步步走到深水区,完成整体云原生技术改造。
腾讯将云原生改造分成开发云原生、计算云原生、架构云原生、数据云原生和安全云原生5个大的阶段,这是企业云原生改造的5个不同层次,每个层次对应着丰富的云产品。例如在开发云原生阶段,我们有coding devops一站式研发管理平台,从需求管理、文档管理、代码管理、开发环境管理、测试管理到构建发布管理多个维度,为用户提供完整的自动化工具平台,帮助企业用户提升研发效率。在计算云原生阶段,我们有tke容器平台,能够帮助企业用户更好地使用计算资源,同时提升资源的利用率,节省成本;还有scf云函数以及基于云函数的微信云开发平台,两款产品的资源使用量都支持按次计费和毫秒级计费,用户可以按需使用,最大限度地帮助他们节约计算资源成本。当然,架构云原生、数据云原生和安全云原生也有非常丰富的产品供用户按需选择。
q4:在您看来,传统企业的上云需求与泛互联网行业有哪些不同?
邹辉:我认为最大的不同是标准化和行业化的差异。泛互联网行业内部的it架构相对标准化,对云的需求也比较一致。在服务泛互联网客户时,已经成为一种标准化模式,往往云产品上线前都会找一些标杆客户来打磨和完善,过程中不断增加一些新的功能,而这些积累往往也适用于其它泛互联网客户,甚至很多客户还会主动去参考这些标杆客户的用法,所以产品成熟最终推出时会是一个特别通用和标准化的产品。但是传统行业的差异性非常大,单单工业制造领域常用的生产软件就多达140余种,更别说银行领域的一些软件,这些软件在功能、安全、性能等等层面对云计算的要求各不相同,很难标准化。
其次在服务和落地层面,传统行业的技术积累相对薄弱,云厂商只做好云产品本身还远远不够,某种意义来看,云厂商更大的投入反而是在后继的交付和服务上。只要其中的任一环节没做好,整个单就可能失去;更严重的是,传统细分行业中人员圈子相对固定,内部透明度很高,一旦一个口碑做砸了,可能造成在某个细分行业的信任崩塌。所以面对传统企业,云厂商需要投入更多资源,覆盖售前、售中、售后等从交付到落地的各个阶段,帮助客户能够真正的将产品用起来,还要用的很好。
第三是对云计算的能力要求上也存在着差异,比如安全能力、位置需求等。泛互联网行业大多服务于线上的c端用户,大多要求云计算部署在一线城市的数据中心即可;而传统行业其it基础设施往往要求更靠近生产现场,例如工厂的生产调度系统、矿山的自动矿车驾驶系统,对计算的时延要求非常敏感,同时也有非常严格的成本诉求,这就要求云计算也能够靠近这些终端应用所在的位置去提供服务。
q5:正如您所说,传统企业的it基础相对薄弱,您认为传统企业在云原生实践层面,如何才能少走弯路?应该采取哪些策略?
邹辉:首先,传统企业上云前期的决策和规划非常关键。为什么上云?为什么要做云原生改造?云原生改造的价值是什么?改造过程中可能会碰到那些问题?改造的阶段和目标如何制定?如果这些问题没想清楚,改造途中突然发现投入太大、或者价值不明显从而停掉或者调转方向,无论对业务还是对团队都是非常大的冲击。因此前期要有非常清晰的认知和决策,企业内部从上到下要达成共识,按照规划和节奏分步落实。
其次,思维方式、组织架构和流程规范上需要转变。传统企业的软件和架构相对老旧,研发模式上也不那么敏捷。所以除了关注技术本身外,也要多关注云原生相关的理念:如devops(持续交付,自动化运维)、微服务设计、弹性伸缩,动态调度;同时在组织架构和流程规范上,也要有相应的调整,以适应云原生场景下的新诉求。
最后,要注重技术储备。例如微服务、容器的技术储备,通过业务层面的一些培训,让业务更好地进行云原生改造。当然,传统企业也可以与云厂商合作,进一步提升技术团队和业务团队的综合能力。
专访邹辉:腾讯自研业务上云经历 为企业云原生实践指明最佳路径(下)