《云原生降本增效大咖说》是企业网d1net与腾讯云联合策划出品的访谈栏目,我们期望通过深度专访,挖掘企业应用云原生技术的驱动因素,探索各自的应用历程,了解企业面临的技术痛点以及解决之道,梳理云原生技术应用最佳实践的一系列方法论,向外界展示云原生技术的价值,为中国企业的云历程再添助力。
本栏目采访了腾讯云、蒙牛、中国黄金集团、海尔、石化盈科5家企业技术大咖,来分享企业在部署云原生背后的思考、实践效果和方法沉淀。
作为全球白色家电龙头,海尔智家为用户提供衣、食、住、娱的智慧全场景凯发在线的解决方案,全面提升用户生活品质,以“云”体验、全链路服务、个性化智慧终端,实现交互、体验、销售、服务于一体的全流程生态平台。
海尔智家全球数字化平台用到了哪些云原生技术产品?如何实现降本增效?在云原生技术应用方面有哪些实践和探索?云原生技术发挥了哪些价值?在本期“云原生降本增效大咖说”中,企业网d1net采访了海尔智家全球数字化平台技术总监高丽。她表示,海尔智家从2017年开始云原生试点,2018年全面拥抱k8s,多年来紧跟云原生的技术发展趋势,在产品技术和管理方式等方面做了一些尝试性的探索,经过五六年的积累,收获了一些心得。
以下是企业网d1net对海尔智家云原生应用实践采访内容的整理报道。
海尔智家全球数字化平台技术总监 高丽
企业网d1net:您如何看待云原生产品技术?海尔智家在云原生方面有哪些实践?
高丽:海尔智家从2017年开始关注云原生,彼时cncf刚刚发布了一些云原生的技术趋势。根据cncf给出的定义,云原生既包含技术,也包含管理。例如:技术方面包括微服务以及容器等基础设施技术,管理方面包含devops持续交付以及康威定律等诸多管理方式。
我理解的云原生是一系列云技术和企业管理方法的集合,它充分利用云技术的优势,为企业提供了一套从应用程序设计、实现、部署到交付的总体运营架构和方法。总体而言,云原生能够帮助业务快速迭代,是一种科技的进步。实际上,cncf至今仍未给出云原生的具体定义,它其实是一个不断自我演进的理论体系加最佳实践的组合。
2017年,在了解到以容器云为基础技术的云原生技术之后,海尔智家结合自身的诸多业务场景进行了一系列落地实践。例如:2017年,我们正在探索的业务中台建设,当时海尔正在向互联网、物联网的方向转型,我们既要面向c端消费者,又要面向b端客户,因此从业务中台的角度,我们需要建设凯发在线的产品中心、客户中心等能力中心,不断沉淀海尔智家的业务中台能力。
在这一过程中,云原生技术发挥了很多优势,不论是底层容器云基础设施的稳定性,还是整体技术架构的先进性,都在帮助我们快速地实现业务需求。
企业网d1net:海尔智家采用云原生产品的驱动因素来自哪些方面?
高丽:海尔智家采用云原生技术的驱动力主要来自三个方面:
一是业务需要快速迭代。我们经常说小步快跑,但是怎么落地呢?肯定需要一套管理加技术指导的方法论来落地。而落的基础是什么呢?我们定位到了云原生的一系列产品,其核心是具备持续交付的能力,能够帮助业务快速迭代,这是其一。
二是降低成本,包括基础设施成本和人力成本两个方面。首先,容器云能够将服务器集群的多种资源池化,降低了基础设施成本。我最近做了一个测算,采用容器云之后,海尔智家提升了整体硬件的使用率,基础设施成本大约降低了37%,这对海尔智家来说是一个非常好的降本措施。
其次,降低了人力成本。用过k8s就能体会到,它能够通过先进的技术降低运维成本和人工投入,用k8s之前必须人肉监控,每天安排很多运维人员7×24小时值班,而云原生大大缩减了这类人力成本。
三是架构的标准化。我同时负责海尔智家全球数字化平台的技术架构,当时我们需要快速迭代的业务非常多,我一直在思考怎样结合一套产品实现松耦合的架构治理和落地。这意味着一方面要让业务快速迭代,另一方面架构又是松耦合的,发生任何流程和架构上的变化,都能快速适应。因此,选择云原生这条路持续实践,架构的标准化对我们而言非常重要。
企业网d1net:海尔智家应用云原生产品技术经历了怎样的过程?主要用到了哪些产品?
高丽:海尔智家从2017年开始探索云原生技术,此前一直在保持观望。2015年至2016年,我们发现docker的声量比较大,也有mesos等类似的一些容器技术诞生,但是那时我们不知道哪一种技术会成为主流。经过两年的观望,直到2017年,我们看到以kubernetes为基础的容器云逐渐壮大起来,所以我们沿着k8s的技术路线使用了一系列云原生产品。
从2017年6月开始,我们以k8s为基础进行容器云paas平台的初步试点,在实现容器云落地的同时,也用到了微服务以及企业架构治理方面的一些工具。从2017年6月到年底,经过半年时间的验证,我们认为这一平台基本可行,随后我们在2018年全面拥抱k8s,从基本的部署、监控、配置管理到服务发现,全部采用k8s技术。
多年以来,我们用到了很多云原生的开源产品,例如:镜像仓库用到了harbor;ci/cd开发流水线中使用的tekton,是google刚刚捐献给cncf基金会的开源产品;servicemesh用的是istio的凯发在线的解决方案;serverless用到了knative、camel-k等等,这些都是我们目前正在用的一些开源产品。
企业网d1net:很多企业都在通过云原生技术产品实现降本增效,海尔智家在追求降本增效的过程中采取了哪些措施?还有哪些痛点和诉求?
高丽:运用云原生技术产品实现降本增效,对于我们而言是一个不断发现问题、解决问题的过程。在探索云原生的过程中,随着我们使用云原生技术产品能力的提升,我们顺便把it自身的管理流程也做了诸多优化,包括刚才提到的运维人员的缩减和运维成本的大幅下降,云原生带来的只有好处,没有坏处。
比如,在服务器被资源池化之前,凯发在线的服务器归属于某个产品或某个项目组,现在用容器云进行资源池化之后,我们把资源的申请流程乃至每个产品和项目组对于资源的使用情况,做了很多透明化的处理,实现了管理工作的诸多优化。
实际上,云原生技术产品本身正在持续迭代的过程中,从安全的角度来看,还有待成熟。虽然目前云原生涵盖的技术多种多样,但是云原生平台的安全问题仍然是海尔自己探索的一个重要方向。同时,cncf基金会也会持续探索,收编更多安全项目。
企业网d1net:您最看重云原生技术的哪些价值?海尔智家应用云原生产品技术在降本增效方面带来了哪些效果?
高丽:任何公司在考虑云原生技术的时候,降本增效一定是首要目标,与此同时也会带来很多收益。比如增效,如果不用数据说话,可能很难有一个清晰的认识。我们在云原生技术的基础之上,开发了很多管理工具和平台,包括研发效能平台,如果粗略地计算一下,我们的需求交付周期从以前的20多天缩短到14天,通过这个量化的数值,我们发现确实提效非常惊人。从这个角度来看,云原生在降本增效方面确实做的非常好。
其次,我刚才提到了运维工作的简化以及运维人员的缩减,其实这是云原生本身的可观测性带来的价值。以前it的很多工作是不透明的,打散在服务器、中间件以及数据库等等各个技术领域,而云原生技术在各个层面都是可观测的,这种机制能够帮助我们快速地定位问题,同时对于出现的问题也能够快速恢复,这方面也是我们看到的一个非常重要的价值。
不论是传统企业,还是互联网公司,应用本身的可用性一定是it的底线,当应用出现问题后必须能够快速恢复,这样的可观测性机制,我认为是所有企业必须具备的能力。
企业网d1net:海尔在云原生技术应用方面还有哪些探索?
高丽:我刚才提到的云原生技术,大部分是在应用领域,比如订单系统这类应用系统。现在我们正在把云原生技术复制到大数据和人工智能平台上。其实,云原生技术对于这类平台完全适用,我们正在向大数据和人工智能的方向进行探索。
另一个是安全方面,在数字化转型的背景下,数据资产具有重要价值,云原生的devops平台,如今加入了security变成devsecops,正是在强调必须打下扎实的安全基础。例如,权限控制、服务级的动态隔离、访问控制等等,我们的安全策略要尽可能做到细颗粒度的管理,这是我们正在探索的另一个方向。
企业网d1net:目前海尔用到的云原生产品是哪家厂商的?其产品的优势是什么?
高丽:我们在2017年时选择了一款叫“才云”的成熟软件,现在已经被字节跳动的火山引擎收购了。我们在17年到18年两年的时间里,借用外部公司的成熟产品实现起步,在逐渐建设的过程中,我们发现基于云原生的技术栈,不能完全依靠外部力量,我们必须建立自己的团队去做一部分工作。
所以,在2019年底,我们基于市面上的开源产品,开始开发我们自己的产品模块。目前我们所用的容器云、serverless以及诸多开源工具,基本都是在开源工具的基础之上自研的。
对于产品优势,需要从企业的特性来看,海尔智家一方面基于云原生的技术栈不断深入演进,另一方面,我们既有面向c端消费者的应用,也有很多企业内部应用,这就决定了我们的形态,一定会用到混合云技术,我们把面向消费者的应用尽可能的部署到公有云平台。
我们认为,在混合云的基础之上,自研能够更好的发挥云原生产品的优势。目前,我们在混合云平台之上跑的所有云原生产品都是互通的,相当于我在一个统一的界面里,能够动态地调度公有云和私有云的资源,这是我们的一个优势。我认为,无论是自研,还是选择厂商的产品,都必须支持混合云下的云原生产品。
企业网d1net:从企业数字化发展和转型的角度来看,您觉得未来云原生在帮助企业实现降本增效目标上,还有哪些更大的价值可以发挥?
高丽:我认为除了降本增效之外,云原生还可以发挥更大价值。
首先,云原生改变的不只是技术,关键在于它能够帮助业务快速迭代,与此同时,业务的编码、开发的代码以及项目流程等必然会发生根本性的变化,比较典型的是:我们的业务逻辑会越做越轻,而云原生的技术底座会越来越厚。正因如此,不论是数据处理,还是非人用户的参与,例如基于事件驱动的机器人,这类不需要人去手工干预的自动化用户会越来越多,这些都会越来越智能化、自动化。
其次,从岗位的角度来看,我们刚才提到云原生给运维带来很大转变,其实不仅是运维,各类岗位都会有所触动,每个岗位的变化都是一个全方位的重构。
例如:像我这样的技术负责人,如今我考虑更多的是如何利用devops工具,能够重新看待整体的企业级研发流程;对于开发人员,他只需要专注于写好业务逻辑和业务代码,不需要再去关注中间件、数据库等等,因为云原生平台已经屏蔽了包括中间件、数据库、iaas等在内的各种问题;对于架构师,过去他要去组合一堆堆叠的技术栈,现在只需沿着云原生的技术栈持续演进,不需要在中间掺杂过多的技术复杂性。
最后,我们正在做工业互联网,云原生能够为工业互联网等全新的业务凯发在线的解决方案赋能。目前,海尔智家的云原生技术应用主要是在服务器端的后台应用,其实基于工业互联网也有丰富的场景。例如,云边端的协同,云原生技术产品中包含基于边缘容器、边缘网络、边缘技术的版本——k3s,它是k8s的简化版,完全为边缘而生。
对于海尔智家正在做的工业互联网场景,云原生技术能够帮助业务,与业务一起构建应用,做到快速交付和统一管理。目前,海尔有几大灯塔工厂,未来在工厂里,云原生技术可以在工业互联网的环境中发挥更多价值。总之,云原生值得探索的方向还有很多。
企业网d1net:海尔在低代码或无代码开发方面有哪些探索?
高丽:目前,海尔在低代码开发方面已经小有所成。根据gartner预测,到2024年,65%的应用程序将使用低代码模式构建,低代码将推动几乎三分之二的应用程序开发。
怎样理解低代码呢?第一个是开发可编排,面向开发人员提供开发组件,实现代码与组件的复用。组件市场属于面向开发人员的低代码平台,它是一个开发的通用能力,比如微服务的脚手架,我们的开发人员通过海尔定义的微服务脚手架,能够快速搭建开发环境。以前每个开发人员需要花费7-10天才能搭建的环境,利用这个开发组件,只需要1-2个小时就可以完成。通过复用代码或组件,能够帮助大家实现快速交付。
刚才说的是开发后端,实际上在装配组件平台,我们提供了多种能力,包括前端开发,也可以通过这一平台快速聚合,生成新的交互页面,实现前端开发人员的效率提升。
第二个是服务可编排。所谓的服务可编排,能够快速通过拖拉拽的方式实现业务能力,这是我们目前正在探索的方向。
其实,海尔智家的业务流程非常复杂,在低代码开发方面,目前我们通过逐步解构已经实现了工作流的编排。以前,我们通过夯实云原生的基础底座,不断提升开发人员的效率,如今,在云原生的基础之上,我们正在通过组件的复用,继续提升开发效能。
结语
经过一系列深度访谈,企业网d1net与腾讯云发现,虽然大型传统企业选择云原生技术的契机、面临的挑战以及技术的实现方式略有差异,但是呈现的效果却殊途同归,云原生架构的先进性,在降本增效、快速迭代、架构标准化、资源复用、高效协同、业务松耦合管理、夯实安全能力等方面,发挥了显著作用。
云原生作为科技发展的重要里程碑,这项技术本身及其背后的一整套管理方法论正在持续迭代的过程中,为此腾讯云联合中国信息通信研究院、作业帮编写推出了2 万字的《降本之源-云原生成本管理白皮书》,系统介绍了如何通过云原生来提升it资源利用率,实现企业的降本增效。
白皮书中提出的“云原生成本管理模型”,在腾讯内部、外部客户历经大规模实践,实现了通过云原生技术并充分利用弹性技术,整体平均利用率提升到30%~40%;一些企业在使用云原生混部技术后,最高实现整体平均利用率提升到60%~70%。
下载《降本之源-云原生成本管理白皮书》
http://www.d1net.com/statics/images/ad/202206/20220601_tencent_cloud_wp.pdf
掌握提升企业it资源利用率方法论