在传统与现代架构共存发展的混合it环境下,it集成与it运维都面临着非常艰巨的挑战。在此背景下,“企业承压 it怎么干”系列线上研讨会以“集成与运维自动化”为主题,邀请来自上汽通用五菱汽车、ibm以及腾讯云的专家们,畅谈如何进行容器平台可观测性能力建设,如何助力企业破解混合it环境下的运维挑战,如何敏捷集成混合云环境下的业务系统,以及如何借助云原生devops提升应用管理效率。
上汽通用五菱的容器化落地与实践
上汽通用五菱汽车股份有限公司运营云服务经理 梁岸川
上汽通用五菱汽车股份有限公司作为一家“多点制造、商乘并举、跨洋出海”的学习创新型现代化企业,依托大数据、云计算等技术,全面推动汽车制造业向网络化、数字化、智能化的方向发展,打造了一系列智慧汽车制造产业的数字化转型升级示范应用。上汽通用五菱汽车股份有限公司运营云服务经理梁岸川为线上观众分享了“上汽通用五菱的容器化落地与实践”。
梁岸川提到:近几年云原生技术和容器技术逐渐成熟,容器可以理解为云时代的应用集装箱,它重塑了整个软件供应链,改变了软件交付的方式,现在几乎在所有运维或架构都在用容器进行交付。相比虚拟化技术,容器技术共享操作系统内核、轻量级、资源利用率高、秒级启动、易于移植,有着绝对优势。
2018年容器技术得到快速发展,上汽通用五菱也于同年开始在一些非关键系统中应用docker,并部署了第一个 kubernetes集群;2019年,docker被正式用于生产应用中;2020年开始docker成为公司新应用部署的标准;2021年,上汽通用五菱正式上线第一个k8s生产集群;2022年,经过快速发展已有10个k8s生产集群,支撑公司财务、物流、制造等生产业务系统。
上汽通用五菱遵循开源优先原则,通过内部应用开发平台提供标准的开发框架和敏捷开发流程,通过容器平台提供应用运行环境,并围绕容器平台建立cicd和多维监控体系,同时基于k8s、多集群管理、服务网格等云原生技术提高技术先进性,持续进行技术架构演进。以cicd为例,上汽通用五菱使用了诸多开源产品,如内部搭建了gitlab代码仓库,使用jenkins构建项目,镜像仓库使用harbor……
2022年,上汽通用五菱的k8s集群规模实现快速增长,cicd技术也得到了广泛使用,流水线任务数量大幅提升,在提升效率的同时,节约了时间成本,实现了项目的敏捷开发以及发布和配置的标准化。
为了便于运维和管理大规模分布式系统中的基础设施,上汽通用五菱进行了容器可观测性能力的建设工作,以了解分布式系统的状态,便于作出决策,并为弹性伸缩自动化运维打好基础。梁岸川先后介绍了上汽通用五菱在性能指标监控、日志监控和调用链监控三个维度用到的主要工具及策略。
最后梁岸川表示未来上汽通用五菱将围绕三个方向展开:一是完善k8s生态,持续构建容器平台支撑能力,推动容器技术普及,完善应用商店,增加置备数据库、中间件等paas服务的能力;二是持续提升容器平台的可观测性,将监控、警报和日志与度量可视化及其分析结合,探索aiops;三是加强容器平台的安全防护,加强漏洞管理、合规性和运行时保护。
ai赋能的智能运维
ibm车库创新团队云工程师 林凯迪
在过去的一年里,ibm大中华区车库创新团队服务了超过21个行业的140多家客户,涉及200多个项目,加速各行各业享受数字化红利。ibm车库创新团队云工程师林凯迪以“ai赋能的智能运维”为主题,分享了ibm在智能运维领域的凯发在线的解决方案以及最新的部分行业案例。
林凯迪提到:“伴随企业的数字化转型,未来很长一段时间内我们都将处于多架构多平台共存的过渡时期,与此同时运维部门面临着前所未有的挑战,其中业务系统稳定性变差和客户满意度变低是最主要的两个问题。”有研究表明:关键业务的一秒延迟可能会导致客户转换率下降7%,满意度下降16%。除性能问题外,不断攀升的it成本成为亟待解决的问题,1/3以上的成本浪费已经成为业界的普遍现象,而这严重违背了降本增效的转型方向。
为帮助客户应对新环境下的运维难题,ibm推出了一整套ai驱动的智能运维凯发在线的解决方案,主要包括三款核心产品:一是新一代应用性能管理平台instana,可全面提高应用可观测性;二是应用资源管理平台turbonomic,可持续分析应用资源需求,动态调整优化;三是智能it运营平台ibm cloud pak for watson aiops,作为分析和决策中心,它可以帮助it解决问题,发现隐患,实现主动运维。上述三款产品被称为ibm智能运维的三架马车,好比人的观测之眼、执行之手和决策之脑,分别发挥着重要作用。
ibm instana具备自动化、上下文关联、更智慧的行动三大特点。最近由apm experts发表的应用可观测性凯发在线的解决方案排名中,instana凭借其在请求追踪、关联性分析、根因定位等能力上的领先优势,排名第一。而gartner也将instana评选为2022年度应用性能监控和可观测性魔力象限的领导者。
相较于其他的以定期盘点为主的资源优化手段,turbonomic是完全动态的资源调度,会根据当前不同层级的资源使用情况,结合历史数据进行分析优化,在确保应用程序遵守业务策略的同时,获得运行所需要的全部资源,帮助企业在正确的时间执行正确的应用资源决策,持续确保应用程序性能的合规性,将成本降到最低。同时,它可以直接对接混合云环境下的不同技术平台,获取应用资源数据,建立彼此之间的拓扑关系,还可以给出所有资源的优化建议,进一步提高资源管理效率。
ibm watson aiops这一端到端的智能it运营平台,可以对接和分析it环境中的日志、指标、链路、事件等数据,进行动态建模,并持续训练,发现数据背后的潜在隐患,通过内置的自动化平台,实现各类问题的自动响应处置,落实最佳行动方案。
会上,林凯迪列举了ibm智能运维三架马车的三大典型案例,并对instana和turbonomic两大平台进行了在线演示。
混合云环境下的业务系统现代化集成
ibm科技事业部自动化专家 张诚
ibm科技事业部自动化专家张诚分享了“以敏捷的方式迎接混合云环境下的业务系统现代化集成”。现代化集成涵盖了三部分内容:首先是传统应用的数据集成,帮助企业在不同系统之间方便的同步数据;其次是基于事件的集成,以异步的方式实现应用系统的交互;最后是基于api的集成,帮助企业将不同应用系统、不同组件便捷地衔接起来,并提供安全可信的访问控制。
为了让企业业务上云不流于形式,ibm推出了安全敏捷的现代化集成平台——cloud pak for integration,它具备api生命周期管理、应用和数据集成、企业消息传递、事件流式响应、高速数据传输以及安全网关六大集成功能。
作为一款ipaas平台,cloud pak for integration的集成能力主要包括三部分内容:一是以rest、graphql、web services的方式,帮助企业客户快速搭建api管理平台,实现业务能力输出,快速打通上下游构建以api为主的业务生态系统;二是快速构建以事件驱动的异步集成,无论客户采用传统消息中间件、kafka、消息队列,还是多对多的主题,都能帮助客户实现面向异步的以及面向消息的集成处理功能;三是面向传统的应用集成需求,提供轻量的集成引擎,帮助企业实现传统应用,快速生成并发布api,从而让企业适应以api为主的集成场景。
张诚认为:真正的api战略的成功,既包含api 外部体验,也包含api内部实践。api外部体验包括api 发现、文档、案例,api 交互式测试,自助服务和注册,app key/secret配置,api 使用分析和使用报警等。api 内部实践指企业内部的it系统建设与规范,包括api 网关部署、oauth安全管理、访问限速和节流、运行时策略强制、数据转换/编辑、后台服务发现、版本管理、基于角色的访问控制、分析支持、环境管理、多租户基础架构、监控和通知等。
据介绍,一汽大众与ibm合作,采用ibm车库创新方法并实施ibm应用集成平台来发掘后台的业务能力,通过对服务生态系统进行整合,为用户提供无缝便捷的驾驶员体验。
一汽大众组建并培训了一支数字化创新团队,包括150多名成员,旨在推动以客户为中心的转型。凭借增强的客户体验,目前已有300余万新客户注册了大众和捷达品牌的移动应用。
中国充电运营商众多,有些使用交流电,有些使用直流电,充电速度和充电功率也各不相同。一汽大众利用ibm的api管理平台,加速整合充电运营商的准入流程以及新用户引导流程。更重要的是:简化的流程使驾驶员获得了良好的体验,在一个应用程序中用户可以看到所有可用的充电选项,并就近筛选符合他们车辆要求的充电桩。据统计,利用ibm提供的api管理功能,一汽大众将添加生态系统凯发在线的合作伙伴的时间从几个月减少到几周,将开发凯发在线的解决方案的时间减少了将近50%左右,提效非常惊人。
云原生devops应用管理高效实践
腾讯云 coding 高级产品经理 马龙
最后,腾讯云coding高级产品经理马龙分享了“云原生devops应用管理高效实践”。马龙一直从事持续部署产品的研发工作,随后主攻云原生可观测性方向,对研发效能及云原生领域有着较深理解。他提到:从2017年到2022年的5年间,cncf项目数量倍增,由于云原生化意味着向微服务架构演进,致使复杂性左移渗透至研发团队,大大增加了开发者的心智负担。如果缺乏完善的工具支撑,可能导致研发产能出现断崖式下降,很难保证应用发布的效率和可靠性。
由于研发门槛高,应用交付故障率高,研发排障时间成本高,导致云原生技术红利无法被充分释放,很多企业的研发效率并未得到显著提升。为了更好地服务企业应用云原生化,赋能开发者职能转型,腾讯云coding推出了orbit云原生应用全生命周期管理平台,从应用建模、应用交付到应用运维,帮助研发安全、高效、可靠的将多个微服务组成的应用无缝发布到云原生环境,加速软件的价值交付循环。
k8s对于研发侧的复杂性,主要来自于超大规模的yaml文件管理以及yaml文件本身的复杂度。为了应对这些挑战,orbit提供了视角分离的凯发在线的解决方案:企业的云原生专家可通过服务模板封装k8s的规范,通过运维插件封装k8s的生态扩展能力,规定生产环境必须开启资源限制、探针监控等运维插件,落地云原生规范;研发人员则基于服务模板和运维插件,以可视化表单的方式填写少量业务参数,即可完成服务创建以及云原生应用的改造,大幅降低云原生复杂性左移对研发的影响。
在交付环节,orbit可自动监测制品库和代码仓库,自动捡配应用未发布的制品、配置、sql变更,随后原子化、版本化发布到多个环境,保障了一致性和可靠性。同时orbit还支持可视化部署流程编排,可灵活编排多环境、多地域、串并联发布。此外,基于腾讯云大规模容器发布经验,orbit抽象了产品化的分批部署、灰度、蓝绿、金丝雀等发布策略,企业只需简单配置研发即可实现高级发布策略,提升发布可靠性,降低发布引发的生产故障。
在运维环节,orbit推出以应用为中心,混合云统一观测平面的能力,覆盖了监控告警、链路追踪、日志等日常排障场景,并通过traceid打破了不同环境之间的工具差异,让运维更轻松便捷。同时 orbit自研adapter服务统一了各类可观测工具数据标准,实现了可观测工具的可插拔性以及可扩展性,用户不仅可以自由选择orbit官方支持的可观测工具,也可以进行自定义扩展。
近年来,新冠疫情、国际环境等不确定性带来的风险持续发酵,企业不断承压,数字化成为应对不确定性的有效举措。“企业承压 it怎么干”系列线上研讨会致力于为业界创造一个沟通与交流的平台,以数字化能力助力企业应对持续变化的不确定风险。
会上,线上参与者与各位分享嘉宾积极展开交流探讨,诸位专家针对线上网友提出的问题给出了详细解答。至此,由企业网d1net、ibm、腾讯云coding和亿联网络联合主办的“企业承压 it怎么干”之“集成与运维自动化”专场线上研讨会圆满结束。
欢迎观看“企业承压 it怎么干”之“集成与运维自动化”专场线上研讨会回放视频:
关于企业网d1net(www.d1net.com):
国内主流的to b it门户,同时在运营国内最大的甲方cio专家库和智力输出及社交平台-信众智(www.cioall.com)。同时运营18个it行业公众号(微信搜索d1net即可关注)。