2023年10月24日,亚马逊云科技生成式ai构建者大会在京召开,金山办公ai研发总监刘强作为特邀嘉宾,代表金山办公在大会上分享了他们之间的紧密合作,以及如何利用amazon bedrock加速金山办公的生成式ai应用构建。
“在合作过程中,亚马逊云科技为我们提供了全方位的支持,其客户服务团队调用了包括ai创新实验室、数据创新实验室、全球产品团队,以及后端产品开发团队,一起来帮助我们达成业务目标。”刘强提到。
金山办公ai研发总监 刘强
wps ai助力客户构建一站式智能办公平台
作为一家深耕办公软件研发35年的软件公司,金山办公旗下的wps是全球知名的办公软件产品之一,截止2023年9月,拥有5.89亿月活跃设备数。wps移动版支持 46 种语言,pc 版支持 13 种语言版本,用户覆盖全球220多个国家和地区。截至 2022 年底,金山办公在海外已拥有超过 1 亿活跃用户,wps office 通过 google play 和 apple app store 累计获得近 4 亿次安装。
据悉,金山办公在今年年初大胆提出“all in ai”战略,决心将llm能力全面融入其产品线。为此,金山办公于今年4月推出了基于大语言模型的智能办公助手wps ai,率先将新一代ai技术落地到办公领域,wps ai现已接入金山办公全线产品。
wps ai旨在为广大用户提供aigc(内容创作)、copilot(智慧助理)和insight(知识洞察)三大核心功能,从而带来全新的办公体验。其中,aigc(内容创作)专注于内容生成、创作及排版美化,覆盖文字、智能文档和演示等模块。copilot(智慧助理)通过ai能力提高用户使用效率,降低用户操作门槛。insight(知识洞察)如在pdf和随手拍等模块,助用户快速进行内容识别和文意理解。
刘强介绍道:办公软件分为文字、表格和ppt三个组件,各有其特点。文字组件重视排版,表格组件侧重数据处理,而ppt组件则强调展示。目前,ai主要增强已有功能,如智能排版在文字组件中,可以自动识别长文章如论文或合同,抽取关键要素并实现一键式排版。ppt组件可以根据主题自动生成美观的ppt,再由用户进行微调。在表格领域,ai可以生成自研公式,简化数据理解和学习,甚至进行智能数据趋势分析。
金山办公的战略目标是,通过这三大能力将ai技术开放赋能给企业客户,助力他们构建一站式的智能办公平台,使用户能够更为简便、高效地使用办公软件,从而极大地提高他们的办公效率。
刘强认为:目前,ai尚处于多模态的发展阶段。短期内,其主要价值在于增强现有的功能,使其更为高效。长远来看,为了使ai真正融入办公软件,还需在多模态等领域取得更大的进步。然而,在当前阶段,大模型与传统技术的结合已展现出巨大的潜力。
借助大模型能力丰富wps的产品功能
在推进“all in ai”战略时,金山办公特别考虑到了国内外市场的差异性。因此,无论是国内版还是海外版的wps,金山办公都进行了针对性的研发和优化,以确保产品能够更好地满足不同地区用户的需求。
刘强表示:“作为amazon bedrock的第一批预览版的用户,我们从一开始就跟亚马逊云科技的技术团队进行了积极对接。正如没有一个大模型能解决所有问题,在对接过程中我们也是提出了很多问题,amazon bedrock轻松地帮我们解决了这些问题,很大程度上提升了我们的研发效率。“
金山办公与亚马逊云科技长期合作,共同探索如何将ai/ml技术最大化地应用于业务中。在初期,借助亚马逊云科技的机器学习平台amazon sagemaker,金山办公的算法科学家得以快速进行场景实验和算法迭代,从而更精确地识别用户、提高转化率、减少用户流失,实现对用户的精细化运营。
据亚马逊云科技专家介绍,amazon sagemaker为客户提供了一个端到端的机器学习平台,这使得算法科学家无需从零开始搭建模型。其内置的amazon sagemake jumpstart功能可以助力客户迅速构建并部署模型,实现“一键部署”。值得注意的是,amazon sagemaker jumpstart已经支持了当前市场上广受欢迎的多种开源和闭源基础模型,如llama2、falcon、sdxl模型等,为用户提供了快速尝试和部署这些开源模型的便利。
如今,双方的合作延伸至生成式ai领域,金山办公正在对各种办公应用场景进行全面测试,并将amazon bedrock服务集成到其海外产品中。对金山办公而言,不仅能利用amazon bedrock提供的大模型能力丰富wps的产品功能,还可与亚马逊云科技的技术专家团队进行深入探索与合作,从而确保在全球范围内为用户提供便捷、高效、卓越的办公体验。
amazon bedrock支持来自ai21 labs、anthropic、cohere、meta、stability ai 和amazon等领先人工智能公司的高性能基础模型,并可以轻松安全地进行自定义模型训练。因此,金山办公可以在轻松使用基础模型的同时,使用自己的数据构建差异化的应用程序。
刘强分享道:对接amazon bedrock最显著的优势在于节省工程时间和提升工作效率。amazon bedrock的集成能力解决了之前需要手动统一不同大模型间的api和调用方式的问题。现在,利用amazon bedrock的模型管理功能,底层api变得透明,为金山办公提供了无感知的统一的调用方式。
几乎很少有单一模型能涵盖全部能力,通常一个功能需要多个模型的协作。amazon bedrock为用户提供了模型管理功能,大大减轻了用户的工作量。例如,amazon bedrock提供的claude基础模型在金山办公的insight战略中被用于阅读理解。对于长文本,由于早期的大模型对一次接受的输入有限制,wps通常需要先将其分片处理,然后对各个分片进行总结。但现在,amazon bedrock支持的限制已经扩展到100k,这不仅提高了处理性能,还增强了准确性。
据亚马逊云科技专家透露:amazon bedrock的设计初衷是简化用户在使用多个基础模型时的操作,因此采用了统一的api形式。客户只需简单调整api参数,即可利用amazon bedrock访问亚马逊云科技及第三方模型供应商的大模型。目前,亚马逊云科技正在与金山办公合作,利用amazon bedrock探索文本润色等文本相关场景,旨在提高wps用户的文本写作质量。为确保合作的顺利进行,亚马逊云科技为金山办公提供了全方位的支持,包括提示词工程的建议以及确保金山办公在各个测试阶段都能获得所需的基础设施资源。
此外,亚马逊云科技还提供了丰富的gpu选型,并专为生成式ai推出了特定的加速芯片,如amazon inferentia和amazon trainium。金山办公正与亚马逊合作,尝试使用亚马逊提供的gpu机型为其海外业务部署开源模型方案,并探索利用这些专门的加速芯片来进一步降低成本。
amazon bedrock提供安全性与合规性双重保障
刘强强调:金山办公始终将数据安全视为首要任务。金山办公拥有专业安全团队,与凯发在线的合作伙伴共同构建了完善的数据安全体系,确保在全球各地有效保护用户隐私。在与亚马逊云科技的合作中,amazon bedrock为数据安全提供了专门的模块。
亚马逊云科技专家进一步介绍道:从服务设计层面,amazon bedrock确保客户数据不会被用于自有的amazon titan或任何第三方模型的训练。所有客户数据都经过严格加密,且加密密钥完全由客户掌控,确保数据的访问仅限于客户本身,且确保客户数据不会离开其指定区域。为了进一步加强数据安全,企业级客户还可以利用amazon privatelink,在amazon bedrock与其虚拟私有网络(vpc)间建立安全的专用连接,确保数据传输过程中绝不暴露于公共网络。
amazon bedrock遵循pci-dss、hipaa和gdpr等安全合规标准,可有效提升安全合规工作的流程。特别是对于有高度监管需求的客户,它满足hipaa(《健康保险流通与责任法案》)要求,并在gdpr(欧盟《通用数据保护条例》)合规框架下提供服务,使更多客户能够安心地将生成式ai用于自身的业务创新。
随着生成式ai的快速发展,亚马逊云科技也认识到了以负责任的方式开发ai的重要性,为此在这方面投入了大量资源,与多家机构和凯发在线的合作伙伴合作,深入探索如何确保ai的负责任开发。
最后,刘强表示:金山办公在ai领域秉持开放合作的态度,与各大模型厂商合作,旨在构建一个生态平台。“我们不专注于自研通用大模型,而是与业内领先的服务商合作,共同为用户提供卓越的办公软件服务。我们的自研方向更偏向于针对办公领域的中小模型,来满足更多用户小众场景的需求。”刘强如是说。