2023年短短半年时间,包括chatgpt、生成式ai、大模型等在内的技术热词层出不穷,中国科技领军企业也纷纷推出了自家的大模型,大模型时代的“百团大战”已然蓄势待发。
gartner的分析数据显示,到2026年,超过1亿人将会与机器人做同事一起工作;2023年-2033年,人工智能将催生出很多新岗位;未来10年内全球生产力将会因为ai而每年提高1.5%、7万亿美元的规模。
大模型时代已来
急需构建面向智能应用的ai基础设施
种种迹象均表明,大模型时代已来。而事实上,你的企业为此做好充足的准备了吗?站在cio的视角,扎实的数字化基础、完备的技术能力和多元丰富的数据,是企业深入探索大模型深度应用的基础。
当前,人们对数据是新型生产要素的认知已达成共识,每个企业中都存储了大量数据,如何理清这些数据的关系,盘活这些数据资产,使其发挥应有的价值,是诸多cio困扰和待解的问题。
如何构建面向智能化时代的ai数据基础设施?有没有infrastructure ready for ai的产品?企业网d1net在“数联世界 智见未来”为主题的 fabarta 产品与用户大会上找到了答案。作为领先的 ai 基础设施公司,fabarta 已帮助金融、制造、医疗等多个行业客户解决业务中的实际问题,并成功实施落地。
作为保险行业头部企业,泰康养老通过 fabarta arcfabric 多模态数据编织平台产品以及图和 ai 的能力,已构建从数据到资产、从资产到服务的全链路。泰康养老数据基建部总经理吴坚平表示:泰康养老已实现数据资产管理、数据治理与数据研发的协同以及治研一体的管理落地,未来还将与 fabarta 在数据编织领域进行更深入的探索。
专注于智能企服及供应链数字技术的高新技术企业大树科技,利用fabarta的 arcgraph图智能引擎 和 arcpilot 企业智能分析平台产品,结合海量企业数据和交易数据,构建企业图谱和交易图谱,开展企业图谱业务分析、交易流水分析以及团伙欺诈分析,及时发现关联风险从而有效避免损失。
亨通数科产品总监董晓健表示:利用 fabarta arcneural 多模态智能引擎,亨通数科打造了新一代设备全生命周期管理软件。多模态智能引擎提供图、向量和大模型融合能力,可以为设备管理从工单录入与生成、设备故障与维修推荐、设备维修知识总结、设备技改方向选择等各环节提供支撑;同时可以利用向量代表的模糊性知识到图代表的确定性知识的转换,实现知识迁移和衍生,已经沉淀的知识可以在不同工厂复制,也可以在不同行业衍生。
成立不足2年的fabarta何以备受诸多头部客户的青睐?fabarta能够帮助客户解决哪些痛点和挑战?fabarta是如何打造ai就绪的基础设施的?与其他初创公司相比fabarta的优势何在?
带着上述问题,企业网d1net专访fabarta创始人兼ceo高雪峰先生,详细了解了ai 赋能业务新范式的多种路径。他表示,构建面向智能应用的数据基础设施,是助力企业实现决策智能化的关键所在,fabarta 构筑了以数据为中心的 aigc 落地架构范式,围绕着数据以及数据之间的关系(图和向量融合)所代表的企业数据,可以帮助大模型进行推理增强,减少模型的幻觉,实现数据的安全可控,并为其提供长效记忆能力。同时,也可以为其本地数据的fine-tune 及预训练提供结构化的数据集,此外,作为本地知识库可以不断地进行知识的沉淀,提供可解释的智能,并为 ai agents打造核心的数据引擎。
以图智能领域切入
图数据代表自然界数据的本源形态
fabarta创始人兼ceo 高雪峰
高雪峰拥有近20年大数据与人工智能领域工程与市场经验,曾担任阿里云大数据&ai产品与凯发在线的解决方案总经理、ibm认知计算凯发在线的解决方案研究院院长,负责ibm watson等世界领先的ai技术在中国的落地。曾带领团队打造出多款具备国际影响力的大数据和ai 类相关产品,服务全球上万家企业级客户,助力企业实现数智化转型。
fabarta初创的那一年,正值snowflake上市,缔造了美国科技股新的造富神话,彼时资本也在寻找中国的“snowflake”,这显然是一个备受资本青睐的赛道。
尽管fabarta的初创团队曾效力于阿里、ibm、sap、腾讯、百度、华为、微软等世界知名的科技公司,具备打造中国“snowflake”的基因,但并没有切入这一方向。在高雪峰看来:“创业就要选择未来的市场,思考未来智能化的市场体系。我们认为未来ai智能化的市场是必然会到来的,因此我们在创业时毫不犹豫地选择了图智能这个方向。之后chatgpt的火爆出圈恰恰印证了这一点。”
在知名科技公司丰富的从业经验,让fabarta的成员接触了大量国内外的大型企业客户,了解到了这些客户在数字化转型与智能化升级过程中的迫切需求。在将大数据和ai技术落地到企业客户实际业务场景的过程中,他们积累了深厚的技术底蕴,兼备前瞻性的商业视野。2021年,fabarta正式成立,这是一个由ai领域的核心技术人员组成的专业化团队,专注于图和向量引擎研发。
回顾fabarta的品牌起源,高雪峰表示fabarta是data、fabric和art三个英文单词的融合,旨在能够将不同种类的数据编织在一起,让数据发挥艺术般的美学潜能,给企业的业务带来真正的价值。
回顾人工智能的发展,以图智能和专家系统为代表的符号逻辑推理的确曾风光一时,处于第二次人工智能的波峰,但是构建整个智能体系的成本非常高,很难落地实际应用场景。当前所处的第三次波峰,是以深度学习为代表的概率体系的持续发展,直到现在 aigc 的技术栈爆发。纵观人工智能发展所经历的数个波峰和波谷,每次都离不开概率连接和符号逻辑这两大技术体系。
概率就是连接主义,就是以transformer、深度学习、生成式人工智能大模型为代表的这类技术。而符号逻辑推理,不管是专家系统、知识图谱,还是当前任何一个符号推理系统,图的逻辑推理始终是最完备、最能被大众接受的逻辑推理体系。
高雪峰预测:人工智能要真正达到企业智能的巅峰,一定离不开符号逻辑和概率。而大图和大模型的融合,是走向未来实现真正智能化的核心基础。大模型需要耗费大量的人力、物力和财力,才能做出一些阶段性成果。“而在大图领域,我们可以利用我们的技术和积累快速起步,所以我们当时毫不犹豫地选择以大图工程化的数据基础这个方向起步。”
业界对图智能的认知存在一定偏差,容易直观地理解成图数据库或图计算。高雪峰给出了他的理解:图智能是将挖掘数据与数据之间关联关系类的图技术应用到企业级客户的场景中,而且能够很方便的被客户的应用或客户的集成商、供应商使用的一套技术体系,也就是图智能体系。
图智能的应用场景非常广泛,已在包括交易反欺诈/反洗钱、股权穿透、智能供应链风险分析、企业数据血缘、对话式交互、企业智能问答、合规检查等业务场景中应用。
高雪峰强调:图的数据代表了自然界的数据的本源形态。关系型数据是二维数据,是把自然界中的数据压缩成二维,而描述复杂关系时,比如a认识b,b认识c,c认识d,需要很多二维表互相之间连接才能找到路径,如果用图的数据形式来表达,通过一个算法就可以找到a到d的连通路径,更适合来描述自然界的数据和数据之间的三维立体的复杂关系,因此图智能是一个庞大的市场。
当前业界大模型如火如荼的发展,概率连接的人工智能又占据上风,但由于其幻觉问题、不可解释性等问题,在企业落地中存在诸多挑战,而fabarta图技术是大模型的有益补充和完善。大图和大模型的融合,是走向未来实现真正智能化的核心基础,这也是fabarta创立的初心:构建面向智能应用的ai基础设施,从图切入,面向大模型提供多模态智能引擎。
面向决策智能
大模型技术在企业中落地面临五大难题
目前来看,要想让大模型技术真正为企业级客户所用,真正应用于决策智能领域,提升企业的业务价值,仍有巨大的鸿沟。
大模型等ai技术在企业决策智能领域落地存在以下几大难题:
一是数据的安全可控。如在大模型应用中,企业需要让一部分数据只能被a部门看到,另一部分数据只能被b部门看到,不能让所有数据都由大模型固定成参数,那样根本无法控制数据的访问权限。
二是要可解释可追溯。当决策智能引擎或机器人提示管理者应该做决策a时,要能清晰地解释出思考路径,才有机会被采纳。但是大模型是不可能给出思考路径的,可解释可追溯是生成式人工智能的一大难题。
三是模型幻觉问题。大模型可能会一本正经的胡说八道,而在企业决策智能领域,要尽量减少这种模型幻觉。
四是数据与知识的流通。企业在以往的数字化历程中往往积累了大量的数据和知识,如何将这些资产充分利用起来,与大模型中的泛化知识形成数据的流通,也是被广泛重视的问题。
五是推理能力弱。大模型的推理能力很弱,如何增强其逻辑推理能力,使其真正应用在企业的决策路径中,也是ai技术落地的一个重要难题。
“一体两翼”产品矩阵
打造ai就绪的基础设施 支撑业务场景落地
在分析企业级客户需求的过程中,高雪峰总结,打造ai就绪的基础设施,需要具备三个条件:
1. 为ai准备丰富的不同种类的数据。中国的数据体量巨大,占据全球14%至15%的份额,且以每年20%以上的增速增长,并有望成为世界上拥有最多数据资源的经济体。然而,用于业务决策的数据只是冰山一角,大多数企业的数据仍然处于数据库、数据仓库和数据湖中,未能充分利用。因此,在智能化时代,企业必须能够有效地盘活内部的数据资源,并建立这些数据之间显性与隐性的关联关系,有了庞大的数据资源的导航地图,才能为接下来的智能化建设打下良好的基础。
2. 为大模型技术提供一个真正长效的记忆体。对于“向量数据库就是大模型时代的记忆体”的这种说法,高雪峰并不认同,“向量数据库会漏掉很多向量和向量之间复杂关系的信息。所以我们不止将数据和数据之间显性、确定的关系记录在数据引擎中,通过向量的距离计算,向量与图结构融合在一起的数据存储形式,还可以找到数据之间的丰富的隐含关系,作为大模型技术长效的有机数据记忆体。”同时基于本地知识的精准校验,也能增强大模型所不具备的逻辑推理能力,减少模型幻觉。
3. 搭建简单易用的知识中台,助力客户轻松构建智能化应用。大部分企业在利用企业本地知识和大模型中的泛化知识构建各类创新应用时,不知道该如何利用这些知识。因此需要一个低代码的易用平台,能将不同业务场景下需要的能力抽象到平台中去,让用户可以基于一个平台上不同领域知识的融合,构建智能化应用,高雪峰将这个平台定义为知识中台。
基于对客户需求的深入洞察,fabarta打造的“一体两翼”的产品矩阵,用智能化时代核心的数据基础设施,破解生成式人工智能技术落地企业决策智能等核心场景中的最后一公里难题。fabarta 打造的‘一体两翼’产品矩阵,一体指以arcneural多模态智能引擎为基础,左翼为数据arcfabric,右翼为ai平台arcpilot,为企业提供全链路支持,助力企业实现决策智能化。
fabarta自研的多模态智能引擎arcneural,用图和向量融合的方式,总结和梳理企业内部沉淀下来的知识和数据,作为企业确定的知识和记忆,存储在引擎中。arcneural基于数据、算力和模型,为上层ai应用提供原生记忆和推理,加速业务智能化创新的进程。
传统数据库、数仓或大数据平台等智能引擎都是“存储&计算”架构,而arcneural将这一架构演进为ai原生的“记忆&推理”架构,在记忆层,用图和向量融合的数据结构作为智能引擎核心的记忆体,能够表述自然界中大部分数据实际的组织形式。同时提供统一的多模态数据访问层,用于私有记忆的存取接口,直接展示给终端用户。arcneural是云原生、分布式、存算分离的架构,支持灵活的弹性伸缩和扩展,既可以作为图数据库或图计算引擎使用,也可以作为向量数据库使用,但其最核心的优势是将这些能力融合、互补。
fabarta arcfabric多模态数据编织平台,是面向ai的数据管理平台。利用fabarta的多模态智能引擎以及自身的ai核心能力,arcfabric能够帮助企业智能化地盘点和梳理自身的数据资产,像导航地图一样可以让用户便捷地找到相关的数据资产及其依赖关系,为ai的应用落地提供智能数据基础,提供ai落地就绪的数据。
在数据资产入表背景下,arcfabric可助力企业实现智能数据资产盘点和数据资产治理,如元数据的智能补齐、智能贯标、探查并建立全域数据血缘等。
图技术的应用存在一定门槛,很难被客户直接使用起来。为此fabarta搭建了arcpilot企业智能分析平台,连通多模态引擎中的确定知识以及大模型中的泛化知识,并以低代码、低门槛的方式,让终端用户和客户能快速上手,真正将图的技术使用起来,轻松地基于这两类知识构建智能化应用。
arcpilot可精准管理企业本地沉淀的知识,同时将大模型的算法能力与算力和本地知识深度融合,为企业提供构建智能化应用时所需的ai ready的能力,知识中台的能力,能将不同的大模型管理起来,利用多模态智能引擎做数据增强,并抽象底层的算力资源为大模型的fine-tune或推理提供服务。利用图数据天然的可解释性,arcpilot可提供可解释的图智能,结合决策引擎、数据探查等能力帮助业务用户知其然并知其所以然。
fabarta基于以数据为中心的人工智能技术,通过一体两翼的产品矩阵,帮助企业将创新的aigc能力以更普惠的方式在业务场景中落地。
以制造业为例,由于数据体量庞大,大数据在解决供应链中复杂关系的分析问题时显得越来越吃力,而图智能技术为供应链领域的决策智能提供了强大的能力支撑,现已在某知名车企的供应链决策中落地,通过多模态智能引擎帮助其进行供应链风险分析,例如对于流出生产线的瑕疵品零部件,预测其在供应链体系中的流通路径,以便在整车交付给用户之前及时进行围堵。
制造业的产线非常复杂,且对工人技能水平的依赖度高。基于制造企业内部积累的各类信息,利用多模态的智能引擎,结合大模型的能力,可以打造出对产线上各环节工艺、技能都了如指掌且具备逻辑推理能力的“老师傅”,帮助一线员工解决各类核心问题。
此外,金融业的信贷风控、反欺诈反洗钱等场景都高度依赖图智能服务。高雪峰透露,fabarta已在制造、汽车、金融、医疗、政府、能源等行业落地了一系列实际应用场景,并准备大面积复制推广。
高雪峰表示:图智能只是一个起点,却不是终点。fabarta以图智能起步,已经将文档、向量等数据类型融合在基础设施里,期望在可解释智能、可追溯智能领域为更多客户提供完整的产品和凯发在线的解决方案,助力企业以智能化的方式进行业务创新,打造智能化时代真正的ai基础设施。
深度战略合作
目标打造智能化时代真正的ai基础设施
对于做b端客户的企业而言,生态建设无疑至关重要。fabarta自成立伊始就在建立良性的合作生态,并深度绑定了一批凯发在线的合作伙伴。
fabarta的生态伙伴主要有三种类型:
第一类是深度绑定的客户和凯发在线的合作伙伴。包括加入龙盈智达(专属服务华夏银行的科技公司)的“雁群行动”生态体系,通过fabarta特有的产品和技术帮助华夏银行将智能化技术在实际业务场景中落地;加入神州信息六合上甲数据资产研究实验室,进行深度合作;此外,正在与某知名车企共同申请ai联合实验室,为汽车制造领域的客户提供场景化的数据和智能化落地的经验。
第二类是第三方机构。如与金融科技产业联盟、中国信通院等第三方机构进行深度合作,共同起草行业标准、技术标准等,助推行业发展。
第三类是产品与销售的生态。当fabarta的产品与客户的产品完美融合,充分发挥了产品的价值,客户会自愿将fabarta引入他们的客户群中。
在本次大会上 fabarta 还与亨通数科、苏州中农数智科技有限公司、北京市石景山区现代创新产业发展基金有限公司等重要凯发在线的合作伙伴共同发布多项战略合作,共同打造生态合作体系。
小结
cio们通常都非常关注新技术,并期望将最合适的技术在企业的实际应用场景中落地。但是在数字化转型的过程中,企业沉淀下来的大量数据尚未能充分用于指导业务,发挥数据真正的价值。最后,高雪峰强调:“大模型等创新的人工智能技术不断涌现,cio不能将注意力局限在算法和应用层面,更应该关注数据基础设施的搭建和打磨,因为这必将给企业带来不可估量的价值。”
关于企业网d1net(www.d1net.com):
国内主流的to b it门户,同时在运营国内最大的甲方cio专家库和智力输出及社交平台-信众智(www.cioall.com)。同时运营19个it行业公众号(微信搜索d1net即可关注)。