金蝶王禹程:数据即智能,构建AI时代的新基础设施
在日前举行的2026金蝶AI峰会——AI技术论坛上,金蝶中国AI Suite产品部联席总经理王禹程在《数据即智能:构建AI时代的新基础设施》主题演讲中,为大家分享了企业在AI时代面临的数据基础设施挑战,以及如何通过数据飞轮2.0、语义层、本体工程等技术构建面向智能体的新数据底座。
2026-06-01
123

在日前举行的2026金蝶AI峰会——AI技术论坛上,金蝶中国AI Suite产品部联席总经理王禹程在《数据即智能:构建AI时代的新基础设施》主题演讲中,为大家分享了企业在AI时代面临的数据基础设施挑战,以及如何通过数据飞轮2.0、语义层、本体工程等技术构建面向智能体的新数据底座。

金蝶中国AI Suite产品部联席总经理王禹程
AI时代企业数据基础设施的挑战
各位朋友、各位嘉宾,下午好!今天主要围绕数据技术,分享我们在灵基的一些技术成果与方法。
现在很多企业面临AI落地困境,数据基建、数据集成仍停留在比较基础的阶段。我们发现,AI应用成功的企业,在数据质量与治理上的技术投入非常高。具体来看,挑战集中在几个方面
第一,缺乏上下文与语义:无通用语义层,多智能体系统无法有效协作,AI仅知数据不知意义。
第二,数据安全与合规风险:无法摸清数据从源头到AI输出的来龙去脉,暴露管理违规与隐私泄露漏洞。
第三,数据质量与治理缺陷:数据缺陷被AI迅速放大,传统静态治理无法满足AI实时需求。
第四,AI工程化复用效率较低:各AI用例的数据资产与管道无法跨场景复用。
第五,数据碎片化孤岛:数据分散在数十个独立系统中,AI只能访问不完整子集;存在大量的非结构化数据未能充分利用。
面对上述挑战,破局的关键在于战略性加大对底层数据基础的投入,打造统一、受治理且具备业务语义的新基础设施,用确定性的数据基建去支撑并放大AI的能力上限。
AI时代的数据飞轮
在明确了挑战之后,如何让数据更好地赋能AI,同时让AI帮助数据实现更深厚的积累?这要求我们的数据飞轮从1.0时代正式迈向2.0时代。2.0时代的核心是:数据要从结构化、非结构化变成语义化和知识化的数据,最后变成服务,让AI可感知,甚至让AI可以去记住它、沉淀为知识。
系统通过“规划-预测-执行”等一系列动作,最后产生的成果成为记忆,以及对数据本身的反馈、对Harness的反馈,再回到数据工程里形成真正的数据飞轮。让AI沉淀新的数据,同时这些新数据与治理后的旧数据一起,进一步让AI更加聪明。
AI时代的数据类新基础设施
下面介绍我们如何构建新基础设施。
底层连接连接不同的ERP系统,包括外部系统、半结构化数据、结构化数据、流式数据和第三方的API。中间层做好数据存储,包括湖仓一体、对象存储、向量存储和图数据库。基于这些存储和开发,形成动态的语义层——这是让AI理解业务、并不断进化的关键。同时提供数据服务赋能上层的智能体,当智能体产生行动后,产生的新数据又会回到数据源,完成新数据飞轮的循环。
在底层技术实现上,我们采用了Zero-Copy技术,不需要把所有数据都拉到数据湖仓,而是通过动态按需的方式构建有联邦数据的湖仓,实现近实时的缓存加速、联邦查询和数据处理。非结构化数据湖仓提供多模混合检索引擎;向量化存储主要应用于大模型;图存储则应用于本体构建。
在存储层引入了Iceberg、Parquet等技术,将大批量非结构化数据转化为大模型能够理解的结构化数据。在接入效率上,我们已适配30种异构数据源,可达到每分钟一千万行的批同步处理,以及每秒一千条的向量化速度,能够支撑千亿级别的实体图谱规模。
为了让AI准确理解业务,我们主要通过三个方面来构建动态语义层:一是元数据治理,我们本身就是元数据驱动的产品;二是语义治理,包括实际解析、业务规则、访问控制和语义校准;三是标准构建,通过数据目录、OSI语义模型、MCP协议等,根据业务复杂度与治理目标构建不同标准。
我们将结构化数据、非结构化数据以及人脑中的交互数据全面汇总,形成AI原生操作系统里的记忆、知识和产物。我们为此构建了5层认知记忆系统:出厂记忆、企业记忆、岗位记忆、个人记忆以及会话记忆。通过Nebula图存储和Redis等技术,系统能够深刻理解企业规则和用户偏好,让智能体越用越聪明。
AI时代下本体工程
在AI时代,开发模式正在发生演进。过去我们认为做好传统的ETL数据工程就足够了,但现在,我们需要慢慢转化为真正的AI辅助开发,以低代码和敏捷开发的方式做好基础数据治理,并在此之上构建金蝶AI本体工程。
真正的企业级本体工程需要实现自创建、自实现、自验证和自进化。这是一个巨量的工程,我们通过本体智能体进行意图路由与分发,并与多个子智能体(SubAgent)并行协作。具体而言:业务设计SubAgent进行业务规划,技术设计SubAgent进行签名级规划,设计评审SubAgent对业务和技术进行双阶段评审;随后,IO实现、SQL查询、nGQL(图查询)以及Python SubAgent会去验证并计算业务规则,最后通过单元测试来保证本体切实符合企业级业务规范。
在底层支持上,本体自动化的构建支持图查询、K跳查询、最短路径和全文检索等技术。每一个点代表实体,每条线代表规则和行动,这种形象化的图构建能帮助智能体更好地进行预测分析、洞察和归因分析。同时,我们会将本体能力与技能进行资产化封装,让智能体通过Skill获取本体知识,这背后依托的是金蝶三十多年的财务与供应链业务积淀。
此外,给AI的数据必须是安全的、合规的。我们在数据云中将保密体系分为四类,建立标签驱动的安全体系,帮助AI更好地理解安全规则。从智能体发出请求到结果返回,我们在认证、鉴权、限流、脱敏、加密和审计等每一个环节都做了严格管控,通过AI体系去监测数据使用的正确性。
大家今天看到的灵基是一个非常聪明的、智慧的智能体,它其实只是冰山上的一个小凸出物,在冰山之下,是我们正在建设的大量数据基础设施。只有扎实做好这些底层的数据工作,构建起AI时代的新数据类基础设施,才能真正让AI有效地赋能企业,支撑大家在各个业务领域构建专属的智能体。
谢谢大家。

告别传统ERP,迎接企业管理AI
构建实时感知、精准决策、高效运营的企业智能体





