蚂蚁数科CTO王维:可信智能体是产业AI规模化落地"必选项"
随着Deepseek等开源大模型带来的技术普惠,企业级智能体迎来爆发元年。各行各业正在加速拥抱智能体,将技术与场景深度融合,加速释放AI生产力。
由于企业场景的复杂性和低容错特点,打造企业级智能体应用,仍然面临多方面的挑战。如何破解企业级智能体落地难题,加速推动产业AI规模化落地?
今天,在中关村科技论坛上,蚂蚁数科CTO王维在演讲时表示,“通过可信技术搭建可靠、可控、可优化的智能体应用,将会成为产业规模化应用AI必需的基础设施。”
在可信智能体技术支撑下,蚂蚁数科已经推出一套贯通算力-数据-模型-应用全链条的一站式企业级智能体开发平台,支持企业0代码、低代码、高代码灵活开发,按需部署并实现开箱即用,并且平台已经在严谨行业复杂场景进行了验证。
以下是王维演讲全文:
大家上午好!
今天,我想和大家聊聊一个正在深刻改变行业格局的话题——企业级智能体,如何引领产业向新。
首先,让我们先看两组数据:
15%:据Gartner预测,到2028年至少15%的日常工作决策将由Agentic AI自主完成,而2024年这个比例还是0;
471亿:即AI智能体市场规模将从今年的51亿美元,增长至2030年471亿美元,年均增速高达44.8%。
这两组数据体现出的不仅是字面上的变化,更是AI角色的根本性转变。
过去,AI更多是“助手”(Copilot),帮助人类完成特定的重复性任务;而现在,AI正在向“决策者”(Autopilot)演进,可以基于业务目标,通过逻辑推理和规划、记忆和反思,不断优化表现,帮助企业和组织实现从“流程优化”到“决策重构”。
是什么让智能体如此快速地崛起呢?
答案之一就是大模型的持续进化,尤其是以Deepseek为代表的开源推理大模型,正在大幅提升智能体的能力边界。它让智能体具备更强的自然交互能力,可以更精准地感知环境,并通过持续的学习和优化实现自我改进。
这意味着,智能体不再只是简单的自动化工具,而是能够真正理解任务需求、做出复杂决策,甚至主动调整策略的智能系统。这种能力的提升,直接推动了智能体在各个行业的快速落地和广泛应用。
当然,要让智能体真正落地到垂直领域的实际业务中,我们还需要直面诸多挑战。总结下来主要有四点:
-
快速接入集成:如何让智能体无缝融入企业现有的系统中
-
高效场景搭建:如何高效验证并部署在特定业务场景下落地
-
复杂任务协同:如何协调多个智能体完成跨部门、跨领域复杂任务
-
场景知识构建:如何积累和利用行业专业知识来增强智能体的表现
为了解决这些问题,蚂蚁数科正在攻克四个关键技术:
-
可信的-大模型及智能体技术,确保智能体在专业领域的可靠性和可控性
-
全栈的-企业级智能体开发平台,让企业开发者可以敏捷地构建和部署智能体
-
灵活的-多云多芯算力调度组件,应对复杂的算力需求,提升资源利用率
-
创新的-思维链高质量数据标注能力,为智能体提供高质量的训练数据
我将逐一介绍以上四大能力如何让企业级智能体真正落地,服务于各行各业。
首先,在工业级场景中,任务往往非常复杂,而且容错率极低。比如金融风控、能源调度等领域,任何一个小错误都可能导致巨大的损失。因此,这对智能体的构建提出了更高的技术要求,要有足够的可靠性、上下文一致性、过程透明性、可控性等等,这与大模型本身偏黑盒天然特性相违背,需要专门优化解决。
蚂蚁数科可信智能体技术力求让企业级智能体达到可靠、可控、可优化:
第一、在大模型侧,针对ToB垂类行业,加强权威数据收集和合成管道;在后训练过程中强化领域推理、知识遵循、幻觉降低、上下文表达一致等“可信”价值观;同时,强把评测出口,保障垂类大模型能够为智能体提供坚实可靠的行业知识和行业推理能力。
第二、在智能体供给侧,重点是对<文档、API、数据库>三种常用资源做质量提升。通过自动优化知识库质量、完善残缺的API文档、对数据库schema进行增强和改写,提升源头供给质量,从而提升智能体的可靠性。
第三、在智能体执行侧,推进人机交互的协同推理。智能体并不全部依赖自由规划,它能借鉴企业过往沉淀的SOP规划、向人类白盒化展示思考和执行过程,同时可以在执行过程中接受人类反馈,即时地修改自己的思考和行为方向,直到达成人类接受的成果,从而大大提升了智能体对复杂问题解决成功率。
第四、自动化的场景评测和归因技术。今天的智能体研发中,“一周出demo,半年不好用”是常态。究其原因,很重要一部分是评测优化并不像以前的机械化系统那么成熟。对此,我们研发了自动化的场景评测和归因技术。只需标注少量样本,即驱动端到端评测和各环节评测,同时对系统badcase做出诊断归因,指导下一步优化。
为了让企业更容易开发和部署智能体,我们也打造了一套从"算力-数据-模型-应用"全链条贯通的一站式企业级智能体开发平台,从最底层的计算能力到最终落地的应用场景,拥有全栈的技术产品矩阵,并且经过了规模化业务的验证。
这个平台最大的特点可以用三个关键词概括:灵活、可信、开箱即用。
一、支持不同开发模式。初创企业可以像乐高积木一样的零代码工具,以拖拽方式就可以迅速搭建出智能体应用。当企业想做定制化,使用低代码模式让技术人员在平台上搭积木的同时也参与开发。对于一些复杂系统,我们支持高代码的开发模式,并与平台深度融合。
二、部署灵活。平台不仅支持本地化、SaaS化以及混合云等多种部署方式,而且针对SaaS和混合云部署,还特别采用了全球领先的隐私计算、TEE等技术,确保数据的安全性和合规性。
三、开箱即用。内置大量面向不同行业的知识库、企业级工具和服务组件,使得智能体的搭建过程变得更加高效快捷,大大缩短了从想法到实现的时间以及智能体的效果保障。
随着智能体应用的爆发,算力需求也在快速增长。但不同企业使用的计算资源千差万别——有的用公有云,有的用私有云,还有的采用多种芯片架构。这种多样性带来了巨大的管理挑战。
为了解决这个问题,我们开发了智算平台,能够实现多云、多芯、异构算力资源的统一纳管与调度。国产GPU、CPU还是其他专用芯片,都可以在平台上高效协同工作。不仅提升了算力利用率,还为企业提供了灵活的适配和优化路径,帮助它们应对日益增长的智算规模与性能需求。
当然,任何智能体的核心都是数据。没有高质量的数据,再强大的算法也无法发挥作用。为此,我们打造了数据生产与合成技术平台(AIGD),为大模型所需的高质量数据语料提供采集、加工合成、标注、质检的全流程服务。
此外,针对智能体推理模型的新趋势,我们也推出面向长思维链数据的特色服务,具备长思维链数据的合成改成、智能标注等核心能力,可以帮助企业构建行业推理模型,从而大幅提升智能体在工业级严肃场景的应用上限。
二十年前,蚂蚁集团创立之初,移动支付刚刚兴起,我们通过技术创新为社会带来微小而美好的变化。今天,我们有理由相信,企业级智能体也将改变产业格局,开启全新纪元。
无论是未来能源的智慧电网调度,还是未来制造的柔性生产线管理,亦或是未来健康的个性化诊疗方案,智能体都将在其中扮演不可或缺的角色——当AI开始理解产业运行的"底层逻辑",我们迎来的不是简单的能力升级,而是生产力范式的代际跃迁。
展望未来,我们期待与政府、学界、产业界的各位同仁携手合作,共同探索企业级智能体的无限可能,为我国未来产业的高质量发展注入新动能,共同塑造中国创新的全球坐标。