本文作者:访客

火山引擎,燃起了Agent的星星之火

访客 2025-08-20 11:00:51 8174
火山引擎,燃起了Agent的星星之火摘要: AI能否像水电一样“即开即用”,很大程度上要看这场底层架构重塑能走多远、走多快。文|赵艳秋 周享玥编|石兆晨光未...

AI能否像水电一样“即开即用”,很大程度上要看这场底层架构重塑能走多远、走多快。

火山引擎,燃起了Agent的星星之火

文|赵艳秋 周享玥

编|石兆

晨光未破,山西一座矿山企业的班前会如常举行:矿工们签到、宣誓、量血压,班组长大声传达安全风险和作业要点。在没有手机信号的千米井下,这场不足半小时的会议,守住的是生命安全,也是企业的效率与质量底线。如今,类似的会议正悄然进入智能时代——在一些工业企业,智能体(Agent)已接手会议监察,实时提醒参会者状态,自动判读会议纪要,确保信息传达无误。

智能体正加速进入企业业务流程。过去十年,企业智能化沿着“看得懂、听得清”的感知智能,到“能写会画”的生成式AI,2025年迎来了“会思考、能行动”的智能体时代。

然而,Agent要从Demo走向大规模生产,仍面临高成本、技术复杂、落地困难等挑战。这正是“AI云原生”的意义所在。在6月11日举办的Force大会上,火山引擎展示了正在打造的一整套AI云原生“新底座”,通过对大模型、智能体开发、多模态数据湖、AI基础设施和安全等的全面升级,打破智能体规模化落地的壁垒,让Agent真正走入企业日常生产系统。

01

Tokens消耗5个月涨了4倍

Agent离企业越来越近

Force大会上,火山引擎总裁谭待公布了一组数据,去年12月,豆包大模型的日均tokens调用量是4万亿;截至今年5月底,已经超过16.4万亿,并仍然保持着高速增长。这组数据背后,是广大行业企业管理者,对智能化转型抱有的期望和动力。“他们在推动内部,用智能体取代传统AI工具。”火山引擎云基础产品负责人罗浩在今年走访各地企业注意到这一趋势。

Tokens规模快速增长背后,是模型能力的快速提升,在不断解锁新场景。火山引擎智能算法负责人吴迪观察,当下模型能力正沿三条主线进化:首先是推理与思考,尤其当它们结合图像、视频理解后,智能将爆发,智能体能力也将显著增强;其次是视频生成从“玩具”开始走向生产级,豆包的Seedance 1.0 Pro和Google Veo3等模型,已在短视频广告与电商内容制作等中落地;再次是多步骤复杂任务逐渐成熟。

这些模型的演进趋势,给行业落地带来巨大影响。以去年12月和今年5月火山引擎Tokens消耗构成来对比,随着深度推理和思考模型的发布,AI工具调用的Tokens消耗增长了4.4倍,其中AI搜索增长10倍,AI 编程增长了8.4倍。视觉理解模型则让K12在线教育的Tokens消耗增长了12倍,而新出现的智能巡检,视频检索等场景也快速实现日均百亿tokens的突破。

大模型的应用也在不断深化。目前走在最前沿的智能手机、汽车、金融以及教育等行业,大模型应用落地和创新正在加速。

2025年被业界认为是智能体爆发之年。“我们希望大模型不再仅仅完成信息的识别、处理和生成,而是能够自主推理、规划行动并执行任务,从而成为构建复杂业务闭环的智能体。”谭待说。“到今年底,你能将一个比如说价值50元的事情交给模型或手机助手,让它端到端尝试性帮你完成,准确率可能在80%~90%。”吴迪举例说。

然而,Agent目前在产业界Demo多,真正走入生产环境的少。普华永道2025年5月的调查显示,88%的企业因Agent计划增加AI预算,但真正跨应用、跨工作流连接的Agent,目前仅占19%。

Agent从技术走向业务,还面临共性困境:其中最受关注的是部署成本高昂,收益却难以回报。一家品牌曾为推广Agent投入上百万元,结果营收提升不足1%,却占用了全年IT预算近五分之一。其次是技术部署也步履维艰。德勤今年5月的报告显示,仅30%的Agent实验,能在3-6个月内实现规模化落地。更不用说信任与风险管理,仅20%的企业受访者信任Agent处理财务交易。此外,数据治理、组织变革、员工采纳滞后问题同样突出。

目前,智能体仍然不是“即插即用”的万能产品,它更像是一块“半成品拼图”。智能体在企业的落地是一个复杂的系统工程,除了模型能力之外,仍需要大量能力上的补足。谁能把手中的“拼图”先拼好,用更扎实的基础建设、更贴近业务场景和可持续运营的思维,与专业能力融合,才能让智能体成为企业智能生产力的新引擎,而非昂贵摆设。

实际上,我们正处于一个技术范式跃迁的时代:PC时代,主角是Web;移动时代,主角是App;而进入AI时代,主角正在变成智能体(Agent)。而开发范式也正在重塑——从程序员手编写算法和规则,到大模型主导调用逻辑。

这一变革,推动整个技术栈发生深刻变化。AI云原生,正是支撑这场范式跃迁的技术底座。它不仅承载模型和Agent的高效开发,还帮助企业在AI时代构建出真正可用、可规模化的智能体。AI云原生也成为火山引擎的聚焦点。

02

AI云原生,是Agent规模落地基础

在本次Force大会上,火山引擎密集推出了AI原生云从底部到顶部一系列新品,它正试图打造一整套“AI云原生”新底座,支撑智能体走出Demo,进入行业大规模应用。

“AI云原生”理念最早在去年12月Force大会提出,核心思想延续了传统云原生“解放用户、专注应用”的精神。但与传统“先搭云、再搭应用”不同,AI云原生强调“模型主导、将模型作为智能体生产流程的驱动力”。2025年2月,火山引擎也进一步明确,AI云原生的核心是“以模型为中心”。

要支撑AI云原生,底层架构几乎需要全栈重塑。计算从CPU中心,转向GPU优先,计算、存储、网络架构全面升级。与此同时,安全、大数据、推理框架、Agent开发.....几乎需要全部升级。

大会上的一张PPT显示,从安全、基础设施、多模态数据湖、大模型到Agent开发,火山引擎都有动作。

其中,大模型和Agent开发平台是关键要素。此前,豆包大模型研发团队长期保持低调,但从这次公布的内容来看,模型信息已逐步透明化。新发布的豆包大模型1.6、视频生成模型Seedance 1.0 Pro、实时语音模型等新品。豆包1.6突出了深度思考、多模态和工具使用能力,这可以推动多步骤复杂任务智能体。

火山引擎放出了模型价格,这引发了全场的关注,企业只需要原来三分之一左右价格,就能获得一个能力更强、原生多模态的新模型。

谭待介绍,影响模型成本最关键的是输入输出长度,所以豆包1.6采用统一定价模式,不论用户关闭或开启深度思考模式,不论是文本还是视觉,tokens的价格都完全一样。

为此,火山引擎基于对上下文长度分布的调度优化,可以创新性地实现区间定价:输入区间32K-128K的范围内,豆包1.6的价格是输入1.2元每百万tokens,输出16元每百万tokens;输入区间128K-256K的范围内,豆包1.6的价格是输入2.4元,输出24元。而对于绝大部分企业使用集中的0-32K范围,通过技术的优化,豆包1.6的价格是每百万tokens 输入0.8元,输出8元。

现场公布的Seedance价格引发了与会者的惊叹,这是目前市场的最低价——Seedance 1.0 pro的价格为每千tokens1分5厘,相当于每生成一条5秒的1080P视频,只需3.67元。“假如你有1万块钱预算,可以做2700条5秒的1080P视频,这样的模型和性价比,将促进创意和商业的繁荣应用。”

除了模型本身,要开发出好的Agent,需要提供强化学习、Prompt优化、MCP Hub、知识库、运行沙盒等开发平台,火山引擎提供了相应的配套能力。

吴迪特别提到了强化学习。随着多步骤复杂任务Agent进入生产生活,业界对准确率要求将变得前所未有地高。这也将引发以强化学习为代表的后训练热潮。“我们也做一个大胆预测,强化学习整体算力消耗和IT支出,在2027年附近逼近预训练上的投入。”

但强化学习处于黎明期,面临很多挑战,吴迪提到了字节跳动自研的veRL强化学习框架,已于2024年10月开源,收获意外好评,在RL训练的精度与易用性上展现出超预期表现,也有将近30多个行业工具/框架基于veRL之上来发展自己的生态。

在模型之下的数据基础设施层面,也在发生变化。火山引擎数智平台负责人郭东东介绍,企业数据正呈现两大趋势:一是非结构化数据,如图像、视频、音频、文本比重持续上升,预计2027年在企业数据体系中占比超40%;二是结构化与非结构化数据的深度融合。

火山引擎推出了多模态数据湖解决方案,帮助企业搭建适应AI时代的数据新基建,从单纯支撑BI报表,转变为驱动AI模型训练与模型应用的构建。同时,伴随企业内部“数据专家”角色正在演变为更主动与智能的Agent,火山引擎所推出的企业级数据智能体Data Agent产品正式启动售卖,实现业务数据全域贯通、深度理解和运用企业数据资产,主动思考并洞察数据,为业务提供可参考的深度洞察。

在数据基础设施之下,是火山引擎AI基础设施。无论是豆包大模型还是DeepSeek这样的开源大模型,背后都是这一基础设施在发挥强大支持。现在,火山引擎把这些基础能力原子化,组合为三个方案,分别是AgentKit,TrainingKit和ServingKit,提供给企业。

其中,AgentKit围绕Agent打造的工具和平台进行了整体SDK封装,核心解决了大模型与外部MCP工具的快速集成,以及在云端部署的问题。

TrainingKit支持训练的全链路,除了针对传统大规模预训练,实现60%+的MFU(Model FLOPs Utilization,算力利用率),针对模型训练从预训练向后训练转移的趋势,专门集成了veRL框架,同时支持百万+核秒Sandbox并发,提升后训练效率。

ServingKit则通过支持对各种开源框架的优化、对主流模型的算子优化,将推理性能比社区的最新版本提升了2-3倍。

围绕AI云原生,安全是基础。“针对大模型的攻击,形态更加隐蔽,通过精心设计的提示词或问句,让模型不断输出内容,消耗推理算力,最终影响企业的核心业务。”火山引擎安全产品负责人刘森分析,另一类针对大模型的攻击,与用户隐私和数据密切相关。比如,新能源车的“大模型座舱”服务,可能会在攻击下泄露用户隐私。

火山引擎发布了两款AI安全产品:AICC私密计算,面向公有云环境、保障推理效率前提下,实现敏感数据流转和应用安全。同时,大模型应用防火墙,为企业智能体应用构建安全可信的大模型推理空间。火山引擎已与联想一起,打造了国内PC领域的首个可信AI密态计算方案,保障大模型推理场景下的用户数据隐私安全。

03

落地序幕已经拉开

结合火山引擎的“AI 云原生”理念,以及围绕这一理念搭建起的全套技术栈,多个行业的龙头企业正在加速与火山引擎,实现智能体落地的创新。

在消费行业,瑞幸咖啡基于豆包大模型,打造了首个AI点单智能体Lucky,能深入分析用户历史订单数据,精准预测偏好,实现语音下单、猜你喜欢、点单更省时等功能。飞鹤奶粉用豆包大模型和火山引擎 HiAgent 平台,构建了近百个智能体,用在品宣、营销、办公等内部场景。“我们选择与火山引擎合作,主要是因为他们在AI和大数据方面的领先优势。”瑞幸咖啡副总裁温文显说。

在汽车行业,宝马借助豆包大模型升级了汽车营销服务,截至目前,双方合作的AI智能营销工具已经支持全国约300家BMW经销商。梅赛德斯-奔驰在全新纯电长轴距CLA的人机交互系统中,接入豆包大模型,能回答各类问题,一句话帮车主找到需要的功能和应用并完成设置,还能够识别人类情感,为车主提供情绪价值。

“当前,八成主流车企正在使用豆包大模型进行AI创新。”谭待说。不止营销、智能座舱等场景,火山引擎还进一步深入到了企业更核心的场景,如研发、AI for Science等环节。比亚迪前不久发布的兆瓦闪充电池,在研发初期,便引入了字节跳动BAMBOO 模型,依托火山引擎的云基础设施,进行电解液配方快速筛选,加速电池快充技术的研发进程。

在物流行业,顺丰科技基于豆包大模型和HiAgent智能体开发平台,实现了通用知识和顺丰专业知识的融合,并通过零代码、低代码的方式打造了每个人专属的AI办公助理。

在互联网行业,新浪微博面向搜索这一核心战场,顺势推出了融合大模型能力的微博智搜,可大幅提升用户搜索体验。而微博选择与火山引擎合作,通过ServingKit工具包等,做到在投入相同物理资源的情况下,能够拿到比社区版本2倍甚至3倍以上的性能和吞吐收益,实现了技术降本。

另外,在消费电子、金融、教育等目前落地走在较为前列的几大行业,火山引擎已实现批量化落地。

火山引擎总裁谭待透露,目前,在消费电子行业,全球Top10手机厂商中,已有9家选择和火山引擎深度合作,将大模型应用在了语音助手,创作工具,效率提升等诸多场景。

在金融行业,火山引擎正在为客户提供 AI APP、智能展业、投顾、投研等大模型应用方案,已服务招商银行、浦发银行、北京银行等70%的系统重要性银行,国泰海通证券、华泰证券、国信证券等数十家券商和基金公司。其中,国信证券基于豆包大模型、智能体构建平台等能力,结合内部沉淀的投资顾问投研逻辑,推出了“会思考”的国信股市助手智能体,华泰证券打造出了华泰股市投资服务智能体。

在教育行业,火山引擎提供大模型解决方案,已与北京大学、浙江大学、南开大学等超五成985高校达成合作,持续推动高等教育智能化转型。上海市虹口区还携手火山引擎,依托 HiAgent 智能体开发平台,打造了国内首个区域级教育智能体应用生态系统 ——“虹口区教育智能体导航系统”(HEADS),探索 AI 融入教学全流程。上线百日,全区教师已自主构建177个教育智能体。

而业界看到,AI能否像水电一样“即开即用”,很大程度上要看这场底层架构重塑能走多远、走多快。通过“AI云原生”全栈新服务,火山引擎正在把AI能力变成机车设施,推动“AI as a Service”成为现实。“我们也相信,火山引擎将携手越来越多的客户和伙伴,一起做好大模型应用落地,在AI时代加速创新。”谭待说。

阅读
分享