kaiyun官方网站官方客服24小时在线为您服务!这一系列优化使得在百舸 5.0 上-开云集团「中国」Kaiyun·官方网站

发布日期:2025-10-18 06:11    点击次数:148


kaiyun官方网站官方客服24小时在线为您服务!这一系列优化使得在百舸 5.0 上-开云集团「中国」Kaiyun·官方网站

当咱们在询查 Agent 时kaiyun官方网站官方客服24小时在线为您服务!,咱们在询查什么?

是炫酷的 UI?是调用用具的广度?是复杂任务的拆解才智?照旧能省俭若干时刻和东谈主力本钱?是,但也不是。

当统统这个词大模子行业皆将变革的焦点集聚到 Agent 之上时,如今 Agent 本人已经远不啻是一个包裹着"套壳"争议的应用门径了。

一个强盛的 Agent,需要约略处理长达百万级 Token 的荆棘文,以维系长久追想和复杂任务的透露;它需要具备文本、图像、语音等多模态才智,以完成复杂的任务和交互;更要紧的是,它需要具备自主进化的后劲,通过强化学习将践诺任务的斥逐反馈于模子检修,造成一个束缚学习和优化的闭环。

换言之,Agent 是 AI 才智的集大成者,复杂的任务条款 Agent 必须有 AI 基础设施的支握。云,尤其是其算力应用效率,成为了决定 Agent 能否范围化落地的要道。

而事实上,在现时的行业里,约略提供如斯系统性补助的云厂商并未几。其根柢原因在于,云的" AI 属性"是否饱和强盛。传统的云计较以 CPU 为中心,为"降本增效"而生;而 Agent 时间的基础设施,必须所以 GPU 为中枢、以智能为优先的 AI 云,为"价值创造"而建。

当咱们带着这个视角,再来扫视百度在 2025 云智大会上发布的系列更新时,就会发现,从底层的 AI 计较平台百舸 5.0,到表层的 AI 原生征战平台千帆 4.0,百度智能云这次的全栈升级,其中枢逻辑皆指向了一个要道词:效率。而这是 Agent 时间对云最根柢、最艰辛的需求。

Agent 的三重需求,怎样重塑云的系统性才智?

Agent 的爆发式增长,揭示了其对底层基础设施的三重共性需求,而这三重需求正在从根柢上重塑云的口头。

一方面,Agent 需要处理越来越长的荆棘文。不管是为了督察长久对话追想,照旧为了透露复杂的业务文档,长荆棘文处理才智皆是基础。这获胜诊治为对存储带宽和计较效率的严苛条款。

其次,Agent 需要践诺多类型的任务。从透露图表、分析视频到与用户进行语音交互,Agent 必须具备强盛的多模态才智,才能实在成为东谈主类在数字宇宙和物理宇宙中的给力助手。

更要道的是,Agent 需要具备自主进化的才智。一个静态的、无法从与环境交互中学习的 Agent,其价值是有限的。畴昔的主流将是约略通过强化学习(RL)束缚自我优化的 Agent,这意味着底层云平台必须支握"训推一体"的计较范式。

这三重需求,对传统云干事商组成了新的计较挑战。

而百度智能云这次发布的百舸 5.0 AI 计较平台,则为行业提倡了一种处置决议,即通过对收集、算力、推理系统以及训推一体效率的全面升级,为 Agent 时间构建新的计较底座。

"百舸 5.0 一句话来说,即是咱们围绕 MOE 模子架构作念了从芯片到框架到集群的协同优化,把 MOE 的遵守作念到比拟极致的情状。"百度首席科学家王雁鹏说谈。

伊始,是从底层收集基础设施启动,百舸先升级了"三张网"。 

大模子计较是集体作战,节点内的卡间通讯(X-Link)、节点间的集群组网(RDMA)以及联接存储的 VPC 收集,三者不行偏废。百舸 5.0 将 VPC 收集熏陶至 200Gbps,支握 10 万卡的 RDMA 收集互联,并将端到端延长压缩至 4 微秒。终点是针对万亿参数 MoE 模子海量的 All-to-All 通讯瓶颈,百度自研的 X-Link 契约将卡间带宽熏陶 8 倍,为计较效率铺平了谈路。

其次,在收集优化的基础上,计较才智也要打破和熏陶。本次大会上,昆仑芯超节点追究上线公有云。这意味着,往日仅存于少数巨头实验室的顶级算力,如今企业用户九牛二虎之力。

所谓昆仑芯超节点,即是将 64 张卡放到兼并个机柜,一个机柜顶往日 100 台干事器。超节点用卡间互联代替机间互联,结束单卡性能熏陶 13 倍,单机检修性能熏陶 10 倍。

百度集团践诺副总裁、百度智能云业绩群总裁沈抖在发布会上提到:"面前最大的开源模子参数达到了 1 万亿。当今,(借助昆仑芯超节点)只需要几分钟、1 个云实例,就不错浮松跑起来。"其单卡蒙眬比国内同类居品越过 15% 以上,也为 Agent 的复杂念念考提供了能源。

而最要道的是推理系统的立异性校正,这获胜恢复了 Agent 对及时性和活泼性的中枢需求。

Agent 的应用场景流量动态多变,对反应速率条款极高。百舸 5.0 的推理系统进行了一场透澈的架构升级,从早期的 PD(Prefill/Decode)鉴别,演进到将视觉与谈话、Attention 与 MLP 等计较姿色互异巨大的模块一谈解耦的"实足鉴别式架构"。

而濒临长文本推理,百舸通过自适合搀杂并行策略,将 16K 输入的首 Token 延长(TTFT)申斥到 0.5 秒。同期,通过双重担载平衡和首创的事件驱动散播式 KV Cache,用存储换计较。数据炫夸,这一系列优化使得在百舸 5.0 上,DeepSeek R1 这类主流 MoE 模子的推理蒙眬约略再熏陶 50%,意味着"相通的本钱,能让模子多作念 50% 的念念考"。

此外,针对 RL "推理采样、奖励评估、检修更新"活水线的复杂工程挑战,百舸 5.0 还推出了新的强化学习框架。在这一框架下,百舸通过结束分享谐和存储,摈斥了耗时的跨系统数据移动(ETL),并将用具调用原生融入强化学习的采样阶段,让检修出的模子天生就更擅长践诺实在宇宙的任务。

为补助这依然由,百舸不仅提供了支握海量用具高并发践诺的强断绝沙箱,还能将推理、检修、用具调用等不同模块智能匹配给最妥当的 GPU、XPU 或 CPU 算力。这一系列系统性优化在显贵熏陶资源应用率、申斥迭代本钱的同期,也大幅镌汰了单轮迭代时刻,从而加快了从"回答问题的模子"向"处置问题的 Agentic 系统"的进化。

从收集到算力,从推理到训推一体,百舸 5.0 的系统性升级,也勾画出 Agent 时间 AI 云在算力层应有的神态:高效、深度协同、为 AI 而生。

从百舸到千帆,全栈才智正在重新界说云干事

如若说百舸 5.0 构建了 Agent 时间坚实的计较地基,那么全面升级的百度智能云千帆平台 4.0,则是在这片地基上,为纷乱征战者和企业搭建起了一座通往 Agent 应用闹热的" AI 才智工场"。

一个显贵的行业变化是,企业对 AI 平台的关注点已发生根人道诊治。百度智能云 AI 与大模子平台总司理忻舟在调换会上提到,客户的需求已从前两年"模子参数目要达到千亿",转向如今"平台要可用,不要挂掉"。AI 正从看法考证走向中枢分娩环境,企业启动实在照看应用的贯通性、本钱和骨子效率。

现时,客户的核肉痛点不错归结为四点:追求更高的应用精度、更低的征战门槛、更优的本钱效益和更强的系统贯通性。

而百度智能云千帆 4.0 的升级,也围绕这四点张开。忻舟提到,"企业级 Agent 的落地包含四个要道点。第一,是一个约略处理复杂任务的智能体编排框架;其次,有了编排框架后,Agent 还需要‘趁手的用具’,因此与之配套的高质地才智组件就变得荒谬要紧;第三是模子。Agent 的应用带来了模子是否需要握续迭代、需要何种模子,以及是否应为具体落地场景征战行业或场景模子等一系列问题,尤后来者在业内尚未造成共鸣;临了,是 Agent 在骨子运行中所必需的安全、高可用和可不雅测等企业级才智。"

具体来看,在 Agent 编排才智上,千帆 4.0 提供了自主规划、责任流、多智能体迷惑三种编排姿色,让路发者不错把柄任务复杂度活泼遴荐。终点是针对复杂任务,千帆发布了多智能体迷惑模式,允许不同 Agent 各司其职,协同完成如商场分析、科研等复杂责任,让企业不错浅显地定制我方的" Manus ",从而大幅申斥征战门槛。

"咱们在责任流的姿色上结束了精确的编排、效率可控、节点丰富,也绽开了更多的才智让用户用得更顺畅,面前千帆平台上责任流智能体占比稀奇 80%。"忻舟说谈。

而在组件上,这次千帆 4.0 发布了多模态 RAG、百度 AI 搜索 MCP Server 两大中枢用具,进一步熏陶 Agent 的精度与才智。

其中,多模态 RAG不仅支握图片、表格等多种数据类型的检索,还独家提供了图谱增强才智,关于需要深度相干查询的金融风控、企业常识管制等场景效率熏陶显贵。举例,九号公司应用多模态 RAG,让其多语种智能客服约略"看懂"用户发来的故障图片,并给出精确指示。

而百度 AI 搜索 MCP Server,则是为 Agent 提供了弥补时效性短板的要道才智。与给东谈主用的搜索强调"排序"不同,给 AI 用的搜索更严防斥逐的"全面、巨擘、丰富",因为大模子有才智一次性处理海量信息。vivo 的"蓝心小 V "手机助手,能给通过调用 AI 搜索,才能为用户规划及时的不雅鸟门路。

忻舟还提到,该干事自上线以来,AI 搜索的日调用量增长荒谬飞速。刚刚推出几个月,每天的调用量已经达千万级,调用的客户隐敝了互联网、手机、汽车、金融、诠释等行业。

在模子优化上,由于客户来自于不同规模、不同行务,模子层也需要针对性的创新与优化,才能结束高精度与低本钱的平衡。

如今,千帆的模子库已执行至稀奇 150 个,并第一时刻引入 SOTA 模子,同期通过散播式部署优化,处置了 MoE 等大模子单机部署效率低下的问题。在这一基础上,针对企业在实在场景中对"性价比"的极致追求,千帆推出了 RFT(强化反馈精调)用具链,让企业仅用数百条样本数据,就能达到传统 SFT 举止数千条数据的效率。

举例智联招聘,即通过此决议,用百亿模子达到了千亿模子在东谈主岗匹配任务上的准确率。此外,千帆还推出了超 10 款自研行业专精模子,如金融规模的千帆慧金金融行业模子,在保证效率伊始的同期,以更小的模子尺寸,匡助企业开脱部署斥逐,结束本钱与效率的最优解。

在称心了企业对精度、本钱和征战门槛的追求后,百度智能云千帆 4.0 的升级最终恢复了客户的第四个、亦然最基础的核肉痛点:系统贯通性。千帆 Agent 平台不仅有隐敝内容、平台、数据、模子全地点的安全保险,还有从要道主张、链路到日记的全链路可不雅测才智,确保 Agent 在中枢分娩系统中约略安全、贯通、可靠地运行。

斥逐

从百舸到千帆,百度智能云这次的全栈更新,不仅是对 Agent 时间云计较需求的一次深切恢复,更是其"云智一体"战术上风的鸠集体现。这种从底层算力到表层应用征战平台的端到端优化才智,使得企业的应用需求不错获胜下千里到算力层,进行深度协同优化,而不是一迭代,就要推倒重来,由此造成了其他云厂商难以在短期内复制的中枢竞争力。

AI 时刻的发展是一个漫长的进度。当云计较刚刚兴起时,很多东谈主觉得"云即是云,AI 即是 AI "。但今天,两者已密不行分。把柄 IDC 发挥,百度智能云已一语气六年位居中国 AI 公有云干事商场第一。这并非随机,而是源于其十年前便修复的"三位一体"发展策略,以及四肢寰球 AI 云首倡者,对"智能"标的的长久过问。

这条"难而正确的路",让百度智能云在时刻代际变革的海浪中,构建了时刻护城河和系统性才智。

正如沈抖在大会上提到的,"旧年咱们说,有若干场景,就有若干 Agents;而当今,一个岗亭、一个场景,可能会是几个、几十个 Agents。当价值的创造姿色被重构,产业链也会进化,在畴昔的智能经济时间,一定要有新的基础设施来补助。"

Agent 的爆发仅仅智能经济"超等周期"的开始kaiyun官方网站官方客服24小时在线为您服务!,畴昔必将知道更多颠覆性的应用范式。而百度,正在为这场长跑作念好准备。




Powered by 开云集团「中国」Kaiyun·官方网站 @2013-2022 RSS地图 HTML地图