计算机行业研究:CPU涨价能持续多久?云顶国际- 云顶赌场- 娱乐城
2026-01-25 21:23:24
云顶赌场app,云顶娱乐城,云顶,云顶国际,云顶国际娱乐,云顶赌场,云顶赌场玩法,云顶赌场规则,云顶赌场21点,云顶赌场在线,云顶娱乐场,云顶最新消息,云顶赌场会员卡,云顶娱乐,云顶APP,云顶官网
Agent驱动的强化学习(RL)时代,CPU可能比GPU更早成为瓶颈。与传统单任务RL不同,现代Agent系统需要同时运行成百上千个独立环境实例,环境并行化让CPU成为事实上的第一块短板。主要源于三大核心逻辑:1)Multi-Agent带来OS调度压力,Agent的“推理-执行-反思”循环机制需要操作系统层面频繁调度,且沙盒(Sandbox)的运行高度依赖CPU算力。2)为解决长上下文导致的GPU显存容量问题,业界采用KV CacheOffload技术将数据迁移至CPU内存,这不仅要求CPU具备大内存,还需其承担繁重的调度与传输任务。3)高并发工具调用:检索、编码、网页浏览等非模型推理任务上由CPU执行,在高并发场景下,多线程/多进程的处理需求推高了CPU的负载。
DeepSeek Engram架构或进一步推动以存代算。DeepSeek推出Engram架构,把大模型里的“计算”和“超大规模记忆”解耦,Transformer的算子全部在GPU/加速卡上计算,而1000亿参数的Engram表存储运行则在CPU内存中,仅产生小于3%的开销。此外Anthropic推出的Claude Cowork,通过知识库为Claude设计的一种全新永久记忆方式。我们认为,类Engram架构能有效突破GPU显存限制,从而推动以存代算需求和CPU配比提升。
Agent生态扩张引爆CPU性能瓶颈。全球Agent生态正面临指数级跃迁,据IDC预测,2025年至2030年间,活跃Agent数量、任务执行量及Token消耗量将分别以139%、524%和3418%的年复合增长率飙升。这种增长不仅是数量的堆叠,更伴随着任务复杂度的剧增。英特尔与佐治亚理工学院的研究表明,在RAG检索、工具调用等典型Agent工作负载中,CPU承担了大幅度的延迟占比(如HaystackRAG任务中CPU耗时占90.6%),成为实际性能的瓶颈。此外随着Batch Size增加,CPU的能耗逼近GPU,且面临严重的上下文切换压力,证明了CPU在Agent时代的关键地位。
供需失衡全面爆发,算力木桶新短板已现。英特尔已紧急将产能转向服务器端,导致消费电子端交付受阻;英伟达则因ARM CPU瓶颈,计划在下一代Rubin架构中大幅提升CPU核心数,并开放NVL72机柜对x86CPU的支持。市场数据印证了这一趋势,Jon Peddie Research报告显示,2025年第二季度全球服务器CPU出货量同比大增22%,客户端CPU亦连续两季度增长。英特尔CFO表示预计第一季度可用供应将降至最低水平,随后在第二季度及以后有所改善,公司正应对整个行业的供应短缺。Agent时代算力的“木桶效应”已经显现,目前CPU正演变为类似于存储的新短板,补足这一短板将是下阶段算力基础设施建设的重中之重。。
