9月底至10月初,值此双节同庆之际,全球AI领域迎来了一轮密集的技术与产品发布浪潮,DeepSeek、智源研究院、Anthropic、智谱、OpenAI、IBM、腾讯、Google、xAI等多机构相继发布新一代大模型,在追求极致性能的同时,更注重实用性与效率。同时,行业重点转向构建智能体(Agent)生态,多机构发布了平台级工具(如AgentKit、Plugins),推动AI从工具向自主代理演进,在核心能力上实现显著跨越,一起来回顾本周发生的AI新鲜事儿吧!
AI 大模型
深度求索发布「DeepSeek-V3.2-Exp」模型
9月29日,深度求索发布「DeepSeek-V3.2-Exp」模型,引入了DeepSeek Sparse Attention(一种稀疏注意力机制),在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。得益于新模型服务成本的大幅降低,官方 API 价格也相应下调,开发者调用 DeepSeek API 的成本将降低 50% 以上。
北京智源人工智能研究院开源发布「RoboBrain-X0」
9月30日,北京智源人工智能研究院正式开源发布「RoboBrain-X0」,一个能够在零样本泛化、少量样本微调条件下,驱动多种不同真实机器人完成复杂任务的跨本体基座大模型。「RoboBrain-X0」源自「RoboBrain」的多模态基座能力,在「RoboBrain 2.0」数据基础上,进一步融合了真实机器人动作数据。通过统一建模视觉、语言与动作,它实现了跨本体的泛化与适配,具备从感知到执行的一体化能力。
Anthropic发布具备上下文编辑等新功能的「Claude Sonnet 4.5」
9月30日,Anthropic发布具备上下文编辑等新功能的「Claude Sonnet 4.5」,号称是全球最强大的构建复杂代理的模型,能保持超过30小时专注处理复杂任务,在考察真实编程水平的SWE-bench Verified测试和专门测试真实计算机任务的OSWorld基准里,直接登顶业界第一。此外,还同步推出「Claude Agent SDK」开发工具包及系列产品升级,整合了Claude Code底层基础设施,提供内存管理、权限系统和子智能体协调等功能,适用于广泛任务场景而非仅限编程。
智谱发布旗舰模型「GLM-4.6」,代码能力全面进阶
9月30日,智谱发布旗舰模型「GLM-4.6」,是智谱最强的代码Coding模型,较「GLM-4.5」提升27%。在真实编程、长上下文处理(上下文窗口由128K扩展至200K)、推理能力、信息搜索、写作能力与智能体应用等多个方面实现全面提升;并首次在寒武纪、摩尔线程国产芯片上实现FP8+Int4混合量化部署。
OpenAI发布「Sora 2」视频生成模型及配套应用
10月1日,OpenAI发布新一代AI视频生成模型「Sora 2」及IOS配套应用「Sora」。「Sora 2」采用文本条件扩散模型+Transformer的方案,能够根据文本提示生成高逼真度的视频,首次实现“音画同步”,还能生成各类复杂环境声,在物理准确性、逼真度上,一举刷新SOTA,并在一致性、可控性上实现了飞跃。
IBM发布「Granite 4.0」系列大模型,减少70%的内存需求
当地时间10月2日,IBM宣布推出「Granite 4.0」系列企业级LLM模型,包括「granite-4.0-h-small-32B-A9B」、「granite-4.0-h-tiny-7B-A1B」、「granite-4.0-h-micro-3B」和「granite-4.0-micro-3B」等四个版本。新模型采用Mamba-Transformer 混合架构,可在不牺牲性能的前提下减少70%的内存需求,降低推理部署的成本。
腾讯「混元图像3.0」登顶LMArena文生图榜单
10月5日,腾讯混元刚开源一周的「混元图像3.0」(HunyuanImage 3.0),登顶LMArena文生图榜单,超越Google「Nano banana」与字节跳动「Seedream 4」,成为全球最强开源图像生成模型。该模型是首个工业级原生多模态生图模型,采用80B参数MoE架构与原生多模态设计,支持世界知识推理、1000Token长文本理解及精确中英文渲染,美学水平达商业级。
Google DeepMind发布「Gemini 2.5 Computer Use」模型
10月7日,Google DeepMind正式发布「Gemini 2.5 Computer Use」模型(计算机使用模型),该模型基于「Gemini 2.5 Pro」视觉理解与推理能力,旨在赋予AI智能体(Agent)与图形用户界面(GUI)直接交互的能力,能够在浏览器或移动端界面上像人类那样点击、输入、滚动、选择控件等操作。
马斯克旗下xAI推出视频生成模型「Imagine v0.9」
10月8日,马斯克旗下xAI推出最新视频生成模型「Imagine v0.9」,免费向所有用户开放。该模型在视频生成速度和功能上有所提升,生成视频时间缩短至20秒,支持语音优先界面,用户只需说话即可创建视频。
蚂蚁集团开源万亿参数通用语言大模型「Ling-1T」
10月9日,蚂蚁集团发布并开源万亿参数通用语言大模型「Ling-1T」,是百灵大模型「Ling 2.0」系列的首款旗舰非思考模型。模型基于高效MOE架构,总参数规模达1T,每次推理仅激活约50B参数,兼顾强推理能力与高效计算。支持128K长上下文窗口,在编程、数学推理等复杂任务中表现突出,多项基准测试超越DeepSeek、Kimi等国内外模型。模型训练采用三阶段精英教育路径,使用20T+高推理密度数据,并通过原生FP8混合精度训练平台和自研WSM调度器,显著提升逻辑连贯性。
以色列AI21 Labs开源轻量级推理模型「Jamba Reasoning 3B」
10月9日,以色列AI创企AI21 Labs开源轻量级推理模型「Jamba Reasoning 3B」,该模型仅有30亿参数,可在包括手机、电脑在内的多种设备端高效运行,性能超过「Qwen3-4B」、「Gemma 3-4B」等业界顶尖模型。该模型基于SSM-Transformer架构构建,支持长达256K的上下文窗口,能够处理高达1M token,与DeepSeek、谷歌、Llama和微软等竞争对手相比效率提升了2-5倍。
Microsoft发布「UserLM-8B」用户角色模型
10月10日,Microsoft发布了「UserLM-8B」模型,这是一个80.3亿参数的语言模型,专门训练用于模拟对话中的“用户”角色,以帮助研究人员更真实地评估和开发助手。
AI 工具
OpenAI发布「AgentKit」等一系列平台级工具和产品更新
10月6日,在OpenAI开发者大会上,OpenAI发布了一系列平台级工具和产品更新,包括「AgentKit」、「Codex正式版」、「ChatGPT内置应用」与「Apps SDK」、「gpt-realtime-mini」、「gpt-image-1-mini」、「Sora 2 API」、「GPT-5 pro API」。「AgentKit」是一套面向开发者和企业的完整工具集,可用于构建、部署和优化智能体(Agent)。
Anthropic正式发布Claude Code插件系统「Plugins」
10月10日,Anthropic正式发布Claude Code插件系统「Plugins」公测版,支持开发者将自定义的斜杠命令、AI代理(Agent)、MCP服务器和钩子(Hooks)打包成模块化工具包,实现一键安装和共享。任何人都可创建插件市场,只需GitHub仓库或URL放置正确格式的marketplace.json文件,无需申请权限或审核流程。
Google Cloud发布「Gemini Enterprise」,争夺企业级AI市场
10月10日,Google Cloud正式发布革命性的AI平台「Gemini Enterprise」,它不只是一个简单的聊天机器人,而是一个能将谷歌顶尖 AI 技术融入每一项工作流程,赋能每一位员工的超级平台。该平台引入Model Armor功能可检测屏蔽AI聊天中的请求与响应,并支持Box、Microsoft、Salesforce等平台数据集成,把数周的复杂工作,简化成一次流畅的对话。
技术动态
中国信通院正式推出「方升」大模型基准测试3.0版本
9月28日消息,中国信通院正式推出「方升」大模型基准测试3.0版本,进一步完善评测能力体系。新版本不仅增加参数规模、推理效率等基础能力评估,同时前瞻性布局全模态理解、长期记忆、多智能体协作等十项高级智能指标,精准匹配工业、金融、科研等垂直领域需求。为支撑测试质量,信通院计划扩充300万条多语言测试数据,并研发新一代智能评测基座,包含仿真环境以验证复杂任务表现。
加州理工团队创下6100量子比特阵列新纪录,相干13秒、精度99.98%
9月29日消息,美国加州理工学院团队近期造出了目前全球最大的中性原子量子计算机,实现了超过6100个量子比特的一致性,同时实现了99.98%的运行精度,量子比特保持相干性长达13秒,这一相干时间比此前实验长了将近10倍,相关论文发表于最新Nature期刊。
NVIDIA发布「Newton」物理引擎等多项开源技术
9月30日,NVIDIA在机器人学习大会上发布了多项开源技术,包括联合Google DeepMind和迪士尼研究院开发的物理引擎「Newton」,能让机器人拥有”物理直觉”;还有赋予机器人人类推理能力的「Isaac GR00T N1.6」基础模型,以及能够生成海量训练数据的「Cosmos」世界基础模型,全面解决机器人研发中的仿真、推理和训练难题。