MIAOYUN | 每周AI新鲜事儿 260327

本周全球AI动态密集发布,涵盖大模型、智能体、工具、技术突破、软硬件与市场趋势:多家机构推出全新AI模型与智能体产品,多款AI工具与协作功能上线,Google、Meta等发布推理优化与自进化智能体架构,华为、Arm、马斯克等推出AI芯片与硬件产品;国家数据局确Token中文名为“词元”、运营商转型Token经营、OpenAI关停Sora、Gartner发布中国AI趋势等行业动向频出,一起来回顾本周发生的AI新鲜事儿吧!

AI 大模型

Cursor发布第二代自研编程大模型「Composer 2.0」并上线IDE

3月20日,Cursor发布第二代自研编程大模型「Composer 2.0」并上线IDE,该模型在Terminal-Bench 2.0等基准测试中超越Claude Opus 4.6、逼近GPT‑5.4,价格仅为Opus 4.6的约十分之一,网友实测其生成应用可一次跑通,效率与成本优势显著;此举是Cursor摆脱对外部模型依赖、向AI编程平台转型的关键动作,旨在应对开发范式从代码辅助转向智能体执行的行业变革。

美团龙猫团队开源了数学形式化与定理证明专用模型「LongCat-Flash-Prover」

3月24日,美团龙猫团队开源了数学形式化与定理证明专用模型「LongCat-Flash-Prover」,将形式化推理拆解为自动形式化、草稿生成、证明生成三大原子能力,搭配工具集成推理(TIR)策略、混合专家迭代框架与HisPO算法,并通过Lean4 Server、语义一致性、定理一致性、合法性验证等机制防范AI作弊,实现高效严谨推理,仅72次推理预算就在MiniF2F-Test达97.1%通过率,刷新开源模型-SOTA,目前已全面开源,有望助力数学研究范式创新。

Google DeepMind发布AI音乐生成模型「Lyria 3 Pro」

3月25日,Google DeepMind发布AI音乐生成模型「Lyria 3 Pro」,作为Lyria 3进阶版,生成时长由30秒提升至3分钟,可精准理解并控制前奏、主歌、副歌、桥段等歌曲结构,已接入Vertex AI、Google AI Studio、Gemini、Google Vids、ProducerAI等多平台,覆盖个人创作、开发者与企业商用场景,实测音质与层次感出色,同时采用授权数据训练、防风格模仿与内容比对过滤机制,所有音频嵌入SynthID隐形水印,助力AI音乐从Demo走向完整可商用作品,推动音乐创作流程变革。

AI Agent

天翼云推出AI云电脑OpenClaw版,内置智能体并推出多档Token套餐

3月25日,中国电信天翼云推出天翼AI云电脑「OpenClaw」版,新用户可免费领取2500万Token,同时上线50元2500万、100元5000万、200元1亿三档Token付费套餐,支持微信、支付宝等支付方式,内置OpenClaw智能体,适配轻量到专业级AI开发需求,支持API接入与用量查询,可零门槛便捷使用AI算力。

OpenClaw推出科研专属AI智能体「SciClaw」

3月26日,OpenClaw推出科研专属AI智能体「SciClaw」,可自主完成文献研读、实验计算、论文撰写、审稿回复、数据可视化与实验复盘等全流程科研任务,具备强记忆、自动排错、无人值守运行能力,支持对接AI眼镜与自动化实验设备,零门槛云端部署,对话即可操作,大幅提升科研效率。

AI 工具

微信推出「ClawBot」龙虾插件,一键接入OpenClaw实现聊天操控

3月22日,腾讯微信正式推出官方「ClawBot」龙虾插件,可扫码或复制命令将OpenClaw接入微信,用户通过微信聊天即可调用OpenClaw互动,该插件正逐步放量,更新微信至最新版即可体验;同时腾讯云Lighthouse、WorkBuddy、QClaw等多款龙虾产品均支持微信通道接入,还配备腾讯云AI安全中心、龙虾管家等安全防护及SkillHub技能社区等生态服务。

MiniMax稀宇科技开源「MiniMax Office Skills」生产级办公文档引擎

3月25日,MiniMax稀宇科技开源「MiniMax Office Skills」生产级办公文档引擎,包含Word、Excel、PDF、PPT四类处理Skill,采用MIT协议,基于微软官方OpenXML、底层XML直操作、双引擎渲染、规范样式约束等技术选型,解决AI生成文档格式错乱、公式失效、内容丢失等问题,并配套Execute→Evaluate→Fix三阶段自进化机制,可在自动化评测中持续迭代稳定,适配M2.7大模型,已在MiniMax Agent与MaxClaw落地使用。

Claude Code推出自动模式「Auto Mode」,效率拉满但Token消耗更快

3月25日,Claude Code推出里程碑式的自动模式「Auto Mode」,可由模型自主判断权限、自动执行文件写入与终端命令,无需逐次人工批准,实现无人值守编程;该模式内置安全分类器,低风险操作自动放行、高风险行为拦截确认,兼顾效率与安全,可通过命令启用并按Shift+Tab切换,目前以团队版预览形式推出,企业版与API将陆续上线,虽大幅提升开发效率,但存在Token消耗快、成本高的问题,官方建议在隔离环境中使用以降低风险。

腾讯「元宝派」正式上线电脑端,支持支持AI养虾与多端同步

3月25日,腾讯「元宝派」正式上线电脑端,支持与手机消息实时同步,具备侧边栏快捷提问、连麦、屏幕共享、文件拖拽上传等功能,还可在电脑端接入OpenClaw龙虾Bot,支持群内互动、AI协作与养虾玩法,同期推出免费领虾活动,进一步完善AI社交与办公协作体验。

技术突破

通义实验室推出「PrismAudio」视频生成音效框架

3月24日,通义实验室推出「PrismAudio」视频生成音效(Video-to-Audio)框架,已被ICLR 2026收录成果。该框架将思维链与强化学习结合,通过语义、时序、美学、空间四维奖励机制同步优化音效生成,搭配自研Fast-GRPO高效训练算法,实现轻量、快速、高同步度的环境音合成,在多项测试集上超越现有方案,代码即将开源。

Google发布「TurboQuant」算法,KV Cache无损压缩6倍,AI推理提速8倍

3月24日,Google Research发布将亮相ICLR 2026的「TurboQuant」算法,通过极坐标量化与量化JL变换实现AI推理KV cache至少6倍无损压缩、3bit量化,推理速度最高提升8倍,无需训练微调且精度无损,被称作Google的“DeepSeek时刻”,该消息引发市场对AI内存需求降温的预期,导致美光、西部数据等存储芯片巨头股价大跌,目前该技术仍处于实验室阶段,仅影响推理环节、不涉及训练。

Anthropic公开Claude智能体长线开发「Harness」架构

3月25日,Anthropic公开Claude智能体长线开发「Harness」架构,借鉴GAN机制采用“生成器+评估器”分离模式,搭配规划器形成三智能体协同体系,解决上下文焦虑与自我评估不可信问题,可自主完成前端设计迭代与全栈应用开发,输出质量显著优于单智能体,随模型升级架构可逐步简化,已成功实现复古游戏工具、DAW音乐软件等复杂项目的无人干预构建。

Meta联合推出「Hyperagents」智能体框架,AI可自主重写代码持续进化

3月26日消息,Meta联合UBC等机构推出「Hyperagents」智能体框架,该框架将哥德尔机(Gödel Machine)思想,与达尔文开放算法相结合,提出了能持续自我迭代的达尔文哥德尔机,将任务Agent与元Agent统一融合为可编辑程序,实现元认知自我修改,可自主重写底层进化逻辑、推导UCB类探索算法,在编码、论文审稿、机器人奖励设计、奥数评分等多领域均实现性能提升,具备跨域迁移与跨运行累积改进能力,可自主重写底层代码实现持续自我进化,已开源代码并配套沙箱、人工审计等安全机制。

AI 软硬件

华为发布搭载昇腾950PR处理器的「Atlas 350」AI训推加速卡

3月22日,在华为合作伙伴大会上,华为发布搭载昇腾950PR处理器的「Atlas 350」AI训练推理加速卡,单卡算力、内存与多模态性能显著超越同类产品,支持FP4低精度计算,7家生态伙伴同步推出对应服务器,科大讯飞星火大模型全面适配昇腾算力;华为同步发布三类算力场景方案与20项行业AI解决方案,昇腾生态AI一体机已超400款、占据国内八成以上市场份额,国产高端AI推理算力进入规模化商用阶段。

马斯克官宣启动「TeraFab」芯片工厂,2nm工艺年产千亿颗芯片

3月22日,马斯克官宣由SpaceX、特斯拉、xAI联合启动「TeraFab」芯片工厂项目,计划投资200亿-250亿美元,采用2nm工艺年产1000亿-2000亿颗芯片,目标年产能超1万亿瓦算力,主要支撑特斯拉FSD、Dojo超算与Optimus人形机器人,摆脱对台积电、三星等外部供应商的依赖,项目由特斯拉440亿美元现金储备支持,还规划太空算力、月球电磁质量驱动器等长远布局,助力星际文明发展。

杰创智能发布「NexClaw View」液冷工作站(一体机)

3月23日,杰创智能发布「NexClaw View」液冷工作站(一体机),融合全液冷静音散热、常青桌面云安全架构与NexClaw企业级AI智能体,具备超静音、低功耗、插电即用、单机支持30人共享算力、数据安全隔离等优势,预装30+办公技能包,支持英伟达与华为昇腾双算力版本及国产化适配,无需专业机房即可快速部署企业级AI办公环境。

Arm发布首款自研数据中心CPU「Arm AGI CPU」,专为智能体打造

3月24日,Arm在旧金山发布首款自研数据中心CPU「Arm AGI CPU」,采用台积电3nm工艺、双Chiplet设计,最高136个Neoverse V3核心,主打AI智能体基础设施高能效,单机架性能达x86平台2倍以上,获Meta、OpenAI、英伟达等生态支持,现已开放订购,年底量产,标志Arm从IP授权正式进军自研芯片领域。

市场动态

Token中文名定为「词元」,我国日均调用量超140万亿

3月24日,国家数据局正式确定Token官方中文名为「词元」,局长刘烈宏公布截至今年3月我国日均Token调用量超140万亿,较2024年初增长超1000倍,较2025年底三个月增长超40%,标志我国人工智能从对话向智能体决策执行快速发展,数据要素价值持续释放;截至2025年底全国建成高质量数据集超10万个,后续国家数据局将持续推进数据集建设,赋能AI创新发展。

中国电信宣布全面转向Token经营,从流量时代迈入AI算力时代

3月24日,中国电信在业绩说明会上宣布全面转向Token经营,将从流量经营升级为以AI与Token为核心的商业模式,按通用、专业、定制分层供给,面向公众、中小企业、政企推出差异化Token服务与计费模式;公司加大算力基础设施投入,依托3000+边缘节点与OpenClaw等AI应用落地,初步验证Token化运营成效,旨在重构价值体系、打开新增长空间。

OpenAI宣布将终止「Sora」视频生成服务,算力聚焦高价值业务

3月25日,OpenAI宣布将终止「Sora」视频生成服务,包括消费者端应用、开发者API及ChatGPT视频功能,核心原因是用户热度下滑、算力消耗巨大,公司需聚焦高价值业务与企业级产品,原团队将转向世界模拟研究以支撑机器人技术,同时OpenAI终止与迪士尼的合作,ChatGPT图像生成功能则继续保留。

Gartner发布中国AI趋势:国产芯片、安全测试与智能体成核心方向

3月26日,Gartner发布中国AI趋势预测,核心包括:2030年中国80%本地AI基础设施将采用本土AI芯片,AASA架构与自研投入推动国产替代;2028年跨区域合规与AI偏见问题将占AI数据管理量50%;2029年70%中国企业将落地AI安全测试,大型企业中AI智能体承担超40%的IT运营任务,同时企业将加大本土技术投入、向“智能体化企业”转型。

中国移动全面转向Token经营,打造AI时代新型算力服务体系

3月26日,中国移动在业绩说明会上宣布开启Token经营时代,将Token作为AI时代核心生产要素与业绩增长依托;2026年算力与智能网络资本开支占比超37%,打造超万卡智算集群与AIDC枢纽,构建高效算力底座;拥有超40万亿Tokens高质量数据集与50款行业大模型,成立九天AI与具身智能创新中心;形成“Agent消耗Token、Token拉动算力”的商业闭环,依托“养龙虾”等应用落地验证,以算力服务为核心增长极,推进“三强一新”战略,从资源提供商向平台运营商转型。

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×