本周AI领域密集发布多款新品:Cursor、Google、阿里、字节、腾讯相继推出Composer 2.5、Gemini系列、Qwen3.7-Max、Lance、Hy-MT2等大模型,覆盖通用、智能体、多模态、翻译等方向;腾讯、阿里、火山引擎、月之暗面、哩布哩布AI等发布AI设计、办公、数据、创作、工具类产品;智谱、摩尔线程、阿里云在网络架构、算力芯片、全栈Agent化等方面实现技术突破;同时AnySearch、Chronicles-OCR、FDE模式、运营商词元套餐等市场与生态动态同步推进,AI正全面迈向智能体时代,一起来回顾本周发生的AI新鲜事儿吧!
AI 大模型
Cursor正式发布史上最强模型「Composer 2.5」
5月19日,Cursor正式发布史上最强模型「Composer 2.5」,性能直逼Claude Opus 4.7、价格仅为后者1/10,在权威测试中表现优异,能稳定执行复杂长任务、精准理解指令;该模型基于Moonshot的Kimi K2.5开源底座构建,经定向文本反馈RL、25倍合成任务、Muon+HSDP算力优化三大训练创新,编程与任务处理能力大幅提升;它由百万级H100等效算力训练,Cursor内部全员弃用旧模型,获马斯克支持,后续将与SpaceX AI合作打造更大模型,还将用Cursor数据补充训练Grok V9。
Google I/O连发多款AI新品,「Gemini Omni」与「Gemini 3.5 Flash」登场
5月20日,Google在I/O大会重磅发布「Gemini Omni」、「Gemini 3.5 Flash」、「Antigravity 2.0」、「Gemini Spark」等核心产品,升级AI搜索、Gemini App及Google Workspace创意工具,拓展Android XR智能眼镜生态,同时推出SynthID水印保障AI内容透明,整场发布会展现Google全面押注AI、从免费互联网公司转向AI订阅基础设施公司的战略,核心是验证用户为高阶AI服务付费的商业可行性。
阿里发布面向智能体时代的旗舰大模型「Qwen3.7-Max」
5月20日,阿里发布面向智能体时代的旗舰大模型「Qwen3.7-Max」,主打全能智能体基座能力,覆盖编程、办公自动化、长周期自主执行与跨框架泛化,在编程、通用智能体、高难度推理及多语言等权威评测中表现顶尖,多项指标对标甚至超越国际顶级模型;依托环境扩展与解耦训练设计,实现跨框架稳定泛化,无需适配特定框架。实战中,它可完成35小时超千次工具调用的内核优化,达成10倍加速;能自主监控AI训练奖励作弊、完成企业级长周期经营规划,营收较前代显著提升;还能直接生成交互式网页、SVG动画与规范论文,甚至操控物理机器人,全面赋能生产力场景,为下一代AI智能体提供坚实底座。
通义实验室发布「Qwen3.5-LiveTranslate-Flash」模型
5月20日,通义实验室发布「Qwen3.5-LiveTranslate-Flash」,聚焦实时同传痛点,支持60种语言音频输入和文字输出、29种语言音频输出,端到端字均延迟低至2.8秒;具备实时音色克隆、动态热词引擎、视觉消歧辅助等能力,在多场景实测稳定,性能与语言覆盖全面升级,为跨境协作、内容出海、智能硬件提供新一代语音同传基础设施。
字节跳动智能创作实验室发布原生统一多模态模型「Lance」
5月20日,字节跳动智能创作实验室发布原生统一多模态模型「Lance」,总参数6B,激活参数3B,以统一上下文建模、解耦能力路径及MaPE位置编码,实现图像/视频理解、生成与编辑全任务协同;在VBench、MVBench、GenEval、GEdit-Bench等权威基准上取得优异成绩,兼具高效、全能与强泛化能力;已开源模型、代码、论文与主页,助力轻量级多模态研究与学术生态。
腾讯混元正式开源支持33种语言互译的「Hy-MT2」翻译模型
5月21日,腾讯混元正式开源支持33种语言互译的「Hy-MT2」翻译模型,含1.8B、7B、30B-A3B三个版本,性能大幅超越上一代Hy-MT1.5,通用、专业领域、真实场景翻译及指令遵循能力突出,轻量1.8B模型超主流商业API,7B和30B-A3B达开源最佳、接近顶尖闭源模型;模型引入混合专家架构,自研1.25-bit量化版仅440MB,可高效部署于手机等端侧设备,推理速度提升1.5倍;配套“腾讯Hy翻译”小程序上线,支持联网高速与离线翻译,APP即将推出,相关模型与测试集已开源,助力机器翻译技术发展。
AI Agent
腾讯设计「Ardot」正式公测开放,AI赋能产设研全链路设计协作
5月18日,腾讯设计「Ardot」正式公测开放,作为面向产设研协作的AI设计工具,它以AI能力构建设计生产闭环,支持文/图生成UI、精准修改、批量制图等,通过MCP打通设计到代码的协作链路,兼具矢量编辑、动态布局等专业设计能力,提供多人协作、安全管控、企业级服务及腾讯生态集成,适配国内设计习惯、兼容Figma且性能优异,目前所有功能限时免费并赠送1000 Credits额度。
阿里云QoderWork上线AI原生设计工作台「Design Desk」
5月18日,阿里云QoderWork上线AI原生设计工作台「Design Desk」,支持语音输入,用户可通过语音快速生成可运行、可编辑、可交付的专业设计产物。作为首个细分领域模式,该工作台内置百余种风格与数十项设计技能,主打“设计即代码”,打通设计到研发的无损交付链路;并通过Questions、Design Plan、Nudge三大机制,重构AI设计流程,降低迭代损耗。它适配设计师、产品经理、市场运营等不同角色需求,可高效完成设计迭代、高保真原型制作与多场景物料生成,后续还将推出更多细分工作台,共享统一Agent底座与任务系统。
腾讯推出系统级个人AI助手「Marvis」(马维斯)
5月18日,腾讯推出系统级个人AI助手「Marvis」(马维斯),由深耕PC/移动端底层生态14年的应用宝团队打造,同步登陆Windows、Mac、安卓端。「Marvis」内置6个开箱即用、可并行工作的Agent,能自然语言完成系统设置、本地文件深度检索分析、跨端遥控、自动任务等操作,支持云端效率/本地隐私双模式切换,兼顾便捷与数据安全。「Marvis」以设备任务调度层为定位,打破传统人机交互逻辑,让电脑理解用户需求,成为中文生态里真正可用的系统级AI助手样本。
腾讯云正式发布大数据智能体工作台「DataBuddy」
5月19日,腾讯云正式发布大数据智能体工作台「DataBuddy」,作为Buddy家族新成员,它面向数据分析师、治理人员与数仓工程师,支持自然语言对话,一站式完成数据接入、开发、治理、分析全链路任务。基于腾讯WorkBuddy同源Agent底层,DataBuddy重点优化数据分析、数据治理、数据工程三大场景,可自动拆解任务、生成方案并交付结果,大幅提升效率;同时构建企业级纵深安全体系,保障权限合规、风险拦截与全链路审计,支持与腾讯云现有大数据能力无缝衔接、即插即用。
火山引擎正式上线一站式AIGC短剧创作平台「火山剧创1.0」
5月21日,火山引擎正式上线一站式AIGC短剧创作平台「火山剧创1.0」,依托自研多智能体架构并适配多款自研模型,平台具备导演级控片能力,可将短剧制作周期缩短超80%;提供从剧本解析、资产设定、分镜生成到成片预览的端到端解决方案,且开放全链路编辑权限。此次升级新增分镜提示词编辑器、完善真人与虚拟IP资产库、支持团队协作与积分灵活分配,已成功助力《古格王朝》AI先导片创作,未来将联动生态伙伴推动短剧工业化升级。
AI 工具
月之暗面Kimi推出浏览器插件「Kimi WebBridge」
5月15日,月之暗面Kimi推出浏览器插件「Kimi WebBridge」,适配Kimi Code、Claude Code等本地AI Agent,可携带用户登录状态,像真人一样完成浏览器点击、输入、信息采集等网页操作,不占用键鼠;支持自动化信息整理、复杂金融操作等场景,Chrome/Edge用户两步即可安装使用,Kimi Claw Desktop已内置该功能,云端版暂不支持,还可创建专用CLI工具提升固定任务效率。
哩布哩布AI宣布「LibTV」团队版正式上线
5月18日,哩布哩布AI宣布「LibTV」团队版正式上线,面向短剧、影视、品牌等领域的300余家企业客户,聚焦AI视频产业化协作痛点,推出专属团队空间、实时画布协作、团队资产库、多级权限管理、成本管控及资产交接等功能,助力AI视频团队沉淀创作资产、提升协同效率、实现规模化工业化内容生产,覆盖工作室、MCN、品牌方、大型制作团队等多类用户群体。
专为AI Agent打造的搜索基础设施「AnySearch」上线
5月18日,专为AI Agent打造的搜索基础设施「AnySearch」,打通Google等传统引擎无法覆盖的80%互联网数据,聚合金融、代码、安全等海量专业数据源;具备信息聚合、专业深挖、信源甄别、诚实溯源四大能力,输出结构化可信结果,大幅降低Token消耗、保障查询隐私,正推动搜索迎来从服务人类到赋能AI的第四次范式转移,上线一周便引爆海外开发者圈,现面向开发者免费开放。
腾讯混元联合发布「Chronicles-OCR」古文字识别评测基准
5月18日,腾讯混元联合多家机构发布「Chronicles-OCR」,是首个覆盖甲骨、金文、篆、隶、楷、行、草“七体之变”的古文字识别评测基准,含2800张专家标注图像,设四大核心任务。评测28个主流多模态大模型发现:模型在甲骨文等古早字体识别近乎失效,最高准确率仅27.1%;成熟字体识别能力也有限;模型易凭载体纹理判字体而非读字;推理模式反而降低识别效果。该基准量化了AI读懂古文字的能力边界,为文化遗产数字化提供重要参考。
技术突破
智谱联合推出「ZCube」组网架构,网络成AI基建新战场
5月21日,智谱联合驭驯网络、清华大学推出「ZCube」组网架构,针对大模型PD分离推理场景的结构性网络拥塞难题,以全网扁平化拓扑、单/多轨混合接入实现流量全局解耦与负载均衡;实测显示,该架构在GLM-5.1千卡集群中,可减少33%交换机与光模块成本、提升GPU推理吞吐15%、降低TTFT P99时延40.6%,为下一代超大规模推理集群提供高效低成本网络底座。
市场动态
Anthropic发布AI原生创业手册,拆解四阶段创业路径
5月18日消息,Anthropic发布AI原生创业公司手册,将创业划分为想法、MVP、上线、规模化四大核心阶段,明确各阶段目标、退出标准、失败模式及Claude系列工具(Chat、Claude Cowork、Claude Code)的适配用法;手册指出AI重塑创业模式,降低门槛、压缩周期,让非技术创始人也能创业,创始人角色转向AI编排者,同时需规避技术债、虚假PMF等风险,还附多家AI原生公司案例与实操资源。
摩尔线程发布「云-边-端」全栈智算矩阵,布局词元时代万物智能
5月18日,摩尔线程举办“词元时代,万物智能”发布会,发布「云-边-端」全栈智算矩阵:云端夸娥万卡级智算集群性能达国际主流水平,适配国内头部大模型并推出算力服务;端侧发布“长江”SoC驱动的AICUBE、AIBOOK等产品,搭载“小麦”智能体;推出国内稀缺的全栈具身智能仿真平台MT Lambda,打通训练-仿真-部署闭环;同时升级MUSA生态,深度兼容CUDA、适配主流框架,以开源共建推进国产算力发展。
OpenAI、Anthropic纷纷押注FDE(前沿部署工程师)模式
5月18日,OpenAI、Anthropic纷纷押注FDE(前沿部署工程师)模式,相关岗位一年暴涨729%,成为AI Agent时代落地关键。Palantir前高管复盘,FDE驻场客户侧,打通产品与真实需求,将通用模型打磨为可用方案;团队分懂行业的Echo与善原型的Delta,强调“先做不可规模化探索、再抽象通用能力”。区别于咨询,FDE靠产品杠杆降本、按成果定价,适配AI Agent全新市场的高异质性,成为当下连接AI技术与商业落地的核心范式。
阿里云宣布面向Agentic时代完成「芯片-云-模型-推理」全栈Agent化升级
5月20日,阿里云宣布面向Agentic时代完成「芯片-云-模型-推理」全栈Agent化升级,推出自研真武M890AI芯片、磐久AL128超节点服务器、旗舰模型Qwen3.7-Max及AI产品官网千问云;通过云产品Skill化改造、百炼推理平台优化,构建适配Agent的底层算力、运行环境与开放生态,全面支撑智能体高效稳定运行。
三大运营商入局「词元(Token)套餐」,普惠AI加速落地
5月21日消息,近日三大运营商相继推出「词元(Token)套餐」:中国电信9.9元起试商用,分三档覆盖个人、开发者与企业;中国移动推差异化套餐并配套AI-eSIM计量;中国联通提供一站式算力订阅服务。词元是大模型的基础计量单位,国内日均调用量两年激增千倍,重度用户成本高企,而运营商套餐大幅降价、低至9.9元千万词元,让普惠AI成为现实,助力算力普及与数字中国建设。