紧跟AI发展浪潮,洞察行业未来,MIAOYUN「每周AI新鲜事儿」,为您精选全球AI领域的最新动态,涵盖AI新模型发布、AI产品及工具、技术突破、市场动态等,助您走在智能时代前沿,一起来回顾本周发生的AI新鲜事儿吧!
AI 开源模型
月之暗面发布并开源「Kimi K2」模型,擅长代码与Agentic任务
7月11日,月之暗面发布并开源「Kimi K2」模型,是一款具备更强代码能力、更擅长通用 Agent任务的MoE架构基础模型,总参数 1T,激活参数32B。目前,「Kimi K2」已在Hugging Face上开放模型权重,并提供免费API接口,兼容OpenAI和Anthropic标准,支持最长128K上下文,在多个基准测试达开源模型SOTA成绩。
智源研究院开源「RoboBrain 2.0」具身大脑模型和「RoboOS 2.0」框架
7月14日,北京智源研究院发布具身大脑「RoboBrain 2.0」32B版本以及跨本体大小脑协同框架 「RoboOS 2.0」单机版,全面开源模型权重、训练代码及评测基准。「RoboBrain 2.0」32B版本凭借时空认知能力的突破,刷新空间理解和长链推理等10项评测基准。「RoboOS 2.0」作为全球首个具身智能SaaS开源框架,创新性集成MCP协议与无服务器架构,实现轻量化部署,打通智能大脑与异构本体协同通路,具身大脑与跨本体大小脑协同框架双擎联动,加速群体智能。
腾讯混元上线「Hunyuan-A13B」模型API服务
7月14日,腾讯混元团队宣布其最新大语言模型 「Hunyuan-80B-A13B」全面开源,模型API在腾讯云官网上线,输入价格为每百万Tokens 0.5元,输出价格为每百万Tokens 2元。作为首个13B级别的MoE开源混合推理模型,总参数达80B,激活参数仅13B,在多个权威数据测试集上表现优异,尤其在Agent工具调用与长文处理方面效果突出。支持256K原生上下文窗口,并引入融合推理模式,用户可根据任务需求切换快思考与慢思考模式,兼顾效率与准确性。
Mistral AI发布首个开源语音模型「Voxtral」系列
7月16日,Google和Meta前研究人员创立的AI初创公司Mistral AI,最新发布了首个开源语音模型「Voxtral」系列,包含24B和3B两个参数规模的版本,均基于Apache 2.0许可证开源,同时提供API服务接口。「Voxtral」模型支持32k token的上下文窗口,能够处理长达30分钟的音频转录任务或40分钟的语义理解任务。「Voxtral」模型继承了Mistral Small 3.1基座模型的文本理解能力,除了基础的语音转文字功能外,还可以直接对音频内容进行问答交互,生成结构化摘要,并通过语音指令触发API调用。
AI 工具
Google DeepMind开源全新Python库「GenAI Processors」
7月11日消息,Google DeepMind最近开源了全新Python库「GenAI Processors」,旨在简化基于Gemini API的生成式 AI 应用开发。其核心是统一的“Processor”接口,可将复杂AI流程拆分为模块化单元,支持实时处理音频、视频和文本等多模态数据,并借助Python的asyncio机制优化并发执行,显著降低I/O密集型任务的延迟。
每日互动发布全新操作系统「GAI OS」及AI办公套件「GAI Office」
7月16日,每日互动CEO方毅在“GAI·每日互动AI新品发布会”上发布全新操作系统「GAI OS」,以及面向垂直行业的AI办公套件「GAI Office」。方毅透露,公司目前正联合信通院研发属于中国开发者的MCP协议,在保障App数据主权的前提下,打造一个知识平权的、各类App聚合的立体生态「GAI Store」。并介绍公司的战略布局:「GAI OS」提升垂直模型可用性,「GAI Office」强化AI的实用性,「GAI Store」实现AI生态的可扩展性,构建起安全可控、场景深耕、生态共赢的AI基础设施。
Claude推出「MCP工具目录」,一键集成外部应用,简化AI工作流
7月17日消息,Anthropic旗下的AI助手Claude宣布新增「应用和工具目录」,通过直观的界面支持用户快速链接和启用MCP(Model Context Protocol,模型上下文协议)服务,实现对Asana、GitHub、Slack等主流工具的一键集成,极大降低了AI与外部服务集成的技术门槛,推动Claude从单一对话工具向能够执行复杂任务的综合协作平台转型。
AI Agent
MiniMax稀宇科技正式发布「Agent全栈开发功能」
7月16日,MiniMax稀宇科技正式发布「MiniMax Agent全栈开发功能」,是全球首个在复杂全栈网站应用上高交付率的Agent,可无代码一键构建完整应用系统,支持Supabase后端托管、Stripe支付功能、cron job定时任务、长链接维持等能力,可开发需要API、实时数据、下单支付、LLM调用、定时任务、登录注册等功能的各类应用。
亚马逊云科技发布Agent全家桶,AI Agents开启新纪元
7月17日,在亚马逊云科技纽约峰会上,亚马逊云科技详解公司Agentic AI战略,连发五大Agentic AI开发利器,揭秘从基础设施、模型、Agent框架到应用层的最新成果。会上,正式发布了「Amazon Bedrock AgentCore预览版」,提供7大AI Agents核心服务(运行时、记忆、身份验证等),并推出「Amazon Nova定制选项」和「Strands Agents V1.0」框架,使Agents开发更简单,实现多Agents协同工作。
OpenAI发布「ChatGPT Agent」
7月18日,OpenAI CEO Sam Altman在新产品直播中,发布了全新的「ChatGPT Agent」。该Agent一个重要功能模块是其多工具集成能力,将Operator的网站交互能力、Deep Research的信息整合能力以及ChatGPT的深度对话能力融合在一起,形成统一的智能体系统,支持自动生成PPT、管理日程、购物及运行代码。
技术突破
「MCP」直接替代方案,「UTCP」协议推动AI工具调用的革新与发展
7月15日,全球开发者推出了一种革命性AI工具调用标准「UTCP」(Universal Tool Calling Protocol,通用工具调用协议)。旨在让AI代理能够直接、快速地调用任何工具,无需依赖传统的代理服务器。与现有的MCP协议相比,「UTCP」的优势在于其能够让AI直接与工具的原生接口对接,包括HTTP、gRPC、WebSocket和CLI等多种方式,减少了调用过程中的延迟和复杂性,同时充分复用现有的身份验证、权限和计费机制。
多智能体协作突破,昆仑万维发布分层多智能体协作框架「AgentOrchestra」
7月16日,昆仑万维Skywork联合南洋理工大学,正式发布全新的分层多智能体协作框架「AgentOrchestra」, 以“交响乐团式协作”为核心,将复杂任务分解,由多个智能体分工协作完成。该框架由顶层“指挥”「Planning Agent」统筹,配合三类专业“乐手”智能体「Deep Researcher」、「Browser Use」、「Deep Analyzer」分工协作。这套框架在 SimpleQA、GAIA、HLE等全球权威评测中表现优异。
Google DeepMind推出全新「MoR」架构,推理速度翻倍、内存减半
7月17日,Google DeepMind、KAIST、Mila等机构发布了全新LLM模型架构「MoR」(Mixture-of-Recursions),推理速度提升2倍,训练FLOP减少,KV缓存内存直接减半,全面碾压传统的Transformer。「MoR」通过共享权重压缩参数量,通过动态路由减少冗余计算,通过智能缓存减少内存开销,兼顾了性能、效率和计算资源利用率,是递归Transformer架构的重要演进。
AI 行业动态
CAMEL-AI与Google Gemini官宣合作,实现数据可视化和自动化
7月12日,CAMEL-AI宣布与Google Gemini达成合作,其「OWL」与「Gemini 2.5 Pro」合作联动,实现数据可视化和自动化。「Gemini 2.5 Pro」凭借其卓越的推理、综合和创造能力,以及超长上下文窗口的处理能力,为数据分析提供了强大的支持。而CAMEL-AI的「OWL」系统则通过将复杂任务拆解为多个子任务,由不同技能的智能体协同工作,显著提升了任务执行效率。
AI算力竞赛白热化,Meta规划建设GW级超算集群
7月15日,Meta首席执行官Mark Zuckerberg在社交平台Threads上表示,Meta正加速推进人工智能基础设施建设,将投入数百亿美元建设多个吉瓦级(GW)超级计算机集群(如2026年将达1GW算力的「Prometheus」和2027年计划部署超5GW算力的「Hyperion」),以确保在AGI竞赛中拥有顶级算力。同时,Meta的竞争对手也在加码算力投资,如xAI近期宣布其Memphis超级计算机集群(约30万块GPU)功耗在200-300兆瓦,而微软与OpenAI合作的「Stargate」项目计划投资超5000亿美元建设AI数据中心。
NVIDIA恢复「H20」在中国的销售,并推出全新且完全兼容的GPU
7月15日,NVIDIA创始人兼首席执行官黄仁勋宣布将恢复「H20」在中国的销售,这距离4月15日美国商务部限制英伟达对华出售「H20」,已三个月整。据透露,黄仁勋在与中国政府和业界官员会面,探讨AI将如何提高生产力和扩大机遇时,表示美国政府已向NVIDIA保证将授予许可证,并且NVIDIA希望尽快启动交付。最后,他还宣布推出一款全新且完全兼容的「NVIDIA RTX PRO GPU」,称该产品“是为智能工厂和物流打造数字孪生AI的理想选择”。
阿里云联合中央电视台发布的《中国人工智能应用发展报告(2025)》
7月15日,阿里云研究院和中央广播电视总台央视频、总台研究院、总台技术局联合撰写的《中国人工智能应用发展报告(2025)》正式发布。报告提出人工智能的“654”体系,即六大技术创新趋势、五新应用落地场景和产业智能化四力评估体系,通过全景式分析框架,展现AI的行业应用全景。