MIAOYUN | 每周AI新鲜事儿 250620

紧跟技术浪潮,洞察行业未来,MIAOYUN《每周AI新鲜事儿》,为您精选全球AI领域的最新动态,涵盖AI技术突破、行业动态、趋势发展、前沿政策与学术研究,带您走在智能时代前沿,一起来回顾本周发生的AI新鲜事儿吧!

AI开源大模型

腾讯混元3D 2.1大模型全链路开源

6月14日,在CVPR 2025(计算机视觉领域顶会之一)上,腾讯混元3D 2.1大模型对外全链路开源,其模型权重及架构、训练代码、数据处理流程等全部开放。这也是混元3D模型首次实现全链路开源,开发者不仅可以调用模型,还能了解其训练过程、设计原理,并根据自身需求进行二次训练或微调。

混元3D 2.1支持一站式自动生成高质量的3D模型,包括几何结构和PBR物理材质纹理,适配于消费级显卡,不再需要昂贵的专业设备,个人电脑也能“跑”。

全球首个开源混合架构推理模型MiniMax-M1正式发布

6月17日,国产大模型独角兽MiniMax发布全球首个开源大规模混合架构推理模型M1,支持目前业内最高的100万上下文的输入,整个强化学习阶段只用到512块H800三周的时间,租赁成本只有53.47万美金。

M1的卓越性能,得益于其独创的闪电注意力机制(Lightning Attention)和强化学习算法CISPO,显著提升算力效率和强化学习效率,如:8万Token的深度推理仅需DeepSeek R1约 30%算力。目前,完整的M1模型权重、技术报告均已在Hugging Face和GitHub上开放获取。

开源代码模型Kimi-Dev-72B创下开源新纪录

6月17日,月之暗面推出针对软件工程任务的全新开源代码大模型Kimi-Dev-72B。在所有开源模型中,Kimi-Dev-72B在SWE-bench Verified编程基准测试中取得了60.4%的成绩,创下开源模型的新纪录,以仅72B的参数量,成绩超过了刚于5月28日发布、参数量多达671B的新版DeepSeek-R1。

松下发布OmniFlow多模态大模型,实现文本、图像与音频自由切换

6月17日,全球知名电器品牌松下推出了多模态大模型OmniFlow,能够高效处理包括文本到图像、文本到音频、音频到图像等多种模态之间的任意到任意生成任务。OmniFlow采用模块化设计理念,允许各个组件独立进行预训练,经预训练后的组件可根据需求灵活组合并微调,提高训练效率和模型扩展性。

技术突破

首颗超高并行光计算集成芯片“流星一号”问世

6月18日,中国科学院上海光学精密机械研究所空天激光技术与系统部谢鹏研究员团队在解决“光芯片上高密度信息并行处理”难题上取得突破,研制出超高并行光计算集成芯片“流星一号”,首次在光芯片上实现超 100 并行度的光子计算,创造了领域新纪录。

AI Agent

百度地图全球首发「司机智能体」,上路即⾃由

6月14日,百度地图全球首发「司机智能体」,支持自由指路、路名定制、偏好路线、多点规划等功能。该智能体允许用户随时调整行驶指令,灵活变更路线方案,并支持自定义行程规划和路名导航,同时具备路线记忆、百科问答等实用功能。目前手机用户升级至百度地图最新版即可免费使用,车机版暂未上线。

混沌发布首款AI商业咨询AI Agent

6月18日,混沌推出首款AI商业咨询AI Agent「混沌AI咨询师」,内置混沌深度创新框架(DIM)、BLM模型,支持调用“思维模型智能体”(如SWOT、波特五力)和“专家智能体”(模拟芒格、乔布斯等),通过AI智能分析业务问题,15分钟生成全套咨询方案,帮助企业突破认知边界,实现0-1创新增长。

MiniMax正式推出AI超级智能体MiniMax Agent

6月19日,MiniMax Week第三天正式推出AI超级智能体MiniMax Agent,一个能完成长程(Long Horizon)复杂任务的通用智能体,也就是能多步规划出专家级解决方案、能灵活拆解任务需求、并能执行多个子任务从而交付最终结果。

AI工具

Clacky AI打造L3级别的Agentic AI编程助手

6月16日,由中国团队开发的AI编码工具Clacky AI开启内测。Clacky AI是面向开发者的云端开发环境(CDE),打造L3级别的Agentic AI编程助手。Clacky AI支持全栈开发,基于结构化任务拆解、多线程协作、自我排查与修复等功能,帮助开发者快速从创意构建迭代出实际可用的系统,并提供可视化“时光机”回溯功能,支持用户回溯到任意一个节点,保留每个任务节点的完整上下文状态。

字节跳动豆包上线“AI播客”功能,一键生成双人对话节目

6月17日,字节跳动旗下智能助手豆包正式在电脑版及网页端全量上线“AI播客”功能,用户只需上传PDF文档或网页链接,即可一键生成由两位AI主播演绎的对话式播客节目。

腾讯元宝电脑版上线AI编程模式,一句话写代码

6月17日,腾讯元宝电脑版上线AI编程模式,使用DeepSeek V3模型,通过@AI编程,一句话提交开发需求。AI编程模式支持双栏展示界面,左侧提需求,右侧实时显示代码,支持HTML即时预览和Python、C++、Java等多种语言在线运行。

红杉中国正式开源AI基准测试xbench评测集

6月18日,红杉中国正式开源其AI基准测试工具xbench的两个评测集xbench-ScienceQA和xbench-DeepSearch。红杉中国表示,未来将基于大模型和AI Agent的发展情况不断动态更新评测集,并且采用“黑白盒”机制,既保证xbench的发展可以服务更多的大模型和Agent开发者,同时尽力避免静态评测集经常出现的过拟合问题,确保xbench的长期有效。

DeepSite V2上线,一句话建网页、做动画、改样式

6月19日,开源社区明星项目DeepSite今日发布V2版本,并搭载了最新的DeepSeek R1‑0528推理模型。这个被社区用户称为“网页版Cursor”的项目,主打轻量化的对话式编程体验:不需要下载安装、也无需本地环境配置,用户只需通过文字提示,即可生成、预览并迭代网站页面,目前平台已在Hugging Face免费开放。

AI市场及趋势

迪士尼与环球影业联合起诉AI绘画平台Midjourney

6月14日,迪士尼与环球影业正式起诉AI绘画平台Midjourney,指控其对《辛普森一家》《星球大战》等作品中的角色和艺术风格进行侵权复制。这起诉讼是好莱坞主流制片厂首次对 AI 公司发起的版权侵权诉讼,争议核心在于 Midjourney 图像生成模型的训练方式,其被指非法抓取受版权保护的内容。

OpenAI获14亿大单,开发AI工具应对国家安全挑战

6月17日,美国国防部宣布,已授予ChatGPT的开发商OpenAI一份价值2亿美元(注:现汇率约合14.37亿元人民币)的合同,旨在为其开发前沿人工智能原型能力,以应对作战和企业领域的关键国家安全挑战。美国国防部表示,相关工作将主要在华盛顿及其周边地区开展,预计于2026年7月完成。

OpenAI CEO揭秘硅谷AI人才争夺战,并预测未来AI 将发现新科学

6月17日,OpenAI联合创始人兼首席执行官Sam Altman罕见地做客了亲兄弟Jack Altman主持的《Uncapped》播客。对话中,Sam Altman透露Meta平台曾试图以提供高达1亿美元的签约奖金,以及更高的年度薪酬方案挖走OpenAI的员工,以充实其AGI团队,但OpenAI最优秀的人才并没有接受报价跳槽。在介绍OpenAI独特的创新文化与未来野心时,他预测,未来到十年,AI 将能够自主进行科学研究,发现新的物理现象,甚至可能首先在数据量巨大的天体物理学领域实现突破。

阿里云在欧洲上线多款AI产品和增设数据中心,以应对全球AI需求增长

6月18日,阿里云在法兰克福节点上线一系列AI相关产品,涵盖计算、安全合规等能力模块,以服务当地快速增长的AI应用需求。同时,阿里云联合埃森哲、菜鸟推出面向高奢零售与物流行业的智能解决方案,进一步加强在欧洲的行业拓展与生态合作。19日,阿里云宣布将在韩国的第二座数据中心,以满足生成式AI快速发展带来的需求增长。

IBM研究:AI智能体应用崛起,预计AI支持的工作流程将激增 8倍

6月19日,据IBM中国消息,IBM商业价值研究院一项最新研究表明:企业将大规模部署AI 驱动的工作流,其中许多由AI智能体驱动,助推决策优化与自动化进程。这项针对全球 2900名高管的《AI 从项目到盈利》调研显示,预计 2025年,人工智能支持的工作流程将激增 8倍,人工智能体将提高流程效率、降低成本并改变工作流程。

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×