2025年7月4日全球AI动态:中美竞争白热化,技术落地加速,开源生态崛起

2025年7月4日全球AI动态:中美竞争白热化,技术落地加速,开源生态崛起

小蓝灯每日AI动态

一、模型发布

  1. 昆仑万维开源第二代奖励模型 Skywork – Reward – V2 系列
2025 年 7 月 4 日,昆仑万维开源第二代奖励模型 Skywork – Reward – V2 系列。此系列共包含 8 个基于不同基座模型、参数规模从 6 亿到 80 亿不等的奖励模型。该系列在数据处理上,采用人机协同的两阶段流程,将人工标注的高质量与模型的规模化处理能力相结合,一经推出便在七大主流奖励模型评测榜单中全面夺魁。
  1. MiniMax 推出全球首个开源大规模混合架构推理模型 MiniMax – M1
上海的 AI 独角兽公司 MiniMax 正式推出全球首个开源大规模混合架构推理模型 MiniMax – M1。该模型在长文本处理和工具调用等方面显示出强大的优势,支持高达 100 万 token 的上下文输入能力,足以一次性处理整部《三体》英文原著,这一性能是 DeepSeek 同类模型的八倍,甚至可与谷歌最新的闭源模型 Gemini2.5Pro 相媲美。该模型一经推出,便迅速跻身权威评测榜单,成为全球开源模型的第二名,仅次于近期发布的 DeepSeek – R1 – 0528。
  1. 智谱发布 GLM – 4.1V – Thinking 系列模型并率先开源 GLM – 4.1V – 9B – Thinking
智谱正式发布 GLM – 4.1V – Thinking 系列模型,并率先开源 GLM – 4.1V – 9B – Thinking,标志着智谱 GLM 视觉大模型向高阶认知迈出关键一步。该模型在视频理解方面,能够解析最长两小时的视频内容,通过推理对视频中的时间、人物、事件和逻辑关系进行准确分析。
  1. 谷歌推出 Veo 3 视频生成模型
当地时间 7 月 3 日,谷歌表示,已开始向 159 个国家和地区的 Gemini 用户推出其 Veo 3 视频生成模型。通过新模型生成视频仅适用于 Google AI Pro 计划的付费订阅者,并且每天最多可生成三个视频。谷歌副总裁 Josh Woodward 表示,公司正在致力于为 Gemini 添加图像到视频生成功能。
  1. Stability AI 开源针对移动设备优化的文本到音频生成模型 Stable Audio Open Small
该模型可在 Arm CPU 上本地运行,方便在移动设备端进行文本到音频的生成操作,拓展了文本到音频生成模型在移动端的应用场景。
  1. 字节跳动开源支持上下文连续图像编辑的 VINCIE – 3B 模型
该模型基于 MM – DiT 架构开发,为图像编辑领域带来新的开源工具,有助于相关开发者进行上下文连续图像编辑的研究与应用开发。
  1. 德国知名技术咨询公司 TNG 发布 DeepSeek 的增强版 DeepSeek – TNG – R1T2 – Chimera
这标志着深度学习模型在推理效率和性能上的又一次重大突破。新版本不仅在推理效率上提升了 200%,而且通过创新的 AoE 架构显著降低了推理成本。
  1. vivo AI 研究院与港中文和上交团队联合研发的 GenieBlue 模型解决手机端多模态大模型部署难题
成功解决了手机端多模态大模型(MLLM)在部署中遇到的两大挑战,即保持纯语言任务的性能和避免 MoE 架构限制,推动了多模态大模型在手机端的应用发展。
  1. 北京航空航天大学等联合发布开源 3D 动画生成框架 AnimaX
旨在根据自然语言描述快速生成高质量的 3D 动画,为 3D 动画生成领域提供了新的开源框架,有利于降低 3D 动画制作门槛,促进相关领域发展。
  1. 谷歌 DeepMind 等推出能预测人类行为的 AI 模型 Centaur
该模型基于 Llama 3.1 语言模型(700 亿参数),并在包含 6 万名参与者、160 项实验和超过 1000 万个决策的 Psych – 101 数据集上进行额外训练。这些数据涵盖感知、记忆、逻辑思维、道德选择和不确定性决策等任务。Centaur 能够准确预测人类在新任务中的行为,例如在类似老虎机的选择游戏中,其预测准确率极高。在逻辑推理和道德困境等任务中,Centaur 的表现优于现有认知模型。研究人员还发现,Centaur 的 “内部表征” 与功能性磁共振成像(fMRI)记录的大脑活动模式高度相似,甚至比 GPT – 4 和 PaLM – 2 等模型更接近人类神经活动。Psych – 101 平台和 Centaur 本身均为开源,未来计划扩展至儿童心理学、精神病学等领域。

二、应用进展

  1. 全球首款 L3 级算力的 AI 汽车小鹏 G7 正式上市
搭载自研图灵 AI 芯片,配备 AI 智能座舱、智驾大脑 + 小脑 VLA – OL 模型、太极 AI 底盘,展示了 AI 技术在汽车领域的深度应用,提升汽车的智能化水平。
  1. OCTO 澳客发布 “智慧物流” 与 “边缘智能” 技术研发成果
  • 智慧物流:OCTO 澳客部署 AI 算法模型用于实时预测商品流动趋势、动态调整库存配置与跨境仓储调度,通过集成多维数据实现 “分钟级响应” 的智能分发,提升全球仓配效率、降低物流成本和丢件率。
  • 边缘智能:发布 “边缘智能设备网络” 部署成果,将 AI 模型嵌入至全球各地的智能仓储节点,通过边缘计算实现本地识别、本地决策、本地执行,大幅减少中心服务器压力,提升网络响应速度。目前已在新加坡、迪拜、法国马赛等关键仓储节点完成边缘智能节点部署,计划至 2026 年实现 100 个节点全面上线。
  1. 快手可灵 2.1 系列模型持续提升复杂场景视频生成能力
已深度嵌入影视、游戏、广告营销、电商、文旅等产业,未来视频生成技术将持续演进,能为具身智能提供互动仿真的环境,有助于推动产业互联网发展,助力制造业等传统行业数字化转型。

三、行业活动

  1. 2025 全球数字经济大会人工智能融合应用发展论坛举行
论坛现场发布 95 个具有代表性和创新性的典型案例,全面展示北京 “人工智能 +” 行业应用成果。
  • 北京智源人工智能研究院院长王仲远表示,当前人工智能正处于第三次发展浪潮中的一个新的拐点,原生多模态、具身智能、世界模型等未来大模型技术愈发 “风生水起”。
  • 百度副总裁阮瑜表示,整体来看,大模型的成本下降,企业端的大模型应用比例显著提升,AI 大模型应用已开始成为企业的核心生产工具。
  • 工业和信息化部科技司副司长赵超凡称将持续深化应用赋能推广,常态化开展人工智能赋能新型工业化 “深度行” 活动,遴选 “十大行业、百大场景、千家标杆”,树立标杆解决方案,引导人工智能更好赋能实体经济。
此外,论坛上一批 “揭榜挂帅” 大模型应用需求向全社会发布,北京工业软件产业创新中心自主研发的 “杨梅工业” 智能体开发和应用平台上线开源,中国工业互联网研究院启动人工智能赋能新型工业化供需对接服务平台,开源中国发布 “Gitee Xtreme 极智 AI”,中国移动发布 AI 三维能力体系。
  1. 2025 全球数字经济大会 “数字原生大会暨企业智能化论坛” 召开
由全球数字经济大会组委会主办,中国信息通信研究院与中国通信企业协会联合承办。
  • 会上公布了数字原生体系最新评估结果,24 项涵盖智能体开发应用、企业级人工智能等领域的产品或项目通过评估。
  • 发布《数字原生典型案例集 2024 – 2025》,遴选通信、金融、汽车等 10 个行业不同规模企业的数智化转型先锋实践案例,展示数字原生理念在企业各环节的应用成效与价值创新。
  • 发布《AI Cloud Agent 技术及产业应用洞察报告 (2025)》,系统解构 AI Agent 从技术底层到商业落地的全链条发展逻辑,全景呈现其在多行业多领域的场景化实践。
大会正式发起 “Agent 启智” 应用研究推进计划,公布首批 19 家成员单位。同时,正式启动《企业级 AI 应用落地建设规划和实践指南》暨《企业级人工智能成熟度评价模型 (2025)》编制工作,为企业制定 AI 应用目标和实施路径、评估智能化应用水平提供指导。会上还公布了数字原生 3.0 AI Cloud Agent 系列标准参编单位和企业级 AI 推进计划先锋企业,12 家核心参编企业和 17 家先锋企业获表彰。此外,中国电力建设企业协会与中国信通院签订合作协议,未来双方将在相关领域开展深度合作。
  1. 首届 Hitch Open 世界 AI 竞速锦标赛中国揭幕
在上海揭幕,清华大学、复旦大学等七所国内头部高校参赛。在开源仿真平台 LGSVL 搭建的 2.5 英里椭圆赛道上,各参赛高校战队通过编写完整的 AI 竞速系统,完成高达 280 公里 / 小时的模拟自动驾驶挑战。最终清华大学夺冠,湖南大学取得亚军,武汉理工大学获得季军。
Hitch Open 不仅是一场竞速,更是一场 AI 范式的演化实验,采用高度开放的技术标准,鼓励高校通过极限仿真挑战突破自动驾驶技术边界,推动 AI 算法在安全、控制、决策等多个维度走出 “沙盘”,驶入现实产业。后续赛事将走出仿真环境,挑战更具现实复杂度的天门山九十九道弯,并在 2026 赛季进一步开放参赛通道。
  1. 2025 Inclusion・外滩大会科技智能创新赛拉开帷幕
本次大赛聚焦于 AI 智能硬件、金融智能及 AI 安全等多个前沿领域的创新应用,为相关领域的创新发展提供交流与展示平台。
  1. 四川省人工智能产业应用场景发布对接大会 (泸州) 举办
四川省人工智能产业发展基金在大会上正式亮相,推动当地人工智能产业与应用场景的对接,促进产业发展。

四、其他动态

  1. 全球 AI 人才竞争白热化,DeepSeek 在领英发布招聘信息
DeepSeek 过去一周内在领英上发布了 10 个职位,这是该公司数月来首次在该平台发布招聘信息。其中包括三个专注于通用人工智能 (AGI) 的岗位,工作地点位于北京和杭州,或寻求从海外吸引人才。
  1. OpenAI 联合创始人 Ilya Sutskever 将出任 Safe Superintelligence 的 CEO
当地时间 7 月 3 日,OpenAI 联合创始人 Ilya Sutskever 在 X 上表示,他将出任 Safe Superintelligence 的 CEO。据报道,扎克伯格也曾试图全资收购 Safe Superintelligence,该公司最近的估值为 320 亿美元。
  1. 法国南特举办 AI 艺术展闭幕
2025 年 IEEE 国际多媒体与博览会(ICME)配套的首届人工智能(AI)艺术展 4 日在法国南特国际会展中心闭幕。本次 AI 艺术展以 “重构智能:艺术与人工智能的交汇” 为主题,关注 AI 时代的科技与文化融合。大量作品来自青年创作者,涵盖绘画、互动装置、影像、音乐和文学等多种形式。
举办该展览有两大核心使命:
  • 一是让艺术家与科学家在同一空间对话,思考 “AI 能做什么”,打破 “AI 会取代人” 的焦虑,展示 AI 可成为激发创意的工具;
  • 二是向大众敞开科研之门,让他们亲身体验、提问和了解 AI 技术的真实进展。
  1. 腾讯元宝功能升级
新增一句话搜索图片和视频号内容功能,支持智能匹配和视频号教程引用,提升用户在图片和视频号内容搜索方面的便捷性。
  1. Bilibili 开源动漫视频生成模型 AniSora V3 迎来重大更新
显著提升了生成质量、动作流畅度和风格多样性,为动漫视频生成领域带来更好的开源模型支持。
  1. LiblibAI 推出 AI 设计创作 agent Lovart 国内版本 “星流 agent”
集成多模态模型,优化中文字体支持,可一站式生成图像、音频、视频、3D 模型,以无限画布的形式呈现,为国内用户提供新的 AI 设计创作工具。
  1. 根据毕马威中国报告,中国在全球医疗大模型发布数量上占比超 70%
展现了中国在智能医疗领域的快速发展,也反映了大语言模型在医疗行业的广泛应用。
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...