腾讯研究院AI速递 20251014_科学探索

腾讯研究院AI速递 20251014

创始人

2025-10-14 07:14:35

生成式AI

一、刚刚，OpenAI官宣自研AI芯片！博通股价飙涨10%

1. OpenAI与博通达成战略合作，将部署100亿瓦OpenAI设计的定制AI芯片，博通计划2026年下半年开始部署并于2029年底完成；

2. 这是OpenAI一个月内与第三家芯片巨头的重磅交易，此前已宣布英伟达1000亿美元投资和AMD 60亿瓦GPU部署协议；

3. Sam Altman透露双方过去18个月一直在设计新芯片，使用OpenAI自己的模型参与设计，消息公布后博通股价一度涨超10%。

二、谷歌Gemini 3.0「全家桶」更新预告，前端不再需要人类

1. 谷歌Gemini 3.0预计10月22日发布，内测人士放出惊艳demo显示其前端开发能力强大，可一键直出网页、游戏、原创音乐等；

2. Gemini 3.0采用MoE架构超万亿参数每次查询激活150-200亿参数，上下文从100万跃升至数百万token，可处理整本书和代码库；

3. 内测显示Gemini 3.0在"骑自行车的鹈鹕"等前端测试中表现断档领先，甚至可生成3D版本像素艺术，2025年9月Gemini环比增长率达46.24%。

三、 LiblibAI 2.0升级，定位打造创作者的 AI 专业创作工作室

1. LiblibAI（哩布哩布）2.0升级接入海螺、通义万相、可灵、Pixverse、vidu等10+个热门视频模型和大量生图模型，站内完成所有AI创作；

2. 新增视频特效一键同款功能，接入Midjourney V7、Qwen-image、Seedream 4.0等常用生图模型，支持图生视频无缝切换；

3. 增加资产管理菜单和AI工具箱入口，集合高清放大、抠图、产品精修等大量模型工作流，为新老用户提供一站式AI体验。

四、 Mamba的最新进化版本Mamba-3来了，ICLR 2026

1. Transformer最有力继任者Mamba的第三代版本Mamba-3已进入ICLR 2026盲审，采用梯形规则离散化、复数状态空间、多输入多输出设计三大创新；

2. Mamba-3通过引入复数隐状态实现"钟摆"记忆能够处理周期模式和奇偶校验，MIMO设计显著提高算术强度使GPU满负荷运行；

3. 在超长上下文信息检索测试NIAH中表现优异，推理延迟大幅降低，适合长文本处理、实时交互和边缘计算等应用场景。

五、 SAM 3分割一切的下一步：理解「概念」，ICLR 2026

1. 疑似Meta推出的SAM 3论文登陆ICLR 2026，实现可提示概念分割（PCS），用户通过简单名词短语或图像范例即可分割所有匹配实例；

2. SAM 3在SA-Co基准上性能比之前系统提升至少2倍，在LVIS数据集零样本掩码平均精度达47.0超越之前38.5纪录；

3. 采用双编码器-解码器Transformer架构，构建包含400万独特短语和5200万掩码的高质量训练数据，单H200 GPU处理100+物体图像仅需30毫秒。

六、谷歌的ReasoningBank记忆框架，扩展AI自我进化范式

1. 谷歌提出ReasoningBank创新记忆框架，从智能体成功和失败经验中提炼记忆项形成闭环自我进化系统，无需真实标签即可学习；

2. 引入记忆感知的测试时扩展（MaTTS）通过并行和顺序设置生成多样探索，使ReasoningBank合成更具普遍性的记忆实现协同效应；

3. 在WebArena、Mind2Web和SWE-Bench-Verified基准测试中，ReasoningBank有效性相对提高达34.2%，交互步骤减少16.0%。

七、大模型追逐星辰大海，GPT和Gemini国际天文奥赛夺金

1. 最新研究显示GPT-5和Gemini 2.5 Pro在国际天文学和天体物理学奥林匹克竞赛(IOAA)中均获金牌成绩，GPT-5在理论考试平均得分84.2%；

2. 两大模型在理论考试表现优于当届最佳学生，但在几何/空间问题上准确率(49-78%)明显低于物理/数学问题(67-91%)；

3. 这标志着AI不仅在数学领域具有强推理能力，也在天文、天体物理等多科学领域展现出接近顶尖人类水平的综合能力。

前沿科技

八、 Unitree G1 功夫小子 V6.0最新进展，多个高难度动作展示

1. 宇树G1机器人展示空中翻转、连续后空翻、单手侧后翻等高难度动作，并演示功夫拳法和顶膝动作；

2. 宇树科技计划今年下半年推出身高1.8米的人形机器人，公司已申请近10项人形机器人相关专利；

3. 王兴兴透露今年上半年国内机器人行业平均增长率达50%-100%，算法升级后机器人理论上可完成各种舞蹈和武术动作。

九、苹果AI眼镜曝光，兼容iPhone、Mac，搭载visionOS

1. 彭博社报道苹果智能眼镜可能与Mac配对时运行完整visionOS，与iPhone配对时切换至轻便移动界面，计划2026-2027年发布；

2. 苹果已放弃开发更轻便的"Vision Air"头戴设备，将工程师精力集中转向智能眼镜开发，直接对标Meta的Ray-Ban Display；

3. 第一代产品将不配备显示功能，但包含音乐扬声器、摄像头、语音控制和可能的健康功能，未来将形成多层次产品线。

报告观点

十、 Sam Altman：能被ChatGPT消灭的工作不是真正的工作

1. Altman在最新采访中表示AI会改变工作性质但不会消灭真正的工作，未来工作形式可能更轻松但人类内在驱动力依然存在；

2. 关于GPT-6开发，重点是更智能的模型、更长上下文和更好记忆能力，Codex已能完成整天任务，一周级任务也不远了；

3. OpenAI当前每周活跃用户达8亿，Altman认为语音不是AI交互最终形式，团队正在研发全新语音交互设备但短期内不会透露。

宇树速递机器人模型记忆 OpenAI 设计的 Sam 动作 Gemini Altman Mamba 博通

⚠️

本网站信息内容及素材来源于网络采集或用户发布，如涉及侵权，请及时联系我们，发送链接至2697952338@QQ.COM，我们将第一时间进行核实与删除处理。

上一篇：人工智能（AI）图片生成器Black Forest Labs Inc.洽谈按32.5亿美元估值融资

下一篇：环球圆桌对话：欧盟为何在AI领域“亮旗”？

腾讯研究院AI速递 20251014

相关内容

热门资讯