生成式AI
一、 刚刚,OpenAI官宣自研AI芯片!博通股价飙涨10%
1. OpenAI与博通达成战略合作,将部署100亿瓦OpenAI设计的定制AI芯片,博通计划2026年下半年开始部署并于2029年底完成;
2. 这是OpenAI一个月内与第三家芯片巨头的重磅交易,此前已宣布英伟达1000亿美元投资和AMD 60亿瓦GPU部署协议;
3. Sam Altman透露双方过去18个月一直在设计新芯片,使用OpenAI自己的模型参与设计,消息公布后博通股价一度涨超10%。
二、 谷歌Gemini 3.0「全家桶」更新预告,前端不再需要人类
1. 谷歌Gemini 3.0预计10月22日发布,内测人士放出惊艳demo显示其前端开发能力强大,可一键直出网页、游戏、原创音乐等;
2. Gemini 3.0采用MoE架构超万亿参数每次查询激活150-200亿参数,上下文从100万跃升至数百万token,可处理整本书和代码库;
3. 内测显示Gemini 3.0在"骑自行车的鹈鹕"等前端测试中表现断档领先,甚至可生成3D版本像素艺术,2025年9月Gemini环比增长率达46.24%。
三、 LiblibAI 2.0升级,定位打造创作者的 AI 专业创作工作室
1. LiblibAI(哩布哩布)2.0升级接入海螺、通义万相、可灵、Pixverse、vidu等10+个热门视频模型和大量生图模型,站内完成所有AI创作;
2. 新增视频特效一键同款功能,接入Midjourney V7、Qwen-image、Seedream 4.0等常用生图模型,支持图生视频无缝切换;
3. 增加资产管理菜单和AI工具箱入口,集合高清放大、抠图、产品精修等大量模型工作流,为新老用户提供一站式AI体验。
四、 Mamba的最新进化版本Mamba-3来了,ICLR 2026
1. Transformer最有力继任者Mamba的第三代版本Mamba-3已进入ICLR 2026盲审,采用梯形规则离散化、复数状态空间、多输入多输出设计三大创新;
2. Mamba-3通过引入复数隐状态实现"钟摆"记忆能够处理周期模式和奇偶校验,MIMO设计显著提高算术强度使GPU满负荷运行;
3. 在超长上下文信息检索测试NIAH中表现优异,推理延迟大幅降低,适合长文本处理、实时交互和边缘计算等应用场景。
五、 SAM 3分割一切的下一步:理解「概念」,ICLR 2026
1. 疑似Meta推出的SAM 3论文登陆ICLR 2026,实现可提示概念分割(PCS),用户通过简单名词短语或图像范例即可分割所有匹配实例;
2. SAM 3在SA-Co基准上性能比之前系统提升至少2倍,在LVIS数据集零样本掩码平均精度达47.0超越之前38.5纪录;
3. 采用双编码器-解码器Transformer架构,构建包含400万独特短语和5200万掩码的高质量训练数据,单H200 GPU处理100+物体图像仅需30毫秒。
六、 谷歌的ReasoningBank记忆框架,扩展AI自我进化范式
1. 谷歌提出ReasoningBank创新记忆框架,从智能体成功和失败经验中提炼记忆项形成闭环自我进化系统,无需真实标签即可学习;
2. 引入记忆感知的测试时扩展(MaTTS)通过并行和顺序设置生成多样探索,使ReasoningBank合成更具普遍性的记忆实现协同效应;
3. 在WebArena、Mind2Web和SWE-Bench-Verified基准测试中,ReasoningBank有效性相对提高达34.2%,交互步骤减少16.0%。
七、 大模型追逐星辰大海,GPT和Gemini国际天文奥赛夺金
1. 最新研究显示GPT-5和Gemini 2.5 Pro在国际天文学和天体物理学奥林匹克竞赛(IOAA)中均获金牌成绩,GPT-5在理论考试平均得分84.2%;
2. 两大模型在理论考试表现优于当届最佳学生,但在几何/空间问题上准确率(49-78%)明显低于物理/数学问题(67-91%);
3. 这标志着AI不仅在数学领域具有强推理能力,也在天文、天体物理等多科学领域展现出接近顶尖人类水平的综合能力。
前沿科技
八、 Unitree G1 功夫小子 V6.0最新进展,多个高难度动作展示
1. 宇树G1机器人展示空中翻转、连续后空翻、单手侧后翻等高难度动作,并演示功夫拳法和顶膝动作;
2. 宇树科技计划今年下半年推出身高1.8米的人形机器人,公司已申请近10项人形机器人相关专利;
3. 王兴兴透露今年上半年国内机器人行业平均增长率达50%-100%,算法升级后机器人理论上可完成各种舞蹈和武术动作。
九、 苹果AI眼镜曝光,兼容iPhone、Mac,搭载visionOS
1. 彭博社报道苹果智能眼镜可能与Mac配对时运行完整visionOS,与iPhone配对时切换至轻便移动界面,计划2026-2027年发布;
2. 苹果已放弃开发更轻便的"Vision Air"头戴设备,将工程师精力集中转向智能眼镜开发,直接对标Meta的Ray-Ban Display;
3. 第一代产品将不配备显示功能,但包含音乐扬声器、摄像头、语音控制和可能的健康功能,未来将形成多层次产品线。
报告观点
十、 Sam Altman:能被ChatGPT消灭的工作不是真正的工作
1. Altman在最新采访中表示AI会改变工作性质但不会消灭真正的工作,未来工作形式可能更轻松但人类内在驱动力依然存在;
2. 关于GPT-6开发,重点是更智能的模型、更长上下文和更好记忆能力,Codex已能完成整天任务,一周级任务也不远了;
3. OpenAI当前每周活跃用户达8亿,Altman认为语音不是AI交互最终形式,团队正在研发全新语音交互设备但短期内不会透露。