北京商报讯(记者 陶凤 实习记者 王天逸)2025年9月1日,无问芯穹官方公众号发布消息称,公司联合清华大学、北京中关村学院,并携手北京大学、加州大学伯克利分校等机构,正式开源首个面向具身智能的“渲训推一体化”大规模强化学习框架RLinf,为人工智能从“感知”向“行动”跨越提供关键技术支撑。
据了解,RLinf名称中“inf”既代表“infrastructure”(基础设施),也寓意“infinite”(无限扩展),核心解决当前框架对具身智能支持受限的问题。相比纯推理大模型,具身智能需兼顾“大脑”(推理规划)与“小脑”(执行操作),且存在“渲训推一体化”特性,对算力、显存及框架灵活性要求更高。RLinf通过六大层级(用户层、任务层、执行层、调度层、通信层、硬件层)设计,针对性突破技术难点。