AIPress.com.cn报道
2月9日消息,据智能纪元AGI获悉,小红书正在研发一款基于 AI 智能体的视频剪辑产品 OpenStoryline。
据悉,OpenStoryline 的核心思路是将视频剪辑流程智能体化。用户可通过上传少量图片或素材,并以自然语言对话的方式,驱动系统完成视频生成。产品设计中包含分镜规划与独立片段生成能力,同时结合内容理解模块,在剪辑完成后可自动生成配套文案,并匹配背景音乐,整体流程强调“非线性编辑 + 对话驱动”。
从产品形态上看,OpenStoryline 与字节跳动即梦体系中的“小云雀”、商汤科技的 Seko 2.0 等 AI 视频创作工具在方向上较为接近,在定位上均倾向于“内容创作 Agent”,由 AI 统一理解创作意图并完成多步骤生成,而非单纯提供模板或素材拼接能力。
在底层模型选择上,OpenStoryline 主要采用开源基座模型进行能力构建。据了解,该项目引入了 DeepSeek 开源大语言模型,以及阿里云通义千问 Qwen 3 系列 80 亿参数的开源多模态模型,用于支撑文本理解、多模态生成与任务规划等关键能力。
小红书对生成式 AI 的态度已从早期的探索与支持创作者工具,逐步转向更深度的参与。2024 年 12 月底,小红书推出独立 AI 搜索应用“点点”,并在 App 内测试搜索新功能“问点点”,强调以“及时信息”和“真实用户声音”为核心的决策支持能力。在此之前,小红书已陆续上线 AI 搜索对话助手“达芬奇”和搜索智能助手“搜搜薯”。
在技术体系方面,小红书曾披露其 AI 架构主要由五个部分构成:AI 基础设施(Infra)、基础模型、内容理解与创作、信息分发以及社区治理。公司在该体系中既对开源模型进行微调,也构建自有模型,用于内容理解、推荐排序与个性化推送。同时,小红书已形成包括文本大模型 dots.lm、多模态模型 dots.vm、音频模型 FireRedASR、图像编辑模型 instantID,以及 LarC 机器学习平台、QS 大模型生产部署平台在内的较完整技术栈,并在搜索、推荐、广告、电商交易与多语言场景中持续应用。
下一篇:没有了