哔哩哔哩自研语音生成大模型IndexTTS-2.0 正式开源_科学探索

哔哩哔哩自研语音生成大模型IndexTTS-2.0 正式开源

创始人

2025-09-09 18:49:06

IT之家 9 月 9 日消息，B站（Bilibili）昨日（9 月 8 日）发布公告，宣布正式开源其自研语音生成大模型 IndexTTS-2.0，是首个支持精确时长控制（Duration Control）的自回归（Autoregressive）零样本文本转语音（TTS）系统。

IT之家援引 GitHub 页面介绍，相比较传统逐 token 生成的 TTS 系统，IndexTTS-2.0 首次在自回归架构中实现了精准时长控制，特别适合视频配音等需严格音画同步的应用场景。

据介绍，IndexTTS2 支持两种生成模式：

一种可通过明确指定生成的 token 数实现精确时长控制；
另一种则自由生成，保持输入提示的韵律特征。

在声音表达上，IndexTTS2 实现了情感特征与说话人音色的解耦（Emotion-Speaker Disentanglement）：分离说话人音色与情绪特征，分别控制。

这意味着用户可以独立指定音色来源和情绪来源，例如用一段音频保留音色，再用另一段不同情感的音频或文本描述赋予情绪，在零样本条件下，模型能精准还原目标音色并完全重现指定情绪。

为提升高情感表达下的语音清晰度，团队引入了 GPT 潜在表示，并设计三阶段训练策略增强生成稳定性。此外，他们基于 Qwen3 微调实现了“软指令”机制，允许用户通过自然语言描述来直观控制情绪方向，降低使用门槛。

在技术性能上，多数据集实验表明，IndexTTS2 在词错率、说话人相似度和情绪保真度上均超越当前最先进零样本 TTS 模型。其方法具备良好扩展性，可应用于其他大型自回归 TTS 系统。团队表示，将公开代码和预训练权重，推动学术研究与产业落地。

技术报告地址：https://arxiv.org/abs/2506.21619
仓库地址：https://github.com/index-tts/index-tts
Demo 展示地址：https://index-tts.github.io/index-tts2.github.io

控制 GitHub 情感模型语音样本情绪系统 IndexTTS- 音色 https token

⚠️

本网站信息内容及素材来源于网络采集或用户发布，如涉及侵权，请及时联系我们，发送链接至2697952338@QQ.COM，我们将第一时间进行核实与删除处理。

上一篇：人工智能行业专家：中国企业将开源视为信仰而非策略

下一篇：开源证券给予极米科技买入评级：新增持股计划，聚焦净利率及境外市场营收提升

热门资讯

四川常阳工会直播间旭东老师讲课... 本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合 “原始股”因常被贴...

策马奔腾直播间生物医学中医药调... 本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合近年来，各类网络投...

上海亚商投顾29800服务费能... 如果你知道哪只股票会涨，你会把这只股票分享给别人吗？那些老师要是炒股真的那么精准，早就自己做股票了，...

精英汇课堂战略布局战略合作方式... 本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合。现如今，网络直播荐...

小鹅通直播间灯塔驿站旭东老师摇... “本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合。" 随着资本市场...

深圳市居.易文化传播有限公司直... 本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合。最近总有人在微信...

贵州中科分子生物有限公司原始股... 本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合。在资本浪潮涌动的...

精英汇课堂战略布局战略合作方式... 本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合近年来，以“直播间...

贵州中志浩刺梨工坊原始股认购2... “本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合。" 随着资本市场...

在犀牛订购APP贵金属订购上输... 　　在犀牛订购APP贵金属订购上输的钱可以追回多少?答案：可以退！虚假期货交易诱导充值造成亏损,教...

国诚投顾付费了可以退吗?办理会... 追损法援寄语：望所有投资者谨慎投资，远离不正规平台，远离所谓的分析师带单，已经不幸陷入的受.害者应在...

浙江五养堂药业有限公司经销商战... 本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合近年来，各类网络投...

广东聚沃贸易有限公司直播间摇号... 本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合。“原始股”因承载“...

江苏恒健源数字科技有限公司直播... 本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合。在资本浪潮涌动的...

刺梨工坊(贵州)科技有限公司原... 本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合。现如今，网络直播荐...

龙马公会旭东老师直播间推荐股民... 本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合。“原始股”因承载“...

湖南侗都生物科技公司买侗藏红米... “本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合。" 随着资本市场...

海能投顾服务费怎么退?收费荐股... 能够搜索到这篇文章的，一般都是在海能投顾交了费吃了亏的，为什么会吃亏呢？也就是交了服务费了。告诉大家...

在天-天白银APP 铂金/白银... 在天-天白银APP 铂金/白银订购亏损了怎么追回来?能全额！诱导消费者导致亏损惨重,教你一个简单方法...

深圳迎宾品牌发展有限公司直播间... 本文专注投资风险普法教育，不针对任何企业及个人。文中所有案例均为模拟情景推演，仅作反诈科普警示使用，...

深圳中酒颐和品牌签署经销商股权... 本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合。在资本浪潮涌动的...

深圳中酒并购大唐酒业战略认购公... “本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合。" 随着资本市场...

股掌柜会员退费流程公布！可以退... 追损语录：如果真的有那么好的实力，他们还收这点服务费？不是早就赚的盆满钵满了？有时候不是道理太难懂，...

四川华太以色信息科技有限公司经... 本文旨在进行投资风险教育，不针对任何特定企业。以下案例为拟情景，如有雷同纯属巧合。当前，以“直播间...

哔哩哔哩自研语音生成大模型IndexTTS-2.0 正式开源

相关内容

热门资讯