最新内容
查看全部资讯
阿里通义实验室 CosyVoice 2.0 开源,流式语音克隆能力大幅提升
CosyVoice 2.0 在流式语音合成、零样本语音克隆和情感控制方面取得重大突破,已在 GitHub 上开源。
2024/9/1
资讯
Fish Speech 1.4 发布,中文 TTS 质量再上新台阶
Fish Speech 1.4 版本在多说话人音色一致性、中文韵律自然度和推理速度上均有显著提升。
2024/8/1
技术文章
TTS 在无障碍领域的应用:让信息触达每一个人
TTS 技术如何帮助视障人士、阅读障碍者和老年人获取信息,以及相关的辅助技术标准和最佳实践。
2024/7/15
技术文章
自部署 TTS vs 云端 TTS API:成本、性能与隐私全面对比
深入分析自部署开源 TTS 模型与使用云端 TTS API 的成本、延迟、音质、隐私保护和维护复杂度差异。
2024/7/1
资讯
OpenAI 发布 GPT-4o 实时语音模式,TTS 交互进入新纪元
GPT-4o 实时语音模式支持端到端语音对话,延迟降低至 200ms 级别,标志着 AI 语音交互进入全新阶段。
2024/7/1
技术文章
TTS 技术如何重塑游戏行业:从 NPC 对话到动态配音
探索 TTS 技术在游戏开发中的应用,包括实时 NPC 对话生成、用户生成内容配音、多语言本地化等场景。
2024/6/15