2024/9/1·阿里巴巴
阿里通义实验室 CosyVoice 2.0 开源,流式语音克隆能力大幅提升
CosyVoice 2.0 在流式语音合成、零样本语音克隆和情感控制方面取得重大突破,已在 GitHub 上开源。
阅读原文 →TTS 领域最新动态、产品发布与行业热点。
CosyVoice 2.0 在流式语音合成、零样本语音克隆和情感控制方面取得重大突破,已在 GitHub 上开源。
阅读原文 →Fish Speech 1.4 版本在多说话人音色一致性、中文韵律自然度和推理速度上均有显著提升。
阅读原文 →GPT-4o 实时语音模式支持端到端语音对话,延迟降低至 200ms 级别,标志着 AI 语音交互进入全新阶段。
阅读原文 →ChatTTS 在 GitHub 上持续获得大量关注,其对话式语音合成能力引领中文开源 TTS 发展。
阅读原文 →OpenAI 在 GPT-4o 中集成了原生 TTS 能力,支持多语言语音合成和情感表达,API 正式上线。
阅读原文 →