Kokoro 82M 文本转语音 AI 模型

Kokoro 82M 是一款利用 StyleTTS 2 和 ISTFTNet 架构的先进文本转语音（TTS）模型。该模型在 Apache 2.0 许可下发布，结合了紧凑的尺寸和无与伦比的性能，提供美式和英式英语的高质量语音合成。

模型输入

选择模型Special Spanish sound models are available now, try it!

提示词*

0/800

Voice

允许公开显示创作。

尚未生成声音

af_heartScene 8 – The Finish...

Generated on 8/30/2025

pf_doraInterprete o texto a...

Generated on 9/19/2025

af_heartThe first time i go...

Generated on 10/11/2025

pf_doraDescubra o poder de ...

Generated on 8/25/2025

am_michaelShe was home alone w...

Generated on 8/1/2025

ff_siwissalut ma poule...

Generated on 8/16/2025

af_heartScene 8 – The Finish...

Generated on 8/29/2025

ff_siwisBonjour depuis Sherp...

Generated on 11/13/2025

ff_siwisHello, comment vas-t...

Generated on 5/28/2025

jf_alphaいつご利用いただき、誠にありがとうござい...

Generated on 6/21/2025

Kokoro 82M 因其高效的架构、仅 8200 万参数的紧凑尺寸和高性能而脱颖而出。它在开源和商业可行性方面超越了 MetaVoice（12 亿参数）和 XTTS（4.67 亿参数）等更大的模型。

是的，Kokoro 82M 在 Apache 2.0 许可下发布，非常适合商业应用。它提供了可靠、高质量的 TTS 解决方案，没有专有限制。

Kokoro 82M 支持美式英语和英式英语。您可以选择特定的语音包，如 Bella、Sarah、Adam 等，以匹配您偏好的口音。

Kokoro 82M 轻量级，可在消费级硬件上运行。它支持 GPU 和 CPU 配置，ONNX 版本为实时应用提供了更广泛的兼容性。

目前，Kokoro 82M 针对英语文本到语音合成进行了优化。然而，其架构有潜力通过额外的训练数据支持其他语言。

由于训练数据集有限（<100 小时），Kokoro 82M 目前不支持语音克隆，但其现有的语音包为特定语音风格提供了卓越的质量。