Kokoro 82M テキスト・トゥ・スピーチAIモデル

Kokoro 82Mは、StyleTTS 2とISTFTNetアーキテクチャを活用した最先端のテキスト・トゥ・スピーチ（TTS）モデルです。Apache 2.0ライセンスでリリースされており、コンパクトなサイズと並外れたパフォーマンスを兼ね備え、米国英語と英国英語で高品質な音声合成を提供します。

モデル入力

モデルを選択Special Spanish sound models are available now, try it!

プロンプト*

0/800

Voice

作成物を公開表示することが許可されています。

まだサウンドが生成されていません

pm_santaTeste de áudio. Mens...

Generated on 12/2/2025

am_michaelBiometric Attendance...

Generated on 6/5/2025

ff_siwisKokoro AI, with just...

Generated on 6/11/2025

pm_santaVocê já ouviu falar ...

Generated on 9/4/2025

af_heartDonald trump is gre...

Generated on 11/4/2025

ff_siwisHey salut

Generated on 9/28/2025

em_alexEsto es una prueba d...

Generated on 11/12/2025

zm_yunyang贞观十三年（639年）李世民曾对尉迟敬德...

Generated on 5/28/2025

pf_dorasou brasileiro...

Generated on 10/7/2025

pf_doraBem, saudações 🖖, s...

Generated on 12/1/2025

Kokoro 82Mは、効率的なアーキテクチャ、わずか8200万のパラメータというコンパクトなサイズ、そして高いパフォーマンスで際立ちます。12億パラメータのMetaVoiceや4億6700万パラメータのXTTSなどの大規模なモデルを上回り、オープンソースで商用利用も可能です。

はい、Kokoro 82MはApache 2.0ライセンスで提供されており、商用アプリケーションに最適です。独自の制限なしに信頼性の高い高品質なTTSソリューションを提供します。

Kokoro 82Mは米国英語と英国英語の両方をサポートしています。好きなアクセントに合わせて、Bella、Sarah、Adamなどの特定のボイスパックを選択できます。

Kokoro 82Mは軽量で、一般的なコンシューマー向けハードウェアで実行できます。GPUとCPUの両方のコンフィギュレーションをサポートしており、ONNXバージョンはリアルタイムアプリケーションに対してさらに幅広い互換性を提供します。

現在、Kokoro 82Mは英語のテキスト・トゥ・スピーチ合成に最適化されています。ただし、追加の学習データを使用することで、他の言語をサポートする可能性があります。

現在、Kokoro 82Mは学習データセットが限られている（100時間未満）ため、ボイスクローニングをサポートしていません。ただ、既存のボイスパックは特定のボイススタイルに対して優れた品質を提供します。