Coqui TTS — Libreria TTS avanzata con XTTS-v2 e clonazione vocale — azienda chiusa, fork community attivo da Idiap

Libreria TTS avanzata con XTTS-v2 e clonazione vocale — azienda chiusa, fork community attivo da Idiap

Model Serving & Local Inference Dual license Avanzato

Coqui TTS è una libreria Python avanzata per TTS che implementa numerosi modelli (XTTS-v2, Bark, VITS, Tacotron2, ecc.) con supporto a voice cloning zero-shot, clonazione multilingue e fine-tuning. Il repo originale (coqui-ai/TTS) è tecnicamente non-archived su GitHub ma non riceve commit dall'inizio del 2024. L'azienda Coqui AI ha chiuso a gennaio 2024. Il fork community attivo è idiap/coqui-ai-TTS (Istituto Idiap), installabile con `pip install coqui-tts`, che mantiene compatibilità con le API originali e riceve aggiornamenti (v0.27.2, settembre 2025). I pesi XTTS-v2 hanno una Coqui Public Model License separata con restrizioni commerciali indipendenti dalla licenza MPL-2.0 del codice.

Perché è nel catalogo

XTTS-v2 rimane tra i modelli di voice cloning zero-shot più capaci disponibili open-source: clonazione vocale in 17 lingue da pochi secondi di audio reference. Per stack AI con requisiti di voce sintetica naturalistica o personalizzata, Coqui TTS (via fork Idiap) è ancora una scelta tecnicamente valida. È tuttavia essenziale adottare il fork Idiap anziché il repo originale abbandonato, e verificare la compatibilità della Coqui Public Model License XTTS-v2 con l'uso commerciale previsto.

Come lo integriamo

Non installiamo semplicemente Coqui TTS. Lo integriamo in uno stack AI controllato, documentato e mantenibile — ma in questo caso la nostra valutazione tecnica richiede attenzione elevata: adozione obbligatoria del fork Idiap, verifica legale della Coqui Public Model License per XTTS-v2, e pianificazione di un percorso di migrazione verso soluzioni con continuità commerciale garantita.

Licenza

SPDX: MPL-2.0
Mozilla Public License 2.0 (codice) + Coqui Public Model License (pesi XTTS-v2)
Il codice sorgente della libreria è MPL-2.0 (OSI-approved). I pesi del modello XTTS-v2 sono distribuiti sotto la Coqui Public Model License, che richiede acquisto di licenza enterprise per uso commerciale. L'azienda Coqui AI è chiusa e non rilascia più licenze enterprise. La fork Idiap (idiap/coqui-ai-TTS) mantiene la stessa struttura di licenza. Classificato dual_license per la coesistenza MPL-2.0 + model license commerciale.

Caratteristiche tecniche

Docker— no
Kubernetes— no
Helm chart— no
Self-hosted✓ sì
GPU richiesta— no
GPU noteGPU (CUDA) raccomandata per XTTS-v2 (inferenza lenta su CPU). Modelli più leggeri (VITS, Tacotron2) funzionano su CPU.
Multi-utente— no
Auth/RBACNon applicabile.
Persistenza— no
LinguaggioPython
Ultima release0.24.2 (repo originale) / 0.27.2 (fork Idiap) (2025-09-01)
Manutenzione attiva— no
GitHub stars (approx)36.000
AziendaCoqui AI (chiusa gennaio 2024) / Fork: Istituto Idiap (Martigny, Svizzera)

Note editoriali

ATTENZIONE CRITICA: L'azienda Coqui AI ha chiuso il 3 gennaio 2024. Il repo originale coqui-ai/TTS è tecnicamente non-archived ma abbandonato. Per qualsiasi nuovo deployment usare il fork Idiap (idiap/coqui-ai-TTS, pip install coqui-tts). La Coqui Public Model License per XTTS-v2 richiede consulenza legale per uso commerciale: l'azienda che la emetteva non esiste più, rendendo la situazione giuridica incerta. Considerare alternative con modelli TTS avanzati mantenuti attivamente (NVIDIA NeMo, StyleTTS2, Kokoro TTS).

Fonti di riferimento