Piper — Text-to-speech locale CPU-first con 100+ voci, binary standalone e latenza sub-secondo
Text-to-speech locale CPU-first con 100+ voci, binary standalone e latenza sub-secondo
Piper è un motore TTS (Text-to-Speech) MIT ottimizzato per CPU, prodotto da Michael Hansen (rhasspy). Utilizza modelli VITS con ONNX Runtime per inferenza sub-secondo anche su Raspberry Pi 3. Viene distribuito come binary standalone (piper) per Linux x86_64/aarch64, Windows e macOS: nessuna dipendenza Python necessaria per l'uso da CLI. Supporta 35+ lingue con 100+ voci pre-addestrate, scaricabili individualmente. Integrato nativamente in Home Assistant come motore TTS. Nessun server REST nativo incluso: per API HTTP è necessario un wrapper. Addestramento di voci custom documentato.
Perché è nel catalogo
Piper è la scelta di riferimento per TTS locale su hardware embedded e single-board computer (Raspberry Pi, ARM). La distribuzione come binary standalone elimina la complessità di gestione dipendenze Python in contesti embedded. La latenza sub-secondo su CPU lo rende adeguato per applicazioni real-time. Per stack AI enterprise con requisiti di voce sintetica locale (kiosk, edge device, assistenti vocali), Piper è la soluzione più leggera e mantenibile.
Come lo integriamo
Non installiamo semplicemente Piper. Lo integriamo in uno stack AI controllato, documentato e mantenibile: binary containerizzato, selezione e verifica della licenza delle voci pre-addestrate, wrapper API per integrazione con altri servizi e documentazione operativa completa.
Licenza
SPDX: MIT
MIT License
MIT permissiva per il codice sorgente. Le voci pre-addestrate hanno licenze proprie (Apache 2.0, MIT, CC0, CC-BY — verificare per singola voce prima dell'uso commerciale). Nessun piano a pagamento.
Caratteristiche tecniche
| Docker | — no |
| Kubernetes | — no |
| Helm chart | — no |
| Self-hosted | ✓ sì |
| GPU richiesta | — no |
| GPU note | CPU-only by design. Nessun supporto GPU. Ottimizzato per ARM e x86 CPU-only. |
| Multi-utente | — no |
| Auth/RBAC | Non applicabile. |
| Persistenza | — no |
| Linguaggio | Python |
| Ultima release | 2023.11.14-2 (2023-11-14) |
| Manutenzione attiva | ✓ sì |
| GitHub stars (approx) | 10.500 |
| Azienda | Progetto community (creatore: Michael Hansen) |
Note editoriali
L'ultimo tag di release formale è del novembre 2023, ma il progetto non è abbandonato: riceve aggiornamenti di manutenzione. Le voci pre-addestrate hanno licenze eterogenee — verificare obbligatoriamente la licenza di ogni singola voce prima dell'uso commerciale (alcune sono CC-BY con attribuzione richiesta). Il progetto è il motore TTS predefinito di Home Assistant, il che garantisce una certa continuità di manutenzione.