Milvus — Vector database cloud-native CNCF per ricerca ANN a scala miliardaria con RBAC completo e GPU indexing
Vector database cloud-native CNCF per ricerca ANN a scala miliardaria con RBAC completo e GPU indexing
Milvus è un vector database Apache-2.0 con tre tier di deployment progressivi. Milvus Lite si installa con pip e gira in-process per sviluppo e notebook. Milvus Standalone gira su un singolo host Docker e supporta milioni di vettori. Milvus Distributed è la modalità enterprise su Kubernetes (Helm chart zilliztech/milvus) per scala miliardaria con microservizi stateless, MinIO, etcd e Woodpecker. RBAC con 40+ tipi di privilegio (Collection, Global, User). GPU indexing NVIDIA CAGRA opzionale. API REST e gRPC su porta 19530, Web UI su porta 9091.
Perché è nel catalogo
Milvus è l'unico vector database CNCF Incubating: governance open e roadmap pubblica garantiscono continuità indipendente da singolo vendor. L'architettura a tre tier permette di partire da Lite per sviluppo e scalare a Distributed senza cambiare API. RBAC con 40+ tipi di privilegio è tra i più granulari del settore. La separazione compute/storage su K8s abilita scaling indipendente di query e indexing.
Come lo integriamo
Non installiamo semplicemente Milvus. Lo integriamo in uno stack AI controllato, documentato e mantenibile: scelta del tier appropriato (Lite/Standalone/Distributed), cluster Kubernetes con Helm, RBAC configurato, MinIO e etcd gestiti, monitoraggio Prometheus/Grafana e documentazione operativa completa.
Licenza
SPDX: Apache-2.0
Apache License 2.0
Apache-2.0 puro senza restrizioni commerciali. Progetto CNCF Incubating: governance open con contributi da più aziende. Nessun CLA richiesto. Zilliz Cloud è il servizio SaaS separato.
Caratteristiche tecniche
| Docker | ✓ sì |
| Kubernetes | ✓ sì |
| Helm chart | ✓ sì |
| Self-hosted | ✓ sì |
| GPU richiesta | — no |
| GPU note | GPU opzionale. GPU indexing con NVIDIA CAGRA disponibile ma non richiesto. Utile per dataset molto grandi con requisiti di latenza estremi. |
| API | ['REST', 'gRPC'] |
| Multi-utente | ✓ sì |
| Auth/RBAC | Autenticazione username:password. RBAC con 40+ tipi di privilegio: CreateIndex, Insert, Search, Query, ecc. Row-level security disponibile in versioni recenti. Password root 'Milvus' va cambiata prima del deploy production. |
| Persistenza | ✓ sì |
| Linguaggio | Go |
| Ultima release | 2.6.1 (2025) |
| Manutenzione attiva | ✓ sì |
| GitHub stars (approx) | 38.100 |
| Azienda | Zilliz (creatore e principale maintainer di Milvus) |
Note editoriali
Milvus 3.0-beta annunciato maggio 2026 con breaking change: verificare la roadmap prima di nuovi deployment. La password root 'Milvus' di default deve essere cambiata obbligatoriamente prima del go-live. L'architettura Distributed richiede MinIO, etcd e Woodpecker/Pulsar: alta complessità operativa rispetto a Qdrant o Chroma. CNCF Incubating garantisce governance indipendente dal vendor.