Milvus — Vector database cloud-native CNCF per ricerca ANN a scala miliardaria con RBAC completo e GPU indexing

Vector database cloud-native CNCF per ricerca ANN a scala miliardaria con RBAC completo e GPU indexing

RAG & Knowledge Assistants Open source Production-ready

Milvus è un vector database Apache-2.0 con tre tier di deployment progressivi. Milvus Lite si installa con pip e gira in-process per sviluppo e notebook. Milvus Standalone gira su un singolo host Docker e supporta milioni di vettori. Milvus Distributed è la modalità enterprise su Kubernetes (Helm chart zilliztech/milvus) per scala miliardaria con microservizi stateless, MinIO, etcd e Woodpecker. RBAC con 40+ tipi di privilegio (Collection, Global, User). GPU indexing NVIDIA CAGRA opzionale. API REST e gRPC su porta 19530, Web UI su porta 9091.

Perché è nel catalogo

Milvus è l'unico vector database CNCF Incubating: governance open e roadmap pubblica garantiscono continuità indipendente da singolo vendor. L'architettura a tre tier permette di partire da Lite per sviluppo e scalare a Distributed senza cambiare API. RBAC con 40+ tipi di privilegio è tra i più granulari del settore. La separazione compute/storage su K8s abilita scaling indipendente di query e indexing.

Come lo integriamo

Non installiamo semplicemente Milvus. Lo integriamo in uno stack AI controllato, documentato e mantenibile: scelta del tier appropriato (Lite/Standalone/Distributed), cluster Kubernetes con Helm, RBAC configurato, MinIO e etcd gestiti, monitoraggio Prometheus/Grafana e documentazione operativa completa.

Licenza

SPDX: Apache-2.0
Apache License 2.0
Apache-2.0 puro senza restrizioni commerciali. Progetto CNCF Incubating: governance open con contributi da più aziende. Nessun CLA richiesto. Zilliz Cloud è il servizio SaaS separato.

Caratteristiche tecniche

Docker✓ sì
Kubernetes✓ sì
Helm chart✓ sì
Self-hosted✓ sì
GPU richiesta— no
GPU noteGPU opzionale. GPU indexing con NVIDIA CAGRA disponibile ma non richiesto. Utile per dataset molto grandi con requisiti di latenza estremi.
API['REST', 'gRPC']
Multi-utente✓ sì
Auth/RBACAutenticazione username:password. RBAC con 40+ tipi di privilegio: CreateIndex, Insert, Search, Query, ecc. Row-level security disponibile in versioni recenti. Password root 'Milvus' va cambiata prima del deploy production.
Persistenza✓ sì
LinguaggioGo
Ultima release2.6.1 (2025)
Manutenzione attiva✓ sì
GitHub stars (approx)38.100
AziendaZilliz (creatore e principale maintainer di Milvus)

Note editoriali

Milvus 3.0-beta annunciato maggio 2026 con breaking change: verificare la roadmap prima di nuovi deployment. La password root 'Milvus' di default deve essere cambiata obbligatoriamente prima del go-live. L'architettura Distributed richiede MinIO, etcd e Woodpecker/Pulsar: alta complessità operativa rispetto a Qdrant o Chroma. CNCF Incubating garantisce governance indipendente dal vendor.

Fonti di riferimento