Estima cuántos worker nodes necesitas. La licencia es por worker node
(no por usuarios, queries ni hardware) bajo subscripción anual.
Recomendación
— worker nodes
—
Modelo de licencia
subscripción anual
Para SKUs exactos, opciones de bundle y pricing, contacta a tu account manager Fortinet
o partner autorizado.
Estimación. Basada en heurísticas de campo y especificaciones públicas. Para producción,
validar con Fortinet TAC / SE engineering. La capacidad real por GPU varía según modelo LLM backend, tamaño
de prompt/response, scanners habilitados y configuración específica del cluster Kubernetes.
Cómo se calcula
- Base: usuarios concurrentes ÷ capacity-por-GPU
(L4: ~50 · A10G: ~100 · A100: ~250 · H100: ~400).
- Scanner overhead: × 1.15 por cada scanner adicional sobre Prompt Injection
(Jailbreak, DLP, Toxicity, Custom).
- Latency multiplier: Best effort × 1.0 · Sub-second × 1.2 · Real-time × 1.5.
- HA: + 0 (single) · + 1 (N+1) · + 2 (N+2).
- Round up al siguiente entero.