Aller au contenu

Open Beta— Latenza est disponible dès maintenant.Commencer gratuitement →

Routing

Chaque requête au bon modèle, automatiquement

Définissez des règles par coût, latence ou contexte. Latenza évalue chaque appel en temps réel et sélectionne le provider optimal — sans changer une ligne dans votre code applicatif.

Atout
4 providers unifiés
Atout
Règles illimitées
Atout
<5 ms d’overhead
route.config.json
{
  "route": "/api/chat",
  "strategy": "cost",
  "targets": [
    { "provider": "mistral", "model": "mistral-large" },
    { "provider": "openai",  "model": "gpt-4o" }
  ],
  "fallback": "latency",
  "max_context_switch": "claude-3-5-sonnet"
}

Ce que ça change

Routing multi-provider, en pratique.

Routing par coût

Privilégiez le provider le moins cher capable de servir la requête, modèle par modèle.

Routing par latence

Envoyez les requêtes sensibles au provider le plus rapide selon ses p95 mesurés en continu.

Routing par contexte

Basculez automatiquement vers un modèle à grand contexte quand le prompt dépasse un seuil.

Règles personnalisées

Combinez critères, poids et fallbacks en cascade via l’interface ou l’API de configuration.

Comment ça marche

Une règle de routing, en clair

  1. 1Connectez vos providersAjoutez vos clés OpenAI, Anthropic, Mistral, Google en quelques clics depuis le dashboard.
  2. 2Définissez vos règlesChoisissez vos critères de routing et l’ordre des fallbacks par route ou par modèle.
  3. 3Latenza route chaque appelVotre code appelle une seule API compatible OpenAI — Latenza s’occupe du reste.

Déclarez vos critères une fois. Latenza applique la décision à chaque appel, avec fallback en cascade.

route.config.json
{
  "route": "/api/chat",
  "strategy": "cost",
  "targets": [
    { "provider": "mistral", "model": "mistral-large" },
    { "provider": "openai",  "model": "gpt-4o" }
  ],
  "fallback": "latency",
  "max_context_switch": "claude-3-5-sonnet"
}

Prêt à essayer routing multi-provider ?

Commencez gratuitement. Aucune carte bancaire. Déployé en 5 minutes.