Aller au contenu

Open Beta— Latenza est disponible dès maintenant.Commencer gratuitement →

Observabilité

Voyez exactement ce que vos LLMs coûtent

Latence p50/p95/p99, tokens consommés, coût par requête — découpés par assistant, feature ou équipe. Alertes de dérive budgétaire en temps réel. Fini les mauvaises surprises en fin de mois.

Atout
p50 / p95 / p99
Atout
Métriques temps réel
Atout
90 j de rétention
response.json
{
  "model": "gpt-4o",
  "provider": "openai",
  "usage": {
    "prompt_tokens": 412,
    "completion_tokens": 188,
    "cost_eur": 0.0061,
    "latency_ms": 340,
    "cached": false
  }
}

Ce que ça change

Observabilité, en pratique.

Coût par requête

Le coût réel de chaque appel, ventilé par modèle, par route et par clé API.

Latence détaillée

p50, p95 et p99 par provider et par modèle, pour repérer les régressions en un coup d’œil.

Logs avec trace

Chaque requête est tracée de bout en bout : prompt, provider choisi, retries, réponse.

Alertes budget

Définissez des seuils de dépense et recevez une alerte avant de dépasser votre budget.

Comment ça marche

Des métriques exploitables, par appel

  1. 1Rien à instrumenterDès le premier appel via Latenza, toutes les métriques sont collectées automatiquement.
  2. 2Filtrez et découpezSegmentez par assistant, feature, équipe ou clé API dans le dashboard.
  3. 3Pilotez vos coûtsSuivez la tendance, posez des alertes et exportez les données quand vous en avez besoin.

Chaque réponse renvoie le détail d’usage. Tout est aussi disponible dans le dashboard et l’API.

response.json
{
  "model": "gpt-4o",
  "provider": "openai",
  "usage": {
    "prompt_tokens": 412,
    "completion_tokens": 188,
    "cost_eur": 0.0061,
    "latency_ms": 340,
    "cached": false
  }
}

Prêt à essayer observabilité ?

Commencez gratuitement. Aucune carte bancaire. Déployé en 5 minutes.