Agent de coding souverain — pricing transparent

Un prix fixe, public, engageable — pas de surprise en fin de mois.

Forfait GPU à partir de 2 500 €/mois, dimensionné à vos équipes, engageable sur l'horizon budget de votre DAF. Déployé en quelques jours, conforme DORA / NIS 2 / RGPD, modèles open-weights SOTA sur SecNumCloud. Tout ce que vos devs attendent d'un agent de coding, sans la boîte noire des APIs US.

Pensé pour : CFO · Head of Procurement

~/grands-comptes/payment-api · souver
live

Souver Code v0.9.2

Kimi K2.6 (1M context) with high effort · Souver Max

~/grands-comptes/payment-api

Tips pour démarrer :

  • · Tapez /souverainete pour vérifier que rien ne sort du GPU FR
  • · Utilisez /plan avant /run sur du code sensible
  • · /mcp pour brancher Jira, GitLab self-hosted, Vault…
? pour les commandes · shift+tab plan mode · ctrl+c pour quittersouver-control-plane · OK
main · kimi-k2.6 · outscale-snc-fr117 tokens/s · 38k ctx

Conçu pour les secteurs régulés français — là où les données ne peuvent pas partir aux US

  • CAC 40
  • Banques
  • Assurances
  • Mutuelles
  • Santé · HDS
  • Défense
  • Admin centrale

Les 3 piliers

Pourquoi Souver plutôt qu'un autre agent ?

Trois angles complémentaires. Selon qui porte le projet chez vous, un pilier prime — les deux autres ferment la porte aux objections.

Pilier 2 — OpérationsVotre angle

Prêt à déployer. Conforme par défaut.

Pas besoin de monter une task force interne pour builder un agent de coding souverain. Souver est opérationnel en quelques jours, pas en 18 mois. DORA, NIS 2, RGPD, HDS : la compliance est intégrée, pas un chantier à côté. Vos équipes codent, on s'occupe du reste.

Pilier 1 — Fondation

Vos données ne quittent pas la France.

Aucune ligne de code, aucun prompt, aucun secret n'est envoyé chez OpenAI, Anthropic, Google ou Microsoft. Modèles open-weights servis en propre sur GPU SecNumCloud (3DS Outscale, France) — vos données échappent aux lois extraterritoriales américaines (Cloud Act, FISA 702) par construction, pas par promesse contractuelle.

Pilier 3 — Stratégie

Multi-modèles open-weights SOTA, zéro lock-in.

DeepSeek, Qwen, Llama, Mixtral… Vous choisissez le modèle adapté à chaque use case, vous en changez quand vous voulez. Pas enfermé chez un fournisseur unique à la traîne. Souver intègre les derniers SOTA en continu — votre stack évolue sans vous.

Pricing à la carte

Composez votre stack, payez à la machine.

Vous choisissez vos modèles, pas vos machines. Une GPU M pour Qwen 3.6-35B, une L pour Kimi K2.6, ou 3×L avec trois modèles différents — chaque GPU est dédiée, chaque modèle est servi en propre sur SecNumCloud, en France. Combinez les tailles comme vous voulez.

Aucun rate limit, aucune facturation au token.

Prix fixe par machine, consommation illimitée. Vos développeurs sollicitent l'agent sans compter, votre facture ne bouge pas.

GPU Small

S

Dès 2 500 €/ mois · ~250 € / dev

GPU
1× L40S 48 GB ou A100 40 GB · SecNumCloud
Modèles servis
Qwen 3.6-27B · Codestral 25.01 · Mistral Small 3 · StarCoder2-15B
Capacité
~10 devs simultanés · 32k ctx · 400–600 tok/s
Le plus pris

GPU Medium

M

Dès 5 500 €/ mois · ~220 € / dev

GPU
1× A100 80 GB · SecNumCloud
Modèles servis
Qwen 3.6-35B-A3B · Codestral · Mistral Large EU
Capacité
~25 devs simultanés · 128k ctx · 250–400 tok/s

GPU Large

L

Dès 12 000 €/ mois · ~200 € / dev

GPU
2× H100 ou 4× A100 80 GB · SecNumCloud
Modèles servis
Kimi K2.6 (SOTA) · MiniMax M2.5 · GLM-5.1 · DeepSeek V3.2
Capacité
~60 devs simultanés · 256k ctx · 300–500 tok/s · Agent Swarm

Smart Router multi-modèles

Si vous prenez plusieurs GPUs, Souver route chaque requête vers le modèle le plus pertinent : une complétion simple part sur le S (rapide, pas cher), un plan d'agent long part sur le L (Kimi K2.6, 256k ctx). Vous payez vos GPUs, vous ne payez pas une roulette de tokens.

  • Routing par type de tâche, langage, longueur de contexte, profil dev
  • Override manuel possible (slash command /model L)
  • Fallback automatique si une GPU sature

Console admin · downgrade à la demande

Tableau de bord par dev, par équipe, par GPU : occupation, latence, coût/jour. Si une GPU tourne sous 30% trois semaines de suite, Souver propose le downgrade automatique vers une taille en dessous — vous validez en un clic, pas de pénalité.

  • Quotas et budgets par équipe / projet / agent
  • Alertes proactives (oversize, pic d'usage, modèle saturé)
  • Export SIEM, audit trail SecNumCloud, rapport mensuel CFO-ready

Prix indicatifs hors taxes, GPU dédiée non mutualisée. Engagement 12 mois.Combo recommandé M + L : ~5 500 + 12 000 = 17 500 €/mois, ~85 devs, ~200 €/dev. Un petit modèle pour le volume, un SOTA pour le lourd. Tous vos cas d'usage couverts.

Comparaison

À qualité égale, vous payez moins. Et vos données restent en France.

Sur les benchmarks coding, les meilleurs modèles open-weights (DeepSeek V4, Kimi K2.6) sont au coude-à-coude avec Claude Opus 4.6 et GPT-5.4. Au forfait GPU dédié, le coût rapporté au token devient deux fois moins cher que les APIs US premium — sans envoyer un seul byte chez OpenAI, Anthropic ou Google.

ModèleLiveCodeBench v6SWE-bench VerifiedSWE-bench ProCoût blended*Souveraineté

Souver — DeepSeek V4

Open-weights · servi par Souver

~90 %~81 %~58 %

~14,50 € / Mtok

forfait GPU L, 80 % util.

Souverain

Souver — Kimi K2.6

Open-weights · MIT · servi par Souver

89,6 %80,2 %58,6 %

~14,50 € / Mtok

forfait GPU L, 80 % util.

Souverain

Claude Opus 4.6

Closed · Anthropic (US)

88,8 %~78 %53,4 %

~30 € / Mtok

$15 in / $75 out

Non souverain

Mistral Large 3

Closed · Mistral AI (FR)

~81 %~71 %~44 %

~8 € / Mtok

$3 in / $9 out

Souverain

GPT-5.4

Closed · OpenAI (US)

~80 %57,7 %

~25 € / Mtok

~$10 in / $60 out

Non souverain

À qualité Opus

~50 % moins cher que Claude Opus 4.6 et GPT-5.4 pour un SWE-bench Verified et un LiveCodeBench v6 équivalents — et même supérieurs sur SWE-bench Pro (58,6 % vs 53,4 %).

Mistral, l'alternative française

Mistral est hébergé en France, mais leur modèle Large 3 est à ~71 % sur SWE-bench Verified contre 80+ % pour les SOTA. Et vous restez enfermé sur un seul fournisseur de modèles. Souver vous donne DeepSeek V4 et Kimi K2.6 : les meilleurs, pas un seul.

Le prix US va monter

Ces tarifs sont aujourd'hui subventionnés par les VCs. Quand la rentabilité sera exigée, le coût du token Opus / GPT-5 va exploser x2 à x5. Le forfait GPU Souver, lui, ne bouge pas.

* Coût "blended" = moyenne pondérée 70 % input / 30 % output, ratio typique sur un usage agentique de coding.
Pour Souver : forfait 12 000 €/mois sur GPU L (2× H100, Kimi K2.6 à ~400 tok/s), hypothèse 80 % d'utilisation continue → ~830 M tokens/mois → 14,50 €/Mtok. La comparaison est volontairement simplifiée : forfait flat vs pay-per-use n'ont pas la même mécanique. À usage léger (< 200 M tokens/mois), une API SaaS peut être moins cher — mais sans souveraineté.
Prix US : tarifs publics avril 2026, conversion $1 = 0,91 €. À recalculer si Anthropic / OpenAI augmentent leurs prix sous pression de rentabilité (cf. pilier 2).

Capabilities

Tout ce qu'un agent de coding sérieux doit faire — sur infra française.

Parité Claude Code, souveraineté, stack agentique complète (MCP, Agents, Cowork, Skills, Mobile) livrée avant que vos équipes aient besoin de la demander — et sans qu'aucun byte ne sorte chez un fournisseur américain.

CLI agentique

Parité fonctionnelle Claude Code

Agent loop, mode plan, permissions, Read / Edit / Bash / Grep / Git, sub-agents, slash commands, mémoire projet SOUVER.md, /feedback. Ce que vos devs attendent déjà.

IDE

VS Code & JetBrains natifs

Plugins officiels pointés sur le même backend que le CLI. L'équipe choisit son terminal ou son IDE, l'agent est le même.

MCP

MCP Hub souverain

Marketplace de serveurs MCP audités, hébergés en France, branchés sur les SaaS FR de vos équipes (Pennylane, Lucca, GitLab self-hosted, Sentry…).

Agents

Long-running & scheduled

Agents autonomes batch, scheduled jobs, jobs headless en background. Quotas par équipe, budget par agent, audit trail complet.

Cowork

Desktop avec accès local isolé

Agent autonome qui accède aux fichiers locaux du poste dans une VM isolée, coordonne des sub-agents, tient une mémoire projet persistante.

Mobile

Remote control mobile

Reprenez depuis le mobile une session Cowork en cours sur votre poste : validation des permissions sensibles, suivi des sub-agents, prompts rapides.

Sécurité & conformité

Aucune donnée chez OpenAI, Anthropic, Google ou Microsoft.

Hébergement 100% France sur 3DS Outscale (SecNumCloud 3.2 sur le périmètre IaaS GPU). Modèles open-weights servis en propre : aucun appel API sortant, aucun transfert hors-UE, aucune dépendance à un fournisseur soumis au Cloud Act ou au FISA 702. Data residency contractuelle, DPA sous droit français, clean-room policy documentée.

Demander notre dossier DSI/RSSI

SecNumCloud 3.2

En place

Hérité via 3DS Outscale

RGPD

En place

Registre + DPA + DPO

DORA

En place

Clauses + plan de sortie

NIS2

En place

Couvert

ISO 27001

En cours

Audit en cours

HDS

En cours

Sur demande · santé

ISO 42001 (AI Act)

Planifié

Planifié 2027

SOC 2 Type II

Planifié

Planifié 2027

FAQ

Les questions qu'on nous pose en procurement.

Vous transmettez vraiment zéro donnée à OpenAI, Anthropic ou Google ?
Zéro. Nous ne sommes ni revendeur ni passerelle d'API US. Les modèles sont open-weights (Kimi K2.6, Qwen 3.6, Codestral, Mistral), téléchargés et servis sur nos GPUs SecNumCloud avec vLLM / SGLang. Aucun byte ne sort de France à aucun moment de la requête. Le seul cas où une API tierce peut être appelée, c'est sur le tier XL et uniquement si le client le demande explicitement, via une passerelle dédiée et auditée.
Souver est-il soumis au Cloud Act US ou au FISA 702 ?
Non. Souver SAS est immatriculée en France, actionnariat à majorité européenne, sans contrôle indirect par entité non-UE. L'opérateur cloud Outscale appartient au groupe Dassault Systèmes (français). Stripe Ireland Ltd (billing) est en EU avec SCC. Documentation juridique formelle fournie avec chaque contrat. Cette posture est fondamentalement différente de Anthropic / OpenAI / GitHub Copilot (Microsoft) / Google, tous soumis au Cloud Act US quel que soit leur datacenter européen.
Quels modèles sont utilisés en production ?
Kimi K2.6 (GPU L, SOTA open-weights sur SWE-bench Pro), Qwen 3.6-35B-A3B (GPU M, Apache 2.0), Qwen 3.6-27B / Codestral / Mistral Small 3 (GPU S). Fallback souverain Mistral / Codestral pour les clients qui excluent les modèles non-EU. Sur cluster XL, pool multi-modèles routé + option Custom Models Hugging Face.
Les modèles chinois posent-ils un problème de souveraineté ?
Trois réponses : (1) les poids sont open-source (MIT/Apache 2.0), auditables par des tiers — pas de backdoor possible contrairement à un modèle propriétaire fermé. (2) Le compute reste en France — Souver opère vLLM/SGLang sur GPU Outscale SecNumCloud, aucune communication avec les serveurs Moonshot/Alibaba après téléchargement initial des poids. (3) Pour les clients qui refusent absolument les modèles non-EU (défense, gouv), le mode souverain-strict restreint à Codestral / Mistral Small 3 / StarCoder2 (tous EU).
Le pricing à la carte, comment ça marche ?
Vous achetez des GPUs (S à 2 500 €, M à 5 500 €, L à 12 000 €/mois en réservé). Vous pouvez en empiler plusieurs avec des modèles différents : par exemple 1× L pour Kimi K2.6 + 1× M pour Qwen, et le Smart Router envoie chaque requête sur le bon. Ajout / retrait de GPU à tout moment via la console admin, sans pénalité.
Et si on prend trop gros ?
La console admin remonte l'occupation par GPU, par équipe et par dev. Si une GPU tourne sous 30% trois semaines de suite, on vous propose le downgrade automatique vers la taille en dessous, en un clic, sans pénalité. Mieux : vous évitez de payer une L pour un usage de S.
Vous entraînez sur nos prompts ?
Non. Clean-room policy documentée : aucune donnée client n'est utilisée pour entraîner ou affiner un modèle Souver. Pas de cross-tenant. Suppression à la demande. DPA signé en annexe de chaque contrat.
Que se passe-t-il si Souver fait faillite ou interrompt le service ?
Plan de réversibilité documenté : (1) Export tenant complet en < 24 h (JSON + parquet + OCI), incluant configuration, journal d'audit, snapshots. (2) Tous les modèles utilisés (Kimi, Qwen, Codestral, Mistral) sont open-weights disponibles publiquement sur Hugging Face — redéployables ailleurs. (3) Le CLI est open-source (AGPL) — pas de vendor lock-in. (4) Le DPA impose restitution des données + destruction certifiée en fin de contrat.
Vous êtes compatible DORA pour une banque / assurance ?
Oui. Contrats adaptés aux clauses DORA (périmètre TIC, plan de sortie, registre sous-traitants, notification incident, plan de continuité). Le journal append-only chiffré avec hash-chain WORM satisfait l'audit trail exigible. Pentest annuel PASSI, support TLPT côté client. Voir notre fiche d'identité TIC fournie en procurement.
Peut-on déployer un modèle maison ?
Oui — en add-on cluster XL via Souver Custom Models : vous donnez un ID Hugging Face (public ou repo privé), notre control plane provisionne le GPU adapté et expose un endpoint privé. Scan licence / provenance inclus.
Discovery call · 30 min · gratuit

Parlons budget et pricing cible.

Montrez-nous un repo représentatif, on vous dit si Souver tient la charge et on évalue ensemble votre plan d'adoption. Pas de pitch commercial standardisé : on prépare en amont.

Ou écrivez directement à contact@souver.ai.