Aucune donnée ne quitte la France ?+
Aucune. Souver n'est ni revendeur ni passerelle d'API US : les modèles sont open-weights, téléchargés et servis directement sur nos GPUs SecNumCloud avec vLLM / SGLang. Medium/Large servent les modèles qui tiennent sur 1× A100/H100 ou 2× H100 ; les frontier models type Kimi, MiniMax, GLM et DeepSeek V4 passent en cluster sur mesure. Vos données ne franchissent jamais nos frontières.
Comment sécurisez-vous l'exécution de l'agent ?+
- Isolation — sandbox FS/réseau/processus : l'agent ne peut ni lire hors périmètre autorisé, ni ouvrir de connexion sortante non approuvée.
- Permissions — chaque écriture ou exécution déclenche un prompt explicite. 4 modes configurables par l'admin, de lecture seule jusqu'à full-auto opt-in.
- Secrets — scanner embarqué avant tout appel outil, aucun secret ne transite en clair.
- Traçabilité — journal append-only chiffré AES-256-GCM de chaque action (message, tool call, permission, diff fichier), exportable SIEM en CEF/LEEF.
- Gouvernance tenant — politique signée par l'admin : modèles autorisés, mode souverain forcé, plafond de coût quotidien.
- Desktop — renderer Electron isolé (contextIsolation, sandbox), accès fichiers et agent exclusivement via IPC main-process typé.
- Le modèle propose ; le harness contrôle, limite, et laisse une trace auditée à chaque étape.
Souver est-il soumis au Cloud Act US ou au FISA 702 ?+
Non. Notre société est immatriculée en France avec un actionnariat 100 % français, sans contrôle indirect par aucune entité non-UE. L'opérateur cloud Outscale appartient au groupe Dassault Systèmes (français). Stripe Ireland Ltd (billing) est en EU avec SCC. Documentation juridique formelle fournie avec chaque contrat. Cette posture est fondamentalement différente de Anthropic / OpenAI / GitHub Copilot (Microsoft) / Google, tous soumis au Cloud Act US quel que soit leur datacenter européen.
Quels modèles sont utilisés en production ?+
GPU Medium
- Mistral Small 3.1 24B
- Codestral 22B
- Qwen3.6-35B-A3B*
GPU Large
- Qwen3.6-35B-A3B
- Devstral Small 2 24B FP8
- Mistral Small 3.1 multi-instance
Cluster sur mesure
- Kimi K2.6
- MiniMax M2.5
- GLM-5.1
- DeepSeek V4
- Qwen3-Coder 480B
Tout modèle open-weights peut être servi à la demande. Avant chaque mise en production, notre système d'audit vérifie la provenance, la licence et l'absence de dérives comportementales — biais, backdoors, sorties toxiques — via un red teaming automatisé. Un modèle qui échoue à l'audit n'est pas déployé.
* Servi avec quantization validée (FP8 / AWQ) et fenêtre de contexte dimensionnée pour la VRAM cible.
Qu'appelez-vous le harness d'agent ?+
Agent = modèle + harness. Les weights donnent le potentiel ; le harness détermine ce que l'agent produit réellement dans un repo : contexte, mémoire, appels fichiers/terminal, permissions, garde-fous, reprise après erreur, auto-vérification et qualité du diff final. Sur une tâche longue, il peut compter autant que le modèle, parfois plus.
Pourquoi Souver est-il expert du harness ?+
Parce que c'est notre cœur de métier, pas une couche marketing. Terminal Bench le montre : LangChain a gagné 13,7 points en améliorant son harness sans changer les weights. Souver travaille précisément cette couche : agent loop, sandbox, gateway d'outils, politiques tenant, permissions, tests d'attaque et métriques d'évaluation.
Les modèles chinois posent-ils un problème de souveraineté ?+
Nous les traitons comme des composants non fiables par défaut. Les poids sont open-weights et servis par Souver sur GPU SecNumCloud : aucune donnée n'est envoyée à Moonshot, Alibaba ou DeepSeek. Avant déploiement : vérification provenance/licence, tests de sécurité et red teaming. À l'exécution, le harness agit comme barrière de contrôle : le modèle n'a pas d'accès direct aux fichiers, au réseau ou aux secrets ; tout passe par sandbox, whitelist réseau, secrets scanner, permissions et audit trail. Pour défense/gouv, le mode souverain-strict force des modèles EU-only.
Le pricing à la carte, comment ça marche ?+
Vous achetez des GPUs dédiées : M à 12 000 €, L à 24 000 €/mois. Le cluster sur mesure est uniquement sur devis, parce que le prix dépend du modèle servi, du contexte, de la concurrence et du SLA. Vous pouvez empiler plusieurs GPUs M/L, et le Smart Router envoie chaque requête sur le bon modèle.
Que se passe-t-il si on sur-dimensionne sa GPU ?+
La console admin remonte l'occupation par GPU, par équipe et par dev. Si une GPU tourne sous 30 % trois semaines de suite, on vous propose le downgrade automatique vers la taille en dessous, en un clic, sans pénalité. Mieux : vous évitez de payer une L pour un usage de M.
Vous entraînez sur nos prompts ?+
Non. Clean-room policy documentée : aucune donnée client n'est utilisée pour entraîner ou affiner un modèle Souver. Suppression à la demande. Sur les GPU dédiées, aucun cross-tenant : la machine est réservée à votre organisation. Sur l'abonnement partagé (Souver Max), la capacité GPU est mutualisée avec isolation MIG — les données ne sont pas mélangées, mais le pool, lui, l'est. DPA signé en annexe de chaque contrat.
Que se passe-t-il si Souver fait faillite ou interrompt le service ?+
Plan de réversibilité documenté : (1) Export tenant complet en < 24 h (JSON + parquet + OCI), incluant configuration, journal d'audit, snapshots. (2) Tous les modèles utilisés (Kimi, Qwen, Codestral, Mistral) sont open-weights disponibles publiquement sur Hugging Face — redéployables ailleurs. (3) Les sessions, politiques et configurations du client desktop / CLI engine sont exportables. (4) Le DPA impose restitution des données + destruction certifiée en fin de contrat.
Vous êtes compatible DORA pour une banque / assurance ?+
Oui. Contrats adaptés aux clauses DORA (périmètre TIC, plan de sortie, registre sous-traitants, notification incident, plan de continuité). Le journal append-only chiffré avec hash-chain WORM satisfait l'audit trail exigible. Pentest annuel PASSI, support TLPT côté client. Voir notre fiche d'identité TIC fournie en procurement.
Peut-on déployer un modèle maison ?+
Oui — en add-on cluster sur mesure via Souver Custom Models : vous donnez un ID Hugging Face (public ou repo privé), notre control plane provisionne le GPU adapté et expose un endpoint privé. Scan licence / provenance inclus.