De l'IA dans des systèmes réels. Pas par-dessus.
Beaucoup d'« intégrations IA » sont du code de démo enveloppé autour d'une API. Nous, on construit la couche d'en-dessous — le flux de données, la retrieval, la validation, la partie qui doit rester juste sous vraie charge sur de la vraie donnée client.
Qui passe désormais par la couche IA qu'on a livrée.
Utilisent le pipeline en production aujourd'hui.
Tourne, monitoré, réconcilié. C'est le seuil.
Les couches d'en-dessous.
De la donnée production préparée pour la retrieval, par client, sur la forme réelle de la boîte. Cas limites et incohérences gérés dans le code, pas refilés au LLM.
Architectures de retrieval pensées autour du modèle de données — pas autour de la forme d'un tutoriel. Vectorisation tunée par classe de donnée.
Le système ne paie pas deux fois la même pensée. La latence cold-start reste prédictible sous charge.
Utilisés là où la donnée, la latence ou le coût rendent l'API-only impraticable. Self-hosted quand ça fait tourner le système, pas par idéologie.
Les outputs qui touchent à des chiffres — finance, stock, opération — sont vérifiés contre la donnée sous-jacente programmatiquement avant de sortir du système.
Réconciliés contre la source de vérité avant d'arriver chez un client. Le LLM propose, le système vérifie.
Les managers demandent, le système produit — sur de la donnée réelle, validée, par client, en production. Formaté, réconcilié, prêt à être actionné.
On a architecturé et livré la couche IA dans un ERP qui sert 70+ entreprises. 5M+$/semaine de leurs opérations passent par là.
On n'a pas construit l'ERP. C'est l'équipe qui l'avait construit qui nous a fait venir, parce que leurs clients avaient besoin d'une IA capable de tourner sur de la vraie donnée production — et ils nous ont fait confiance pour la livrer de bout en bout.
Le système génère des rapports custom via chat — par entreprise, sur la vraie donnée, en production. Les outputs ne sont pas des résumés de résumés. Ils sont calculés, validés et réconciliés contre la source de vérité avant d'arriver chez quelqu'un.
Ça tourne. Stable. C'est le seuil.
Le seuil qui nous tient en dehors de certains projets.
- ×Des chatbots collés dont la seule fonction est de paraître modernes.
- ×Des features IA sans chemin vers la production.
- ×Des pipelines qui marchent sur la donnée de démo et s'effondrent silencieusement sur la vraie.
- ×Tout projet où « on verra pour les hallucinations plus tard ».
Si de l'IA va dans un système qui compte, elle doit se comporter comme le reste du système : prévisible, monitorée, debuggable, juste.
Quatre conditions qui doivent généralement être vraies.
Vous avez un vrai ERP, une plateforme ou un produit, et vous voulez de l'IA construite à l'intérieur — pas à côté.
Les outputs doivent être justes — financièrement, opérationnellement, contractuellement.
Vous préférez avoir une seule équipe qui possède la couche data, la couche modèle et la couche intégration plutôt que trois vendors qui se renvoient la balle.
Vous pouvez nous montrer de la vraie donnée production, de vrais clients et de vraies décisions que l'IA doit supporter. On ne livre pas des pipelines sur des hypothèses.
Vous avez un vrai produit qui a besoin d'une vraie couche IA ?
