OpenAI Codex tarification token : ce que ça coûte vraiment

Depuis le 2 avril 2026, OpenAI facture Codex au token. L’annonce est présentée comme un gain de lisibilité. Pour un développeur qui utilise vraiment le produit, c’est d’abord une hausse de facture.

Ce qui change dans la tarification de Codex

L’ancien système facturait au message. Une requête courte et une refactorisation multi-fichiers coûtaient pareil. C’est fini. Désormais, chaque token consommé est comptabilisé séparément : entrée, entrée mise en cache, sortie. Les tokens d’entrée mis en cache, ceux qui reviennent d’un tour à l’autre dans une session agentique, coûtent environ 10 % du tarif d’entrée standard. C’est le levier d’optimisation le plus concret pour qui enchaîne les requêtes sur une même base de code.

Les tarifs de référence pour GPT-5.3-Codex : 1,75 dollar par million de tokens en entrée, 14 dollars par million en sortie. La fenêtre de contexte monte jusqu’à 400 000 tokens. Le mode rapide double la consommation de crédits.

OpenAI estime le coût moyen entre 100 et 200 dollars par développeur et par mois, avec une variance élevée selon le modèle, le nombre d’instances actives et le recours au mode rapide. Cette fourchette large dit tout : personne ne sait vraiment ce que ça va coûter avant de l’avoir utilisé.

Le mot « transparence » est un leurre

OpenAI n’a pas changé sa grille tarifaire par philanthropie. L’ancien modèle sous-facturait les usages intensifs : un développeur en session longue payait le même tarif qu’un collègue avec trois questions par semaine.

La facturation au token corrige cette asymétrie. En faveur d’OpenAI.

Pour un usage léger, l’impact reste neutre. Mais pour ceux qui font travailler Codex en continu avec le mode rapide, la facture va grimper : c’est précisément le profil que le nouveau système vient capturer.

« Pour la première fois, Anthropic revendique un chiffre d’affaires annualisé supérieur à celui d’OpenAI, à plus de 30 milliards de dollars, après avoir triplé ses revenus en un trimestre. » (Blog du Modérateur, avril 2026)

OpenAI n’est pas dans une position confortable. Sa directrice commerciale, Denise Dresser, confirme un recentrage vers les clients professionnels, qui pèsent déjà plus de 40 % du chiffre d’affaires : la tarification au token traduit ce choix : monétiser les usages professionnels plutôt que de les subventionner.

Le vrai calcul pour un growth hacker

Le ratio entrée/sortie est la variable critique. Les tâches de génération de code produisent beaucoup de tokens en sortie. À 14 dollars par million, une session intensive peut coûter dix fois plus qu’une session d’analyse ou de lecture. Une refactorisation qui génère 50 000 tokens de sortie coûte à elle seule environ 0,70 dollar, avant même de compter l’entrée ; une session classique de plusieurs heures tourne en général entre 0,50 et 2 dollars en équivalent API, largement sous la moyenne mensuelle annoncée par OpenAI.

Quelques réflexes à adopter immédiatement. Le mode rapide double la consommation sans nécessairement doubler la qualité sur les tâches courantes. Désactivez-le par défaut. Les 400 000 tokens de fenêtre de contexte disponibles ne doivent pas tous être chargés à chaque requête, et plusieurs instructions ciblées coûtent souvent moins qu’une consigne ouverte sur une grande codebase. Le réflexe le plus rentable reste de fragmenter le travail : demander à Codex de traiter un seul fichier, valider, puis passer au suivant, coûte moins cher que de le laisser explorer toute une arborescence pour trouver le bon endroit. Le modèle relit ce qu’il a déjà écrit à chaque nouvel échange ; plus la conversation s’allonge, plus la facture grimpe sur l’entrée, même si le token individuel reste bon marché. Couper les sessions longues en tâches courtes, validées une à une, change directement le total en fin de mois.

Codex a franchi les 3 millions d’utilisateurs hebdomadaires début 2026, contre un million en début d’année. Ce volume a été multiplié par cinq en trois mois. Près de la moitié des usages ne concernent d’ailleurs plus directement du code. La nouvelle grille va segmenter cette base entre ceux qui paient peu et ceux dont la facture va grimper. Les deux groupes ne réagiront pas pareil.

Ce que ça dit de la guerre entre Codex et Claude Code

Anthropic s’est imposé précisément là où OpenAI cherche à s’imposer : les équipes techniques en entreprise. La facturation au token d’OpenAI est un alignement sur la logique Anthropic, pas une innovation.

Les deux produits facturent désormais à la consommation réelle. Sur le tarif brut, Claude Sonnet 5 facture 3 dollars par million de tokens en entrée et 15 dollars en sortie, contre 1,75 et 14 dollars pour Codex. L’écart se resserre sur la sortie, là où se joue l’essentiel de la facture d’un développeur. La différence se joue aussi sur la qualité des completions et l’intégration dans les workflows existants ; sur ce terrain, le choix ne se fait plus sur le modèle de facturation, mais sur la valeur produite par token dépensé.

OpenAI a choisi le moment où Codex atteignait 3 millions d’utilisateurs pour revoir sa grille. Ce n’est pas un hasard. La croissance donne la confiance de monétiser plus agressivement. La vraie question maintenant : combien de ces 3 millions resteront quand la facture sera effectivement transparente ?

Hand-Picked Tendances

La checklist avant d’envoyer votre premier email de prospection B2B

SpeechAnalyzer bat Whisper : et si votre prochain avantage growth était vocal ?

Vos licences IA dorment : personne ne les active

OpenAI Codex tarification token : ce que ça coûte vraiment

Ce qui change dans la tarification de Codex

Le mot « transparence » est un leurre

Le vrai calcul pour un growth hacker

Ce que ça dit de la guerre entre Codex et Claude Code

La checklist avant d’envoyer votre premier email de prospection B2B

SpeechAnalyzer bat Whisper : et si votre prochain avantage growth était vocal ?

Vos licences IA dorment : personne ne les active

OpenAI Codex tarification token : ce que ça coûte vraiment

Ce qui change dans la tarification de Codex

Le mot « transparence » est un leurre

Le vrai calcul pour un growth hacker

Ce que ça dit de la guerre entre Codex et Claude Code

SpeechAnalyzer bat Whisper : et si votre prochain avantage growth était vocal ?

Vos licences IA dorment : personne ne les active

Budget IA 2026 : ce que les pros du digital financent vraiment (et ce qu’ils ratent)