Depuis le 2 avril 2026, OpenAI facture Codex au token. L’annonce est présentée comme un gain de lisibilité. Pour un développeur qui utilise vraiment le produit, c’est d’abord une hausse de facture.
Ce qui change concrètement
L’ancien système facturait au message. Une requête courte et une refactorisation multi-fichiers coûtaient pareil. C’est fini. Désormais, chaque token consommé est comptabilisé séparément : entrée, entrée mise en cache, sortie.

Les tarifs de référence pour GPT-5.3-Codex : 1,75 dollar par million de tokens en entrée, 14 dollars par million en sortie. La fenêtre de contexte monte jusqu’à 400 000 tokens. Le mode rapide double la consommation de crédits.
OpenAI estime le coût moyen entre 100 et 200 dollars par développeur et par mois, avec une variance élevée selon le modèle, le nombre d’instances actives et le recours au mode rapide. Cette fourchette large dit tout : personne ne sait vraiment ce que ça va coûter avant de l’avoir utilisé.
Le mot « transparence » est un leurre
OpenAI n’a pas changé sa grille tarifaire par philanthropie. L’ancien modèle au message sous-facturait mécaniquement les usages intensifs. Un développeur qui enchaînait des sessions longues sur de grandes bases de code payait le même tarif qu’un collègue qui posait trois questions par semaine.
La facturation au token corrige cette asymétrie. En faveur d’OpenAI.
Pour un usage léger, quelques requêtes ciblées par semaine sur des tâches courtes, l’impact est neutre. Pour ceux qui font travailler Codex en continu, notamment avec le mode rapide, la facture va grimper. C’est précisément le profil que le nouveau système vient capturer.
« Pour la première fois, Anthropic revendique un chiffre d’affaires annualisé supérieur à celui d’OpenAI, à plus de 30 milliards de dollars, après avoir triplé ses revenus en un trimestre. » — Blog du Modérateur, avril 2026
OpenAI n’est pas dans une position confortable. Sa directrice des revenus confirme un recentrage vers les clients professionnels, qui représentent déjà plus de 40 % du chiffre d’affaires. La tarification au token s’inscrit dans cette logique : monétiser plus efficacement les usages professionnels plutôt que de les subventionner.
Le vrai calcul pour un growth hacker
Le ratio entrée/sortie est la variable critique. Les tâches de génération de code produisent beaucoup de tokens en sortie. À 14 dollars par million, une session intensive peut coûter dix fois plus qu’une session d’analyse ou de lecture.
Quelques réflexes à adopter immédiatement. Le mode rapide double la consommation sans nécessairement doubler la qualité sur les tâches courantes : désactivez-le par défaut. Les 400 000 tokens de fenêtre de contexte disponibles ne doivent pas tous être chargés à chaque requête. Et plusieurs instructions ciblées coûtent souvent moins qu’une consigne ouverte sur une grande codebase.
Codex a franchi les 3 millions d’utilisateurs hebdomadaires début 2026, contre un million en début d’année. La nouvelle grille va segmenter cette base entre ceux qui paient peu et ceux dont la facture va grimper. Les deux groupes ne réagiront pas pareil.
Ce que ça dit de la guerre entre Codex et Claude Code
Anthropic s’est imposé précisément là où OpenAI cherche à s’imposer : les équipes techniques en entreprise. La facturation au token d’OpenAI est un alignement sur la logique Anthropic, pas une innovation.
Les deux produits facturent désormais à la consommation réelle. La différence se joue sur les prix unitaires, la qualité des completions et l’intégration dans les workflows existants. Sur ce terrain, le choix ne se fait plus sur le modèle de facturation. Il se fait sur la valeur produite par token dépensé.
OpenAI a choisi le moment où Codex atteignait 3 millions d’utilisateurs pour revoir sa grille. Ce n’est pas un hasard. La croissance donne la confiance de monétiser plus agressivement. La vraie question maintenant : combien de ces 3 millions resteront quand la facture sera effectivement transparente ?