En testant la version gratuite de l’API Google Gemini, tu seras vite confronté·e à des quotas serrés (environ 60 requêtes/minute et 20 tokens/seconde). Impossible de tenir une intégration pro ou des batchs backend sans basculer en payant : le mur du paywall arrive vraiment tôt, même pour des démos.
J’ai tenté l’aventure il y a deux semaines pour un petit POC interne avec mon équipe. Je voulais justement voir si on pouvait prototyper rapidement un assistant qui analyse des contenus UX pour notre design system — l’idée : structurer les retours utilisateurs à la volée.
Au début, trop contente, j’intègre l’API Gemini sur une sandbox avec NestJS, je lance quelques flux… Et bim 💥, au bout de 15 minutes d’essais « un peu intensifs » (un petit batch qui enchaînait les requêtes), tout se met à freezer. Message super sec : « You have reached your quota. »
Je retente, j’essaie de temporiser, de throttle côté code… mais franchement, IMPOSSIBLE de tenir un atelier démo complet pour l’équipe sans me heurter à la limite. Même côté visuel, aucun feedback détaillé, juste le refus sec. Je me suis retrouvée à expliquer à la prod (un peu gêné 😅) que oui, même en 2024, l’IA en API gratuite, c’était encore ultra verrouillé.
Depuis, pour mes tests visuels, je passe par l’interface chat (là, c’est moins restrictif, tu sens la tolérance « humaine »), mais dès qu’il faut connecter en backend, on sent que Google veut stopper tout ce qui ressemble à de l’usage pro sans payer.
Si tu veux un vrai POC fluide ou une intégration équipe, il faut prévoir la montée en offre payante. Sinon, c’est la frustration assurée côté limites. Franchement dommage pour la créativité ! 😅💡