Pourquoi ChatGPT ignore votre site ? (La réponse technique sans bullshit)
Kevin Lesieutre
21 novembre 2025
Je vous ai concocté un petit récap de ma dernière vidéo parce que j’entends beaucoup de bêtises sur le sujet du GEO (Generative Engine Optimization) en ce moment.
On entend partout que le GEO et le SEO, c’est la même chose. Alors oui, c’est sûr que pour exister aux yeux de ChatGPT, ça repose énormément sur le Top 10 de Google (via l’API de Bing/SerpApi). Il n’y a aucun doute là-dessus.
Mais attention : OpenAI ne gère pas les sites comme Google. On peut être présent dans le top 10, mais si techniquement votre site ne plaît pas au robot de ChatGPT, vous allez juste être invisible. C’est “game over”.
Je ne suis pas là pour vendre de la presta, j’ai aucun intérêt caché, je trouve juste le sujet passionnant. Alors, attachez vos ceintures, on va regarder sous le capot.
1. Le JavaScript : L’ennemi public numéro 1 des LLM
C’est le truc qui m’a le plus choqué et dont personne ne parle.
Google, on le sait, il gère le JavaScript (JS). Ça prend du temps, c’est coûteux, mais il le fait. Par contre, ChatGPT, lui, c’est un flemmard du rendu.
J’ai fait des tests pour vérifier ça. J’ai créé deux pages :
- Une page en HTML pur avec une biographie bidon du Roi Arthur (qui parle de Ferrari bleue et de n’importe quoi).
- Une page où ce même texte est injecté via JavaScript.
Résultat des courses ? Sur la page HTML, ChatGPT lit tout, il voit les incohérences, il me sort la Ferrari bleue. Nickel. Sur la page JS ? Il me répond : “Désolé, je ne peux pas accéder au contenu de ce texte”.
Ce qu’il faut comprendre : Quand ChatGPT navigue en temps réel pour répondre à un utilisateur (ChatGPT User), il récupère le code source brut. Il n’a pas de navigateur émulé pour exécuter votre JS.
La conséquence est brutale : Si vous avez un site e-commerce et que vos produits ou vos prix sont chargés en JavaScript (genre React sans SSR), pour ChatGPT, votre contenu n’existe pas. C’est mort. Si vos concurrents sont en HTML dur et vous en JS, ils seront cités, et vous, vous resterez sur la touche.
2. Le Tracking : Oubliez GA4, vive les Logs !
Là, je m’adresse aux “fous du bus” du fond de la salle, les vieux de la vieille du SEO.
Vous voulez tracker le trafic venant des IA ? Si vous comptez sur Google Analytics 4 (GA4), vous êtes à côté de la plaque. Pourquoi ?
- Pas de JS = Pas de tag GA4. Vu que le bot n’exécute pas le JS, il ne déclenche pas votre analytics.
- Les cookies : Déjà qu’on perd 40% de data avec les refus cookies humains, imaginez avec des bots.
La seule vérité, elle est sur votre serveur. Ce sont les Access Logs.
Je sais, ça fait peur, on dirait de la Matrix. Mais en vrai, un fichier de logs, c’est juste un gros CSV moche. C’est de la data triée par colonnes.
Pour savoir si ChatGPT vient chez vous, cherchez deux User Agents dans vos logs :
GPTBot: C’est le crawler qui vient aspirer votre site pour entraîner le modèle (le background).ChatGPT-User: C’est CELUI qui nous intéresse. C’est le robot qui vient sur votre site à l’instant T parce qu’un utilisateur a posé une question.
Si vous voyez ChatGPT-User débarquer, c’est l’équivalent d’une “impression”. Ça veut dire que ChatGPT a jugé votre page assez pertinente pour venir la lire.
Petit tip de geek : Vous pouvez même demander à ChatGPT de vous coder un script Python pour analyser vos logs. Je l’ai fait, je lui ai dit “Mon frérot, analyse-moi ça”, et il m’a sorti les stats.
3. LLM Stuffing : J’ai tenté de le piéger (et j’ai réussi)
Je me suis amusé à tester les limites du système. Est-ce qu’on peut cacher du texte pour influencer l’IA ? C’est ce qu’on appelle le LLM Stuffing.
J’ai repris ma technique de 2002 : texte blanc sur fond blanc.
- Essai 1 : Style directement dans la balise HTML, même couleur exacte que le fond. -> Échec. ChatGPT a ignoré le texte. Il doit y avoir un filtre basique qui détecte ça.
- Essai 2 (Le mode fourbe) : J’ai mis des classes CSS, j’ai mis une couleur presque blanche (mais pas tout à fait) et j’ai baissé l’opacité à 30%. -> Bingo ! Il a lu le texte caché.
Je ne vous dis pas de le faire (je ne vends rien, je vous rappelle), mais c’est intéressant de voir que le “nettoyage” du contenu par OpenAI n’est pas encore parfait. Il y a des trous dans la raquette.
4. La disparition : Quand l’IA vous blacklist
Je finis sur un cas concret ultra récent (septembre) qui fait un peu froid dans le dos.
On a analysé un site qui faisait environ 3500 citations LLM par jour. Du jour au lendemain : ZÉRO. La courbe s’est écrasée comme une crêpe.
Pourquoi ?
En regardant les logs, on a vu que juste avant la chute, GPTBot (le crawler d’entraînement) est passé. Sauf qu’il est tombé sur un Spider Trap : des liens cassés, des boucles infinies, des pages catégories vides qui renvoyaient des erreurs.
Le bot a dû se dire : “OK, ce site, c’est de la merde, il est tout cassé, j’arrête de le proposer”. Il a “give up”.
Contrairement à Google qui est assez résilient, ChatGPT semble beaucoup plus radical : si techniquement votre site plante lors du crawl, il vous sort de ses réponses.
En résumé, pour ne pas se faire zapper :
- Checkez votre rendu : Votre contenu important DOIT être dans le HTML brut. Si c’est du JS, vous êtes invisibles.
- Surveillez vos Logs : C’est là que se passe la vraie mesure. Regardez si
ChatGPT-Userpasse vous voir. - Soyez techniquement irréprochables : Pas de liens cassés, pas d’erreurs 500. Si le bot galère, il ne reviendra pas.
C’est un nouveau terrain de jeu, les amis. Le web de demain, il va falloir s’adapter ou disparaître.
Allez, je retourne coder la prochaine version de Cuik !
Kevin.
Regarder la vidéo complète
Besoin d'aide pour optimiser votre SEO ?
Je peux vous accompagner pour améliorer la visibilité de votre site sur Google et les moteurs d'IA comme ChatGPT.
Prendre rendez-vous