EntityMap is a proposed open standard for publishing a structured, entity-first index of website knowledge for AI systems, retrieval pipelines, and language-model-based applications.
Google et leur nouveau protocole eCommerce
Mise à jour de la doc officielle Google en matière de SEO pour AI Overview (pas Gemini)
Un bon article qui met en exergue les différences entre l'indexation pour le SEO et AI
Un podcast très grossier mais pas inintéressant pour comprendre comme l'AI impacte la recherche dans Google. Conversation avec un ingénieur Google
Carte interactive avec les events seo dans le monde, par mois
Here are the nine reasons he cited for canonical choices:
Exact duplicate content
The pages are fully identical, leaving no meaningful signal to distinguish one URL from another.
Substantial duplication in main content
A large portion of the primary content overlaps across pages, such as the same article appearing in multiple places.
Too little unique main content relative to template content
The page’s unique content is minimal, so repeated elements like navigation, menus, or layout dominate and make pages appear effectively the same.
URL parameter patterns inferred as duplicates
When multiple parameterized URLs are known to return the same content, Google may generalize that pattern and treat similar parameter variations as duplicates.
Mobile version used for comparison
Google may evaluate the mobile version instead of the desktop version, which can lead to duplication assessments that differ from what is manually checked.
Googlebot-visible version used for evaluation
Canonical decisions are based on what Googlebot actually receives, not necessarily what users see.
Serving Googlebot alternate or non-content pages
If Googlebot is shown bot challenges, pseudo-error pages, or other generic responses, those may match previously seen content and be treated as duplicates.
Failure to render JavaScript content
When Google cannot render the page, it may rely on the base HTML shell, which can be identical across pages and trigger duplication.
Ambiguity or misclassification in the system
In some cases, a URL may be treated as duplicate simply because it appears “misplaced” or due to limitations in how the system interprets similarity.Un browser fait par un seo pour les SEO. Payant mais qqes jours de tests gratuits. A voir si ca cree une vraie valeur ajoutee par rapport a un Chrome ultra customisé
Malgré l'arrivée de l'AI, toutes les responsabilités techniques demeurent intactes. Elles sont d'ailleurs encore plus importantes qu'avant vu que les bots des LLMs se comportent comme Googlebot en 2002... Ou en 2004 pour être gentil xD
Tres bon feedback sur l'evolution du SEO et la facon de penser pour la partie LLM. J'aime bien leur approche qui a du sens et reflete bien le chemin pris de mon côté.
Pratique pour partager sur l'evolution du marketshare des modeles de recherche
Differences entre tactique et approche strategique pour identifier des patters problematiques lors d'un crawl. Rien de nouveau, mais c'est toujours bien de le rappeler et d'ajouter du contexte avant de s'attaquer aux soucis techniques pour prioriser.
How to use data to get buy-in in SEO : quelques bonnes idées et j'apprécie qu'elle soit à fond dans la dataviz comme moi :)
Tres bon article qui resume bien ce que l'on peut tracker au niveau organique pour les resultats AI a l'heure actuelle.
Un service en ligne pour analyser des gros fichiers de log. A tester
Internet Archive Wayback Machine Link Fixer : une extension Wordpress plutôt chouette pour réparer les liens qui pointent vers des contenus qui n'existent plus.
Dans certains cas, lorsqu'une page n'existe plus, on va supprimer le lien ou le rediriger. Mais parfois, le contexte du contenu est vraiment focalisé sur le lien donc autant le faire pointer vers une archive qui fonctionne.
Implementations are described herein for augmenting a traditional search session with stateful chat—via what will be referred to as a “generative companion”—to facilitate more interactive searching. In various implementations, a query may be received, e.g., from a client device operated by a user. Contextual information associated with the user or the client device may be retrieved. Generative model (GM) output may be generated based on processing, using a generative model, data indicative of the query and the contextual information.
At least utilizing a custom corpus of documents to condition a large language model (LLM) when generating a response to a user query. In some implementations, a user query associated with a client device is received. An API query for an external application is generated by an LLM based on the user query.
A machine-learned system for modeling contextual data such as long user historical data is provided. The system includes a machine-learned embedding model and a machine-learned sequence processing model.
Google Patent
An example method for prompt-based query generation is provided. The method includes receiving, by a computing device, at least two prompts associated with a retrieval task to be performed on a corpus of documents associated with the task. The method includes applying, based on the at least two prompts and the corpus of documents, a large language model to generate a synthetic training dataset comprising a plurality of query-document pairs, wherein each query-document pair comprises a synthetically generated query and a document from the corpus of documents.