Du SEO, d'HTML5 et des évolutions sémantiques diverses

Alors ? Toujours réfédacteur© ? Expert SEO du contenu ?

Non. Enfin, si... mais pas seulement.
Ah ! Et ton bleug ?
En jachère depuis deux ans.
2 années sans le mettre à jour ? Tu livres donc encore à tes visiteurs des conseils ayant dépassé la date de péremption !
Oui... enfin.. non : sur la rédaction pour les humains ils demeurent valables.

• • •

Le SEO sur le contenu rédactionnel c'est mort ?
Tel que je pratiquais il y a encore 1 an, oui.

L'optimisation du contenu rédactionnel

 doit se faire de manière différente aujourd'hui. Mais si n'y croyez pas je peux vous donner une liste de rédacteurs Web qui vous expliqueront ce qu'ils ont cru comprendre (et souvent mal — j'ai des noms) de mes conseils de réfédacteur©.
D'aucuns les suivent encore en pariant que ces recettes, maintenant éculées, seront bénéfiques pour le positionnement de leurs pages. Eh non ! Elles n'auront pas plus d'effet sur les moteurs de recherche qu'une pilule de Viagra sur un eunuque. Pire encore, elles peuvent entraîner des effets secondaires. Il est même contre-indiqué de les appliquer à un site pauvre en contenu rédactionnel : c'est le blacklistage assuré.

Réfédacteur© ?

 Il y a quelques années c'était cet expert pompeux de la rédaction antinaturelle pour le référencement naturel. Tel un bonze qui récite et compte ses mantras (mot-clé - mot clé - mot clef - mot-clef) il dosait savamment ses articles :
Pour ma farce aux robots je vais mettre 2 kilos de primaires et 1 kilo de secondaires pour le châpo, 5 à 600 grammes pour mes en-têtes et saupoudrer le reste d'une bonne chapelure de cooccurrences qui va croustiller sous la dent du robot.
Tout cela bien sûr sans dépasser la règle du « nombre d'or » qu'emploie Google dans ses algorithmes pour le calcul de la densité (tout cela étant un secret bien gardé par les référenceurs qui considèrent Google comme une société secrète dont ils sont les initiés...).
Ça eut marché. Mais ça marche plus. Depuis un bon moment et sans doute bien avant que je m'en aperçoive d'ailleurs. Restons modeste et génial.

Le rédacteur, les clients et le robot

Qui rédige les meilleurs contenus ?

rédacteurs Web heureux

C'est souvent le client, pas le rédacteur externe. Et chez le client, plus souvent le technicien que le vendeur. J'en ai eu la révélation quelques semaines après une séance de formation à l'écriture Web que je dispensais il y a plus d'1 an. Pour l'anecdote, j'avais 2 groupes à former : des commerciaux et des chefs produits, (ces derniers plus techniciens qu'hommes marketing), tous préoccupés par la réussite commerciale de leurs produits technologiques.
L'objectif était de produire un texte ciblé de 2 000 signes optimisé pour les moteurs, informatif pour les visiteurs et convaincant pour les prospects. Avant la formation, j'avais demandé à chacun de me produire ce texte. Je les ai reçu très vite.

Un canard c'est moins intelligent qu'un homme

D'accord : ça marche aussi, ça nage aussi... mais, en plus, ça vole. Et l'un des participants, un technicien, savait mieux vendre que le commercial. Sans le savoir. C'était mon canard. Son texte, informatif, partait des questions du client auxquelles il apportait des solutions. Je le passe à mon banc qui extrait le contenu sous la forme d'un nuage de mots-clés, comme ici pour la page d'accueil de mon site : Nuage de mots reflétant leurs poids dans l'analyse sémantique de la page d'accueil du site de rédaction SEO pour le Web, hiseo.fr et... bingo ! Si son article ne comportait aucun des mots-clés que m'avait confié leur responsable l'exhaustivité du vocabulaire permettait autour du thème une extraction sémantique dont sont aujourd'hui capables les moteurs de recherche...
Sa copie ne nécessitait donc aucune optimisation mais il fallait encore le vérifier.
Avec le webmestre nous avons alors conçu 2 pages pour présenter les 2 articles (celui du commercial et celui du technicien). 2 pages que nous avons ensemble travaillé (cela faisait partie de ma mission) pour les robots sans toutefois optimiser le contenu principal.
6 mois plus tard celle de mon canard était toujours vivante, bien positionnée dans les SERP et par ce fait, mais pas seulement, générait plus de contacts que celle du vendeur. Le sujet avait été parfaitement circonscrit grâce au jargon métier commun à ce spécialiste et son client.
Moralité : c'est quand on ne vend pas qu'on vend le mieux.

Trop bot pour être vrai ?

robot de moteur de recherche sachant lire et appréhender le sens d'un contenu rédactionnel

Utiliser ce vocabulaire associé au sujet plutôt que de répéter les mots-clés c'est aujourd'hui ce que Google recherche. Les bots sont devenus plus exigeants, plus intelligents. La densité des mots-clés optimale ? C'est fini. Je suis même certain que les sites Web dont le contenu a été optimisé — un texte, par exemple, qui comporterait 10% de mots-clés répétés — sont pénalisés et déclassés.
Abandonner l'utilisation des mots-clés alors ? Non bien sûr. C'est un aspect essentiel du mix SEO. Le rédacteur devra toujours :

  1. procéder à l'analyse des recherches des clients potentiels pour identifier les mots-clés
  2. enrichir le champ lexical en extrayant par la proxémie les termes les plus pertinents pour chaque mot-clé cible
  3. rédiger ensuite en se plaçant du point de vue du lecteur
  4. vérifier enfin que l'ensemble des vocables retenus a bien été utilisé

Revenons maintenant aux robots...

Comment les moteurs de recherche comprennent-ils le texte ?

 Dans un récent coup de gueule contre les pratiques du « content spinning » j'expliquais que les robots peuvent écrire sur un même sujet autant de versions différentes d'articles, chacune étant adapté au média dans lequel il sera publié. Si les robots savent écrire ils savent lire aussi (je n'ose imaginer ce jour où Google compilera nos écrits disponibles sur le Web ou ailleurs pour les republier à son compte !).

L'intelligence artificielle a été greffée dans leurs têtes. Il savent analyser le champ sémantique du contenu, en extraire le sens et, éliminer même les vocables hors-sujet. Dans un avenir très proche ils seront capables de comprendre exactement ce que vous recherchez : vous aurez saisi votre question en langage naturel ; il vous apportera une réponse plutôt qu'une liste de résultats basés sur les mots-clés. Cela existe déjà. Allez faire un tour sur le site de Wolfram|Alpha qui fournit déjà une réponse à une question précise (posée en anglais). Par exemple, à la question « Quelle taille mesure Nicolas Sarkozy ? », le moteur vous répondra qu'il est si petit qu'il n'a pu la trouver. Plutôt que lire mes conneries, rendez vous là-bas, vous comprendrez immédiatement de quoi Google sera bientôt capable.
Hélas, quand je lis les conseils de rédacteurs Web et de référenceurs qui ne prennent pas en compte la dimension sémantique et parlent encore de placements idéals, de densités des mots-clés... Quoi ? Non : rien.

Sémantique et sémantiques

Les bons référenceurs, les meilleurs rédacteurs le savent : ce qui entoure le texte est tout aussi important pour le référencement de la page. Et c'est là que j'enfourche mon « dada » : la sémantique — car la sémantique, c'est mon truc.
La sémantique des balises et non celle du contenu (je suis certain que vous m'aviez vu venir avec mes gros sabots)... car, mes très chers frères, mes très chères sœurs, avec HTML5, les balises aussi sont devenues intelligentes.
Mais pour autant ce balisage sémantique va t-il devenir plus important que la rédaction de contenu ? Un lecteur, dans un commentaire récent, ne voyait pas en quoi HTML5 allait améliorer le référencement :

Pour ma part je ne vois pas en quoi le code d'une page va permettre une meilleur indexation. A moins que ce soit du Flash ;-)
C'est d'abord le contenu qui fait le référencement et ensuite le nombre de liens externes qui pointent vers le site. La structure sémantique de la page ? Tu le dis déja : les robots savent reconnaître les zones à indexer alors je vois pas en quoi ça va changer grand chose.

Ce qui se passe autour du Web sémantique, c'est tout simplement le rêve, celui de Tim Berners-Lee (« The Web of data ») qui permet l'échange des schémas de nos données ainsi que la sémantique associée. Si HTML5 introduit dans sa norme ces formats (en particulier les microdonnées avec itemprop et itemscope) il est évident que cela renforce l'intérêt de l'adopter pour le SEO.
Le codage en HTML5, lui, avec ses balises sémantiques, n'a pas vocation à renforcer la sémantique du contenu. Il permet tout simplement d'indiquer la caractéristique ou le rôle de la section balisée dans la page. Le résultat final c'est un moteur de recherche qui identifie avec précision toutes les informations en satellite du contenu principal, les relie à l'intérieur et à l'extérieur du site et constitue ainsi, autour de cette page et de son sujet, un océan d'informations sémantiquement proches où les robots vont pêcher.

C'est en cela qu'HTML5 va constituer une révolution, pour nous, professionnels du code, référenceurs et rédacteurs, qui allons devoir reconsidérer notre manière de baliser, de structurer les sites et les pages, de rédiger des contenus. Certains le vivront comme de nouvelles contraintes. D'autres comme une formidable opportunité de bizness.
La messe est dite : vous pouvez ranger vos missels et vous précipiter au bistrot pour en discuter.




Commentaires :

Christophe||#1
Christophe
Clap clap clap !
Très bel article, tout à fait d'accord sur l'ouverture qu'offre le HTML 5 en cartographiant le contenu au sein d'un site.

Pourtant, au regard de la "jeunesse", de la non ou mauvaise interprétation de ce code par certains navigateurs, même récents, je ne suis pas encore prêt à coder en HTML5 dans le cadre professionnel, pour le compte d'un client final.

La compatibilité navigateurs reste selon moi encore un enjeu majeur, le temps de chargement d'une page comptant a priori pour le positionnement d'un site internet dans l'algorithme de Big G.
Le truffer de hacks javascript & co pour palier à l'incurie de certains navigateurs ne serait-ce que de IE me semble rédhibitoire, voire risqué pour pour un site dont l'objectif est de convaincre ou vendre.
Privé un visiteur d'un contenu pertinent parce que son navigateur est incapable d'interpréter telle ou telle portion de code me semble dangereux : HTML5 ne propose pas nativement d'alternative (je pense par exemple au contenu audio ou video), c'est sans équivoque.

Paradoxalement, (après j'arrête c'est promis) je me dis qu'il en faut au moins un pour faire avancer le schmilblick, un éclaireur convaincu et militant comme tu le fais si bien d'ailleurs.

En ce qui me concerne, j'appréhende ce code comme un jeu, non pas que je ne le prenne pas au sérieux, mais plutôt le juge précoce.

A y est ! fini ! Tu peux venir m'essuyer !

PS : au fait, je n'ai pas saisi le rapport avec le 301 ?
Sylvain (AxeNet)||#2
Sylvain (AxeNet)
Quand je pense que cet article est la réponse à un de mes tweets de tout à l'heure, je me dis que Twitter n'est pas près de remplacer les blogs :-)

Je comprends la difficulté de résumer cela en 140 caractères :-)

Pour revenir au sujet.
Ce serait-y-pas que tu deviendrais sectaire avec le HTML 5 ?

Non, je rigole, d'ailleurs, même si je rejoins l'avis de Christophe ci dessus, je suis persuadé que celui-ci ( le HTML 5) nous offre des possibilités extraordinaires... dès que les utilisateurs auront abandonnés IE6.

Non non, je ne rigole pas. Un exemple : nous avons un client qui a un site qui est notamment visité par les cabinets comptables Aïe Aïe Aïe : 40% sous IE6.

Mais pour revenir au sujet.

Je trouve ton exemple du technicien et du commercial excellent. Je crois dur comme fer à l'utilisation d'un champ sémantique travaillé pour produire les contenus. L'exemple que tu donnes est flagrant, en utilisant le vocabulaire des clients et de leurs questions, le technicien a sans doute élargi ce champ sémantique, ce qui a produit un résultat gagnant.

D'ailleurs, je suis persuadé que les marketeurs sont de mauvais réfédacteurs. Les tournures alambiquées consistant à remplacer le mot "tournevis" par "utilitaire rotatif non consommateur d'énergie fossiles" me fait toujours sourire. OK OK, je ne mets pas tous les marketeurs dans le même sac, mais franchement, je reçois parfois certains textes...

Maintenant, pour revenir au SEO pur et dur, il suffit de voir les balises TITLE des sites de la première page pour une requête donnée pour se dire que les moteurs ont encore un peu de chemin à faire.

Je ne dis pas que cela ne viendra pas, mais à ce jour, certaines optimisation bien bourinnes sont encore assez efficace (je parle juste de la balise Title).

En gros, les bons vieux basiques : architecture, contenus, linking sont toujours d'actualité, même si le travail sur le contenu n'est plus tout à fait le même qu'il y a 5 ans.

D'ailleurs, quand on voit les résultats sur le concours Seochuck (dont je suis un fier sponsor : pub inside : http://blog.axe-net.fr/motercalo/ ) on se rend bien compte que nombre de places sont squattés par des filous du scrapping et du content spinning), alors le contenu... Bon, ils ont tout de même mis l'usine à BL en marche en parallèle.

En ce sens, je rejoins ton avis, mais je pense tout de même que tu es un visionnaire et un précurseur et qu'il est parfois dangereux d'aller beaucoup plus vite que la musique.

S'il te plait, Philippe, ne fini pas comme Galilée, je t'aime !

ps: bon, je crois bien que j'aurais eu aussi du mal à te répondre avec un tweet ;-)
Philippe||#3
Philippe
Merci pour les clap-claps, Christophe...

Si je fais du prosélytisme pour HTML5 c'est parce que j'ai la prétention de dire qu'HTML5 c'est un avenir... immédiat.

Pas besoin d'embarquer 200 ko de hacks JS ou CSS pour pouvoir être lisible par des navigateurs antédiluviens. Antédiluvien aussi sera le code HTML4 dans quelques temps. Tu peux me croire : ça avance à grands pas. À très grand pas car HTML5 a des bottes de 7 lieues

301 - Redirect permanent ? Ce blog est expérimental. Le code, le SEO... là je voulais exclure le titre pour tester l'indexation de la page sur le contenu seul pour le référencement. 301 c'est "moved permanently", mais pour cet article c'est 301 - Bouge-toi en permanence.

Autrement dit : ne reste pas sur tes vieilles lunes.
Philippe||#4
Philippe
Sylvain : j'étais en train de rédiger ma réponse à Chris là-haut quand j'ai découvert ton commentaire.

Je dois filer pour rejoindre ma belle mais je te réponds demain. Promis.
Sylvain (AxeNet)||#5
Sylvain (AxeNet)
Meuh non, l'avenir, c'est la pelle !

Le couteau suisse chinois est une pelle

OK, je sors...

Sans omettre d'ajouter que je suis pressé d'être dans cet avenir radieux.
Houston Search Engine Optimization||#6
Houston Search Engine Optimization
Tres bel article (C'est la qu'on voit les redacteurs) qui resume plus ou moins bien ma pensee... un petit bemol toutefois quand a la densite de mots cles ... moi je l'ai transforme en "keyword focus" qui est une notion differente a savoir l'emploi du mot cle cible dans un contexte semantiquement pertinent. Ca ne veut pas forcmeent dire mettre a balle de mots cles dans la page mais plutot l'utiliser un poil plus qu'a bon escient dans une page bien ecrite vis a vis du sujet concerné... je sais pas si je suis completement clair.
Philippe||#7
Philippe
Houston? Do we we have a problem?
Not at all buddy.

Your "keyword focus" should be similar to my tag cloud pic above.
Philippe||#8
Philippe
@ Sylvain

- sectaire avec HTML5 ? Ouf ! Là je ne sais vraiment trop quoi répondre...
intolérant, intransigeant, rigide, sévère, exclusif, étroit, sectateur, partisan, partial, intraitable, furieux, fanatique, ... ?

peut-être, c'est toi qui décide... mais rajoute passionnément.

- « il est parfois dangereux d'aller beaucoup plus vite que la musique. »
Je cherche. Je teste. Je prouve. À cette heure rien ne peut me faire penser que j'ai une note d'avance.

- « (...) HTML 5 nous offre des possibilités extraordinaires... dès que les utilisateurs auront abandonnés IE6. »
C'est aussi ce que d'autres pensent.
Pourtant, ce n'est pas si compliqué d'apprendre HTML5 aux vieilles versions d'IE de Micromou.
Philippe||#9
Philippe
Tests terminés sur la balise title.

« 301 - Redirect permanent »
devient :
« Du SEO, d'HTML5 et des évolutions sémantiques diverses »
SEO Houston||#10
SEO Houston
"Your "keyword focus" should be similar to my tag cloud pic above"

je ne suis pas sur - je pense que mon idee de la chose est plus proche de la "keyword density" que toi ... plus technique et moins poete je dirais... (pour une fois). Un autre concept interessant que je suis c'est la "conformité semantique" - a savoir mettre les mots cles important (et/ou des synonymes / mots proches ) sur l'ensemble du chemin des robots (ancre du lien (quand possible) entrant / title / description / kwds / headings / corps de texte/ ancre lien sortant / page sortante (quand possible)... a mediter
Alban||#11
Alban
On n'a pas besoin d'HTML 5 pour introduire des microformats et des microdata !!!
Philippe||#12
Philippe
@ Alban
Ah ? J'ai dit çà ?
Non : simplement que 2 attributs de microdonnées se trouvaient cette fois dans la norme HTML5...

Microformats et microdonnées concernent HTML4 et XHTML tout autant. Poil aux dents.

@ SEO Houston
Mais mais ! C'est que tu enfreins ton NDA en livrant ainsi des secrets industriels. Fais attention tu pourrais être bientôt muté au bureau que ta boîte va monter en Alaska.

Ton truc de « conformité sémantique » me rappelle des souvenirs : en juin 1990 j'étais associé pour une partie dans une mission de conseils auprès d'un éditeur français dans le domaine juridique. Les types avec qui je bossais étaient des brutes des architectures de l'information utilisant l'ontologie pour la classification sémantique de millions de textes.
Tout le SI devait être construit avec SGML et (tu vas rigoler) j'y pigeais que dalle mais je faisais semblant. Si bien qu'ils m'ont embauché ensuite pour diriger l'une de leurs filiales. :-D
Bernie||#13
Bernie
Salut,
l'article est bien mais tout ça n'est pas nouveau.
Ca doit faire 1 an que Google a mis en place la techno d'AdSense "Latent Semantic Indexing" dans le moteur de recherche.

En pratique le robot va rechercher tous les mots pouvant être associés à un sujet par l'analyse lexicale pour déterminer de quoi parle la page.
Alors oui il ne faut surtout pas répéter les mot-clés car le moteur croit qu'on le spamme et c'est direct à la poubelle.
Mobile ready website||#14
Mobile ready website
"Alors oui il ne faut surtout pas répéter les mot-clés car le moteur croit qu'on le spamme et c'est direct à la poubelle."

- Et pourtant ...

@Philippe -"brutes des architectures de l'information utilisant l'ontologie pour la classification sémantique"

Tiens ca me rapelle quelqu'un mais c'est un mauvais souvenir car ils ont essaye de nous la jouer a l'envers... j'espere que c'etait pas toi .. ;op

Les commentaires pour ce billet sont fermés