Que peuvent nous apporter les données structurées
Booster votre SEO grâce aux Données structurées
Parmi tous les outils dont disposent les spécialistes du SEO, Les données structurées figurent en bonne place dans la catégorie technique. C'est outil que vous devez mettre en place sur vos pages web si vous désirez aider les moteurs de recherche (Google, Bing ...) à bien comprendre et interpréter vos contenus et ainsi améliorer ainsi votre référencement.
Imaginez que vous êtes parmi les premiers heureux élus sur une page de resultat de recherche par mots clés (SERP). Et bien il vous sera fait honneur ! Et oui, les résultats présentés seront mis en avant et agréablement formatés (Rich Snippets) par Google. Ainsi naturellement votre trafic va augmenter, le taux de clics (CTR) également. Et voila, grâce aux données structurées votre visibilité va croissante. Les données structurées doivent absolument faire partie de votre stratégie SEO. Et nous allons voir comment.
Données structurées mais qu’est-ce donc ?
Avant tout revenons aux principe de bases de la recherche plein texte naturel. A l’origine les moteurs de recherche comme Google et Yahoo utilisaient différentes techniques de “text mining”, de nos jours les techniques sont à base d’intelligence artificielle, beaucoup plus robuste et puissante.
Mais, car il y a un mais ! Toutes ces techniques sont confrontées au douloureux problème de la “désambiguïsation”. Et oui nos langues sont truffées de synonymes, homonymes et metonymies. Le cerveau humain démine facilement ces problèmes dans les contenus, c'est une tout autre affaire pour les moteurs de recherche. C’est la que vont intervenir les données structurées.
Un peu de contexte
Vous le savez déjà, pour construire une page web, il vous faut au minimum du texte et du code HTML pour construire le squelette de la page. Le balisage HTML de votre page web va guider les moteurs de recherche lors de l'analyse du contenu au moment de l'indexation. Le balisage HTML permet également de fournir quelques méta-données très utiles à cette analyse. Ces balises sont situées dans la partie "HEAD" de votre page.
Vient ensuite le code CSS pour présenter de façon agréable et ergonomique vos contenus web.
Suivi éventuellement du code javascript pour l’interactivité.
Mais cela ne sera pas suffisant pour garantir efficacement le bon référencement de vos pages web. La dernière couche sera donc constituée des données structurées pour annoncer de façon claire et sans ambiguïté aux moteurs de recherche la nature, la thématique de vos contenus non structurés présents dans la page web.
Définition
Les données structurées sont des informations présentées de façon compréhensible par des programmes informatiques et normées grâce à un référentiel reconnu de tous (par exemple schema.org). Ces informations fournissent des détails sur les entités et les relations présentées dans des pages web.
Les trois formats des données structurées utilisés pour le SEO
Trois formats principaux existent pour l’utilisation dans une page web. JSON-LD, Microdata et RDFa.
JSON-LD
JavaScript Object Notation for Linked Data comme son nom l’indique permet d’encoder des données structurées dans un objet Javascript -JSON- en respectant un référentiel tel que Schema.org.
<script type="application/ld+json">
{
"@context": "https://schema.org/",
"@type": "Recipe",
"name": "Party Coffee Cake",
"author": {
"@type": "Person",
"name": "Mary Stone"
},
"datePublished": "2018-03-10",
"description": "This coffee cake is awesome and perfect for parties.",
"prepTime": "PT20M"
}
</script>
Microdata
Les microdonnées, ou Microdata, utilisent les attributs du balisage HTML « itemprop » et « itemtype » pour mettre en évidence les valeurs et les éléments pertinents de votre page Web.
RDFa
Comme Microdata ce format utilise les attributs du balisage HTML « property » et « typeof ».
Quels type d’entités mettre dans vos données structurées.
Ici les possibilités sont immense. Pour les connaitre, Schema.org fournis une liste complète sur son site web. Vous y trouverez également pour chaque entité toute la liste des propriétés de chacune. Les entités sont classés dans un arbre, ce qui permet d’utiliser la notion d’héritage. La racine de cette arbre est l’entité Thing. Comme toutes les entités héritent des propriétés de leur parents. Votre entité héritera forcement de Thing et aura par exemple les propriétés “name, image, sameas... ” par exemple mais aussi beaucoup d'autres.
Il est utile de préciser que les entités couramment utilisé par Google sont :
- Evénement
- Article
- Produits
- Entreprise locale
- Film et émission TV
- Musique
- Vidéo
- Recette
- Critique
- Website
Il est donc important de privilégier ces entités en premier lieu.
Tout bon site internet d’entreprise qui se respecte devrait au minimum avoir une entité entreprise locale “LocalBusiness” et site web “Website” sur la page d’accueil. A partir de la vous pouvez construire au fil de vos page web un profil structuré de votre entreprise ou activité clairement identifiable par les moteurs de recherche. Rattacher des articles, des produits, des avis... la liste est longue.
A noter que dans le cas d'un site de e-commerce, l'utilisation des données structurées pour les produits est indispensable voir incontournable à notre avis.
Pour une bonne utilisation des données structurées.
Tout comme la sur-optimisation des mots clés dans les contenus ou les méta-data, limitez-vous aux données principale de vos pages. Sinon les moteurs risquent de vous pénaliser et ce n’est pas le but recherché ;-). Chatouiller les algorithmes de Google, bing et compagnie est une bonne chose, les spammer en est une autre et tout a fait néfaste.
Il est bon de savoir que Google préconise l'utilisation du format Json-ld dans vos page pour la représentation de vos données structurées, car avec ce format placé dans la balise HEAD de votre page vous ne modifiez, ni n'ajoutez de noeuds dans le balisage HTML ( a l'inverse des formats Microdata et RDFa qui altere vos balise HTML) . Ceci a de l'importance au moment de rendu de la page dans le navigateur, et évite les problèmes éventuels de code HTML non conforme aux règles du W3c (Voir notre article sur la qualité du code HTML pour le SEO).
Très important vous ne devez pas intégrer de contenus dans vos données structurées qui ne soient pas présents dans votre page web. Sinon vous risquez de ne pas bénéficier des avantages de cette technique. Et ceci tant que vous n'aurez pas corrigé les valeurs des champs de l'entité. Pour être plus clair, supposons une entité Article avec sa propriété ArticleBody. Si dans votre page web le corps du texte principal est différent de celui contenu dans la propriété ArticleBody de vos données structurées, vous vous exposez à de potentiels problèmes d'indexation.
N’hésitez pas à lier vos données structurées entre-elles grâce à la propriété @id de chaque instance d'entité présente. Il est également intéressant de précisez la nature de vos contenus avec les propriété “about, knowsAbout, sameAs”. Fournissez des références de qualités dans ces propriétés tel que Wikpédia et le site de Google lui même. Ainsi vous aidez les moteur à bien comprendre et accréditer la nature exact de votre propos.
"knowsAbout": [
{
"@type": "thing",
"name": "web development",
"sameAs": [
"https://fr.wikipedia.org/wiki/Programmation_web",
"https://www.google.com/search?q=web+development&kgmid=/m/02wdy8"
]
},...
Quels bénéfices dans le SERP
Sur la page de résultats de recherche de Google les résultats sont présentés sous la forme de snippet, cet extrait présente le titre et la description présents dans les méta-données de votre page. Ceci est la base, mais grâce à vos données structurées il est possible que ce snippet soit un peu voir beaucoup enrichi (Rich snipetts). Ceci en fonction de votre position et de votre "authority" sur le web.
Ci-dessous en rouge les éléments directement construits à partir des données structurées fournies par le site internet.
Ce qu’il faut retenir
Le référencement des pages internet est un jeu hautement concurrentiel. Créer une simple page avec son article, l’héberger et ensuite attendre patiemment qu’elle fasse référence dans votre domaine, n’est surement la meilleur des stratégies.
Performance des pages, qualité du code source, accessibilité des contenus, choix pertinent des mots clès utilisés, et utilisation des données structurées sont incontournable pour espérer pouvoir figurer dans les 5 meilleurs places sur le SERP et pouvoir profiter des Rich snippets et du Knowledge Graph de Google.
J’espère que l'agence web Versio vous a éclairer sur ce sujet parfois méconnu des non spécialiste du référencement (SEO).