Meta-tag


Une page html est constituée de 2 parties :

Nous allons nous intéressés à 2 de ces meta-tag (ou meta balises) : DESCRITPION et KEYWORDS .


Description d'une page

Sous Altavista, dans la page des résultats, sous le titre de la page apparaît une description de la page. Cette description est en fait issue de la meta balise DESCRIPTION, lorsqu'elle existe. Si en effet elle n'a pas été renseignée, se sont les premiers mots de la page qui apparaissent comme description. L'intérêt de renseigner cette balise est de pouvoir être mieux indexé par les outils de recherche. Ces derniers se servent en effet des termes qu'ils trouvent dans cette meta balise pour classer un site.

Des abus ayant été constatés, ces termes ne sont pratiquement plus utilisés dans le calcul de la pertinence d'une page. Ainsi en est-il de l'autre meta balise KEYWORDS.

Mots clés d'une page

Afin d'aider un outil de recherche à bien indexer un site, vous pouvez renseigner la meta balise KEYWORDS avec des mots clés qui vous semblent pertinents pour montrer la richesse des informations contenues dans vos pages. Seul les 1 000 premiers caractères sont pris en compte.

Comme dit précédement, suite à des abus, ces termes ne servent plus à calculer la pertinence d'une page. En effet, certains malins mêlent termes propres à leur site mais aussi termes qui amènent du trafic (sexe, mp3, ...).

Utilisation de ces données

Ces 2 type de données peuvent vous servir pour compléter votre corpus et ainsi voir quels sont les termes qui amènent du bruit ou quels sont ceux qui sont pertinents. Les termes qui apparaîssent fréquement sont à considérer comme trop génralistes, vous pouvez donc les enlever. A contrario, ceux plus rares qui en plus sont inscrits dans les balises de sites considérés comme intéressant sont à rajouter à votre requête.

De plus, ils vous permettent de voir la validité d'un site. En effet, si ce dernier utilise des termes qui n'ont rien à voir avec son information, cela signifie qu'il cherche à amener du trafic, donc que ce n'est pas un site sûr.

Les évolutions

Deux simples balises, même si on peut bien les renseigner, peuvent sembler peut pratiques pour bien décrire une page. D'autant plus qu'elle peuvent contenir tout type de données, aussi bien des mots clés que des dates, des noms de personnes, .... Afin d'aider à une meilleur compréhension des données, le concept de metadonnées est apparu. Une metadonnées est une données sur une données. Cela permet donc de décrire une données. Par exemple, on a la balise author , et cette balise indique que la donnée qui suit est une suite de lettre renvoyant à un être humain et que cet humain a écrit le document qu'on lit.

Le Dublin Core

Cette norme internationale contient une quinzaine d'éléments qui permettent de bien renseigner une page (nom, date, mise à jour, organisme, ...). Un site dédié à cette norme est consultable : dublincore.org

Le format RDF

Lié cette fois-ci à la technologie XML, un format permet de décrire ce que l'on nomme les meta-données : le format Resource Description Framework. Pour avoir une description de ce format : www.w3.org/RDF/.

Pour en savoir plus

Sommaire
Informations textuelles