18 avril, 2007

Suppression des pages de l'index de Google

Jusqu'à présent le meilleur moyen d'empecher l'indexation des pages de votre site de Google est d'utiliser le fichier robot.txt ou les balises META "noindex".
Pour les pages déjà indexées il fallait attendre la visite du moteur pour voir cette suppression effectuée.

Google Webmaster Central propose maintenant dans son Webmaster tool de gérer très simplement la suppression de pages de l'index via "la suppression d'URL".

Outil de suppression d'url dans l'index de Google via Google Webmaster Central

Plus d'info sur le blog de Google Webmaster Central

Source : Blog Google Wemaster Central

17 avril, 2007

Balise NOYDIR Yahoo Search

Après la mise en route de la balise noodp, Yahoo nous propose maintenant la balise NOYDIR (NO Yahoo DIRectory) afin d'éviter que le moteur Yahoo prennent le titre et descriptif inséré dans l'annuaire Yahoo comme titre et description dans les résultats organiques.

< META NAME="ROBOTS" CONTENT="NOYDIR" >

ou

< META NAME="Slurp" CONTENT="NOYDIR" >


Vous pouvez donc coupler cela avec la balise NOODP :

< META NAME="ROBOTS" CONTENT="NOYDIR, NOODP" >

Source : Yahoo Search Blog

Google rachete DoubleClick = Proces avec Microsoft

Google vient de racheter DoubleClick pour 3,1 milliards de dollars, après une compétition entre AOL, Microsoft et Yahoo.

La réponse de Microsoft ne s'est pas faite attendre : elle attaque en justice Google pour abus de position dominante...

Selon l’entreprise, ce rachat « soulève des inquiétudes sérieuses sur la concurrence et la vie privée en ce qu’elle donne à la combinaison Google DoubleClick un contrôle sans précédent sur la délivrance de publicités en ligne, et un accès à un nombre très important d’informations sur les consommateurs en traquant ce que les consommateurs font en ligne. »


Source : Info du net

Sitemap et fichier robot.txt

Dans un précédent message je vous parlais d'un protocole commun de fichier SiteMap pour les moteurs de recherche. Vous devez désormais rajouter une ligne de texte dans le fichier robots.txt (situé à la racine du site) contenant le mot sitemap et l'URL du fichier Sitemap sur le site :

Sitemap: < URL du fichier sitemap >

Le fichier robots.txt sert de manière générale à indiquer les parties que l'on ne souhaite pas indexer.

Cela devrait simplifier les démarches pour tout le monde, c'est à dire au lieu de soummettre votre Sitemap à Google dans Webmaster Central et à Yahoo dans Site Explorer (MSN/Live à venir).

Vous pouvez aussi soummettre votre sitemap via une requête http (ping).

Source : Blog Sitemaps.org