Le rôle des robots d'indexation

Forum de discussions sur phpBB
Aucune aide pour un problème précis ne sera donnée ici !
Règles du forum
Ce forum est destiné aux discussions sur phpBB.
Pour un problème dans l'utilisation de phpBB merci d'utiliser les forums de support.
Avatar du membre
Fred Fred
Fondateur
Messages: []
Enregistré depuis: 4 ans 11 mois
Identité: Fred Rimbert
Forum phpBB: https://caforum.fr
Localisation: Le Lude - Pays de la Loire
Intérêt: GitHub

Le rôle des robots d'indexation

Message par Fred »

Un robot d'indexation (en anglais web crawler ou web spider, littéralement araignée du Web) est un logiciel qui explore automatiquement le Web. Il est généralement conçu pour collecter les ressources (pages Web, images, vidéos, documents Word, PDF ou PostScript, etc.), afin de permettre à un moteur de recherche de les indexer.

Fonctionnant sur le même principe, certains robots malveillants (spambots) sont utilisés pour archiver les ressources ou collecter des adresses électroniques auxquelles envoyer des courriels.

En français, depuis 2013, crawler est remplaçable par le mot collecteur.

Il existe aussi des collecteurs analysant finement les contenus afin de ne ramener qu'une partie de leur information. Des frameworks tout faits comme Scrapy existent pour écrire de tels robots.

https://fr.wikipedia.org/wiki/Robot_d%27indexation


Une petite vidéo explicative :

https://youtu.be/VG7Eu1DbUio