Le rôle des robots d'indexation

Discussions sur phpBB
Aucune aide pour un problème précis ne sera donnée ici !
Message par Fred »
Avatar du membre
Fred
Messages : 2539
Enregistré depuis : 2 ans 11 mois
Identité : Fred Rimbert
Site internet : https://caforum.fr
Localisation : Pays de la Loire
Intérêt : GitHub

Le rôle des robots d'indexation

Message

Un robot d'indexation (en anglais web crawler ou web spider, littéralement araignée du Web) est un logiciel qui explore automatiquement le Web. Il est généralement conçu pour collecter les ressources (pages Web, images, vidéos, documents Word, PDF ou PostScript, etc.), afin de permettre à un moteur de recherche de les indexer.

Fonctionnant sur le même principe, certains robots malveillants (spambots) sont utilisés pour archiver les ressources ou collecter des adresses électroniques auxquelles envoyer des courriels.

En français, depuis 2013, crawler est remplaçable par le mot collecteur.

Il existe aussi des collecteurs analysant finement les contenus afin de ne ramener qu'une partie de leur information. Des frameworks tout faits comme Scrapy existent pour écrire de tels robots.

https://fr.wikipedia.org/wiki/Robot_d%27indexation


Une petite vidéo explicative :

https://youtu.be/VG7Eu1DbUio
Partagez cette page
Twitter Whatsapp Linkedin Email
Vous devez être membre du forum pour répondre
Inscrivez-vous pour participer au forum ou Connecter-vous à votre compte.