Moteurs de recherche
Qu'est-ce qu'un moteur de recherche ?
Un moteur de recherche est un outil qui permet de trouver des informations sur le Web. Il explore, indexe et classedes milliards de pages pour te donner les résultats les plus pertinents.
En chiffres : Google indexe plus de 130 000 milliards de pages et répond à 8,5 milliards de requêtes par jour !
Parts de marché des moteurs
À noter : Google domine le marché, mais il existe des alternatives qui respectent mieux ta vie privée (DuckDuckGo, Qwant) ou qui ont un impact écologique positif (Ecosia).
Comment fonctionne un moteur de recherche ?
Les robots (spiders/bots) parcourent le Web en suivant les liens
Le contenu des pages est analysé et stocké dans une base de données
Un algorithme classe les pages par pertinence pour chaque recherche
Les résultats sont présentés à l'utilisateur
Le Crawling : les robots explorateurs
Les moteurs de recherche utilisent des programmes appelés robots(ou spiders, bots, crawlers) pour explorer le Web :
Ce que le robot peut voir
- - Le texte de la page
- - Les balises HTML
- - Les liens hypertextes
- - Les métadonnées
Ce que le robot ne peut pas voir
- - Le contenu des images
- - Les pages protégées
- - Le JavaScript complexe
- - Le contenu bloqué (robots.txt)
L'indexation : la bibliothèque géante
Une fois explorée, chaque page est analyséeet stockée dans un index (comme le catalogue d'une bibliothèque) :
Mots-clés, titres, structure
Dans l'index géant
Mots → Pages
Exemple : Quand tu cherches "recette pizza", l'index contient une liste de toutes les pages qui parlent de "recette" et de "pizza". Le moteur croise ces listes pour te donner les pages qui contiennent les deux mots.
Le PageRank : l'algorithme de Google
Google a révolutionné la recherche avec son algorithme PageRank, inventé par Larry Page et Sergey Brin en 1998 :
"Une page est importante si beaucoup de pages importantes pointent vers elle"
Page peu populaire
0 liens entrants
Page populaire
100 liens entrants
Page très populaire
1000 liens entrants
Aujourd'hui : Google utilise plus de 200 facteurs pour classer les pages (contenu, vitesse, mobile-friendly, liens, etc.). Le PageRank n'est qu'un des nombreux critères.
À toi de jouer !
Compare les résultats de différents moteurs de recherche :
- 1Choisis une requête (ex: "climat changement")
- 2Fais la même recherche sur Google, Bing et DuckDuckGo
- 3Compare les 5 premiers résultats de chaque moteur
- 4Note les différences : sources, ordre, publicités...
Quiz : Teste tes connaissances
5 questions sur les moteurs de recherche
À retenir
- Un moteur de recherche explore, indexe et classe le Web
- Les robots parcourent le Web en suivant les liens
- L'index est une base de données de toutes les pages
- Le PageRank classe les pages selon leur popularité (liens)
