Le Web/Moteurs de recherche

Moteurs de recherche

20 min Cours 7/10

Qu'est-ce qu'un moteur de recherche ?

Un moteur de recherche est un outil qui permet de trouver des informations sur le Web. Il explore, indexe et classedes milliards de pages pour te donner les résultats les plus pertinents.

En chiffres : Google indexe plus de 130 000 milliards de pages et répond à 8,5 milliards de requêtes par jour !

Parts de marché des moteurs

GoogleLe plus utilisé au monde
91%
BingMoteur de Microsoft
3%
YahooUtilise Bing
1.5%
DuckDuckGoRespecte la vie privée
0.5%
QwantMoteur français
0.3%
EcosiaPlante des arbres
0.2%

À noter : Google domine le marché, mais il existe des alternatives qui respectent mieux ta vie privée (DuckDuckGo, Qwant) ou qui ont un impact écologique positif (Ecosia).

Comment fonctionne un moteur de recherche ?

Étape 1Exploration (Crawling)

Les robots (spiders/bots) parcourent le Web en suivant les liens

Étape 2Indexation

Le contenu des pages est analysé et stocké dans une base de données

Étape 3Classement (Ranking)

Un algorithme classe les pages par pertinence pour chaque recherche

Étape 4Affichage

Les résultats sont présentés à l'utilisateur

Le Crawling : les robots explorateurs

Les moteurs de recherche utilisent des programmes appelés robots(ou spiders, bots, crawlers) pour explorer le Web :

explore
Le robot suit les liensdécouvre de nouvelles pagessuit leurs liensetc.

Ce que le robot peut voir

  • - Le texte de la page
  • - Les balises HTML
  • - Les liens hypertextes
  • - Les métadonnées

Ce que le robot ne peut pas voir

  • - Le contenu des images
  • - Les pages protégées
  • - Le JavaScript complexe
  • - Le contenu bloqué (robots.txt)

L'indexation : la bibliothèque géante

Une fois explorée, chaque page est analyséeet stockée dans un index (comme le catalogue d'une bibliothèque) :

Analyse du contenu

Mots-clés, titres, structure

Stockage

Dans l'index géant

Association

Mots → Pages

Exemple : Quand tu cherches "recette pizza", l'index contient une liste de toutes les pages qui parlent de "recette" et de "pizza". Le moteur croise ces listes pour te donner les pages qui contiennent les deux mots.

Le PageRank : l'algorithme de Google

Google a révolutionné la recherche avec son algorithme PageRank, inventé par Larry Page et Sergey Brin en 1998 :

"Une page est importante si beaucoup de pages importantes pointent vers elle"

A

Page peu populaire

0 liens entrants

B

Page populaire

100 liens entrants

C

Page très populaire

1000 liens entrants

Aujourd'hui : Google utilise plus de 200 facteurs pour classer les pages (contenu, vitesse, mobile-friendly, liens, etc.). Le PageRank n'est qu'un des nombreux critères.

À toi de jouer !

Compare les résultats de différents moteurs de recherche :

  1. 1Choisis une requête (ex: "climat changement")
  2. 2Fais la même recherche sur Google, Bing et DuckDuckGo
  3. 3Compare les 5 premiers résultats de chaque moteur
  4. 4Note les différences : sources, ordre, publicités...

Quiz : Teste tes connaissances

5 questions sur les moteurs de recherche

À retenir

  • Un moteur de recherche explore, indexe et classe le Web
  • Les robots parcourent le Web en suivant les liens
  • L'index est une base de données de toutes les pages
  • Le PageRank classe les pages selon leur popularité (liens)
Pixel