Voici les bases d'un moteur de recherche.
En fait, il s'agit plutôt d'un parseur html/css...
Vous entrez l'adresse d'une page html, et il récupère la taille de chaque mot, sa couleur, la couleur de fond, si le mot est en gras, etc.
Il compte aussi les lignes et supporte les css (enfin quand ils sont pas trop compliqués...)
Le script utilise les sockets, il ne marchera donc pas si vous êtes derrière un proxy.
A partir du html décomposé, vous pouvez attribuer des points à chaque mot de chaque page, stocker le tout dans une base de données et créer un magnifique moteur de recherche.
C'était mon projet mais quand j'ai fini le parseur html, je me suis rendu compte qu'il me faudrait encore quelques années avant de le finir, donc j'ai abandonné...
Pour faire fonctionner le parseur, lancez la page index.php, et le résultat s'affichera sous vos yeux.
La fonction qui affiche le résultat se trouve dans le fichier php/robot.php. A partir de là ,au lieu d'afficher le résultat, il suffit de l'enregistrer dans une base de données...
Le script récupère aussi les entête html envoyées au navigateur...
Amusez-vous bien et bon courage pour comprendre le code...