begin process at 2012 02 12 19:32:50
  Trouver un code source :
 
dans
 
Accueil > 

Code

 > 

Astuces

 > LOG DES ROBOTS QUI PASSENT SUR LE SITE

LOG DES ROBOTS QUI PASSENT SUR LE SITE


 Information sur la source

Note :
10 / 10 - par 10 personnes
10,00 / 10

  • 1

  • 2

  • 3

  • 4

  • 5

  • 6

  • 7

  • 8

  • 9

  • 10
Catégorie :Astuces Classé sous :log, robots, bot Niveau :Débutant Date de création :07/07/2007 Vu / téléchargé :6 678 / 677

Auteur : etiennexxx9

Ecrire un message privé
Site perso
Commentaire sur cette source (29)
Ajouter un commentaire et/ou une note

 Description

Ce petit script permet de prendre en note les robots qui passent sur le site.

Le principe est assez simple: on simmule un fichier robots.txt. Pour ce faire, il suffit de créer un dossier de ce nom et d'y placer un index.php contenant le script de log. Lorsque les robots iront chercher le fichier robots.txt, le serveur exécutera le fichier robots.txt/index.php et renverra le contenu d'un fichier robots.txt normal (configurable dans le code).


 Conclusion

Je l'ai testé, il fonctione bien pour moi. J'espère le même résultat pour vous.

Le robot qui passe le plus souvent sur mon serveur, c'est le msnbot.

 Fichier Zip

Les Membres Club peuvent télécharger directement un fichier contenu dans le zip sans télécharger le zip en entier !

Télécharger le zip


 Sources de la même categorie

Source avec Zip Source avec une capture GENERATEUR D'ONGLET DE NAVIGATION PHP par pos123
FORMATER UN LIEN YOUTUBE, DAILYMOTION OU VIMEO POUR L'UTILIS... par kgb93
Source avec Zip Source avec une capture PAGINATION + FICHIER CSS par profdi
Source avec Zip Source avec une capture SYSTEME D'AUTHENTIFICATION PHP AVEC PROTÉCTION KEYLOGGER par mtrix000
Source avec Zip Source avec une capture GENERATEUR DE BOUTONS DE PARTAGES POUR RESEAUX SOCIAUX par cod57

 Sources en rapport avec celle ci

Source avec Zip Source avec une capture LOGGER LE TEMPS D'EXÉCUTION DE VOS FONCTIONS PHP par djroulo
Source avec Zip POO - LOGGING PACKAGE par Waredan
DÉTECTEUR DE VULNERABILITY SCANNER par TychoBrahe
Source avec Zip Source avec une capture BOT IRC POO par divx78
BOT IRC : GÉNÉRATEURS DE LOGS AU FORMAT MIRC par simonviei

Commentaires et avis

Commentaire de _sHoCk_ le 07/07/2007 08:14:23

Je ne l'ai pas encore testé, mais c'est un bon astuce. gg ^^

Commentaire de thepunisher713 le 07/07/2007 08:29:03

Beau travail étienne, si seulement jmy conaissait en php!! ^_^

Commentaire de Optitech le 08/07/2007 11:20:36

code propre et commenté ! Actuce original mais qui devrait fonctionner sur la majorité des serveurs :)

Il me reste juste une chose à dire :

BRAVO :)

Commentaire de Frank9321 le 09/07/2007 09:30:43

Vraiment pas co**e ton astuce,

Bravo!
10/10.

Commentaire de poulpix_fr le 09/07/2007 13:12:13

Bonjour ton petit code est pas mal,

Je les adapter a mon site avec deux petit modif pour moi :

$log = $i.' | '.$d.' | '.$h.' | '.$u."\r\n";

Jais rajouter \r  car sinon sa ne retourner pas a la ligne cher moi.

Pui j’ais inclus mon fichier  robots.txt en le renomment en bot.txt :

$file = fopen("bot.txt","r");
while(!feof($file))    
{
     $buffer = fgets($file, 4096);
     echo $buffer."<br />";
}
fclose($file);

voila sa marche nikel pour le moment mci

Commentaire de alex1025 le 10/07/2007 15:18:07

Bravo !
10/10 pour l'astuce et la propreté du script.

Commentaire de masternico le 10/07/2007 20:39:39

Ca c'est une idée qu'elle est bonne
je donne 10/10

Commentaire de Chrigou le 11/07/2007 08:46:21

Tellement bien que je l'ai converti en ASP...
http://www.aspfr.com/code.aspx?ID=43414
Bravo Etienne !

Commentaire de DarkM60 le 15/07/2007 16:26:57

Je trouve la solution de créer un répertoire un peu "système D", avec une règle d'url rewriting ça marcherait tout aussi bien, et en placant ton fichier php ou tu veux sur ton site...

Il suffirait juste de créer un .htaccess à la racine, contenant ceci :

Options +FollowSymlinks
RewriteEngine on
RewriteRule ^robots.txt$  /tonfichier.php [L]

Et c'est bon, et encore plus invisible, car ta méthode, un robot un peu plus avancé peut la détecter, or de l'url rewriting, c'est côté serveur.

Commentaire de JLN le 16/07/2007 16:38:51

Je trouve l'idée vraiment géniale, ca c'est une vrai astuce... Je met 10 sans hésiter !

DarkM60 je ne suis pas un as du php et je ne comprend pas grand chose aux .httaccess pourrais-tu développer s'il te plait ? Merci

@+ JLN

Commentaire de etiennexxx9 le 17/07/2007 05:14:52

@poulpix_fr => Une bonne idée si tu veux séparer le fichier robots.txt du script

@Chrigou => :O

@DarkM60 => J'y avais pensé au début, mais je ne suis pas très habitué à l'url rewriting.
            "un robot un peu plus avancé peut la détecter" => Les robots les plus connus ne le font pas...

@JLN => L'url rewriting permet lors d'une requête au serveur de modifier le fichier qui sera envoyé au client.

@tous => Merci :)

Etienne

Commentaire de JLN le 17/07/2007 12:41:22

Merci Etiennexxx9 tu as éclairé ma lanterne et a y regarder le code de plus près ca me parrait beaucoup plus explicite... Juste une chose, les symbol ^ et [L] sont-ils obligatoire ? si oui que veulent-ils dire ? est-ce juste de la sintaxe ?

Merci beaucoup

@+ JLN

Commentaire de Optitech le 17/07/2007 14:00:29

Les symboles ^ et $ servent pour l'expression régulière :) Et le [L] signifie : ouvrire le fichier tonfichier.
phpl en ne laissant "rien" dans l'url :)

Pour en savoir plus sur les Rewrite URL : http://www.google.fr/

Commentaire de JLN le 17/07/2007 16:45:42

Un grand merci à Etiennexxx9 et Optitech qui m'ont aidé mieux que je ne l'aurai espéré...

@+ JLN

Commentaire de Optitech le 17/07/2007 16:51:07

CodeSource sert à ca s'aider :)

Commentaire de djtobias le 22/07/2007 14:52:58

Tros cool ;)
Sa marche impec ;)

Commentaire de VVV le 24/07/2007 12:02:29

Léger, astucieux et utile... j'adore : 10/10 !

Commentaire de niceman23 le 03/12/2007 05:13:24

Quand tu as un fichier robots.txt déja quesqui se passe je peux pas mettre le dossier robots.txt , pis éffacé le fichier robots.txt j'ai besoin de se fichier qui peux m'aidé svp ??? merci

Commentaire de etiennexxx9 le 03/12/2007 06:13:36

En fait, il te suffit de changer les lignes suivantes dans index.php:
echo 'User-Agent: *'."\n";
echo 'Disallow: ';

Par:
readfile('robots.txt');

Puis de mettre ton fichier robots.txt actuel dans le dossier nommé robots.txt

Si le readfile ne fonctionne pas, essaie avec la technique de poulpix_fr.

Etienne

Commentaire de niceman23 le 03/12/2007 06:21:50

le readile ne fonctionne pas , puis la technique de poulpix_fr non plus . Bien c'est pas trop clair non plus .

Pierre

Commentaire de masternico le 04/12/2007 18:10:28

Et pourquoi ne pas faire un simple "include('robot.txt')"?

Commentaire de CISUM Records le 08/12/2007 20:46:00 10/10

Très maline cette astuce Bravo 10/10

Commentaire de PlayerMania le 29/12/2007 05:24:03 10/10

Et bah... fallait y penser à celle la...
Super idée etiennexxx9 !

Commentaire de bishoponline le 11/11/2008 19:41:10

j'ai pas compris , ça sert a quoi exactement ?

Commentaire de VVV le 11/11/2008 19:50:17

Tout est dans le titre en fait : logguer les robots qui défilent sur ton site.
En d'autre termes, obtenir un détail des robots qui passent pour auditer le site web, comme Google bot, Yahoo, mais aussi d'autres bien moins connus !
Ceci dit, tous les robots ne recherchent pas ce fameux fichier robots.txt sur le site qu'ils auditent. Donc, il est aussi utile d'auditer certaines pages clés (index bien sûr) avec un autre système.
Je trouve cette source utile et l'astuce très bien pensée... mais je me répète ;-)

Commentaire de bishoponline le 11/11/2008 19:59:30

merci vvv

et donc on place ca dans un dossier et c'est tout ?

Commentaire de VVV le 11/11/2008 20:07:14

Oui, simplement le placer absolument à la racine de ton site web (nulle part ailleurs).
En fait, il suffit de procéder comme ceci :
1. créer un nouveau dossier
2. le renommer en "robots.txt"
3. d'y placer les fichiers de la source !

And... that's all folks ;-)

Commentaire de bishoponline le 11/11/2008 20:15:19

Impossible de renommer un dossier en "robots.txt"

j'ai déjà un fichier "robots.txt" a la racine

Commentaire de VVV le 11/11/2008 21:04:12

Oui, bien sûr, alors il faut supprimer ce fichier (faire une copie) et le remplacer par le répertoire et ajouter le contenu du fichier robots.txt dans le fichier index.php juste après la commande ecrirelog(...

Exemple :
// Envoi au robot un fichier robots.txt ne servant à rien
echo 'User-Agent: *'."\n";
echo 'Disallow:  /repertoire_a_ne_pas_auditer/'."\n";
echo 'Disallow:  /galeriephotos/'."\n";

 Ajouter un commentaire


Discussions en rapport avec ce code source dans le forum

deonection table log?? [ par pcpourtous ] voial j'ai une table log, une identification avec une variable session "login"je veux gérer une table log : donc quand l'utilisateur se connecte j'ins Mettre un log et psw sur bdd mysql ??? [ par nova85 ] Comment met ton un login et un mot de passe sur une base mysql avec phpmyadmin ?nova Use of undefined constant log - assumed 'log' ou trouver des explication fr [ par Lump[YaNa] ] Voila j'ai recuperer un squellette de liens et je le mets a ma sauce mais helas je ne trouve rien qui puisse m'aider sur cette erreur :Use of undefine Retour session [ par DarkSchneider ] Salut tout le monde.Cette fois, ce sont les sessions qui m'amènent ici. Voilà mon problème. Je dispose de 3 pages, disons index.php, 1.php et 2. phpSu ignorer les ip's de robots indexeurs [ par pyranhaz ] Bonjour,J'aimerais savoir si ce bout de code pourrait indiquer de ne pas bannir le robot si son ip existe dans la bddc'est important pour le référence pb avec les sessions. [ par Zebra1928 ] bonjour,plz j'ai besoin d'aide, j'ai 1 vrai pb avec les sessions, je m'explique:j le fichier suivant:log.php&lt;?$host="localhost";$user="root";$passw Ce code est t'il bon svp ? [ par Blacknight91titi ] Salut j'aimerais savori pourquoi se code ne vas pas ?enfin pourquoi il n'est pas bonje n'arrive pas a comprendre pourquoi:if ($log == "Pour ProFlor") Les sockets php [ par PtitKev ] Bonjour&nbsp;&#224; toutes et a tous.Voila je test un bot socket en php. Je me suis rendu compte que les variables &#233;taient propre a une page donc Affichage de graphique [ par nbenoist ] sur RedHat 7.2 J'ai une page php qui lit un fichier de log. Ma page php me affiche 2 camenbert suivant les informations du fichier log. J'ai mis les Error PHP [ par Dfx4 ] Hello, Voil&#224; j'ai un probl&#232;me sur mon serveur avec Apache et PHP ! J'ai souvent cette erreur et sa me fait plant&#233; mon serveur !!!! //


Nos sponsors


Sondage...

CalendriCode

Février 2012
LMMJVSD
  12345
6789101112
13141516171819
20212223242526
272829    

Consulter la suite du CalendriCode

Photothèque

 
Développement réalisé par Nicolas SOREL (Nix) avec l'aide de : Cyril DURAND et Emmanuel (EBArtSoft), Merci à Vincent pour ses précieux conseils.
CodeS-SourceS.com© Toute reproduction même partielle est interdite sauf accord écrit du Webmaster
CodeS-SourceS.com© est une marque déposée tous droits réservés

Google Coop CodeS-SourceS Google Coop CodeS-SourceS
Temps d'éxécution de la page : 1,123 sec (3)

Nous contacter | Annoncer sur CodeS-SourceS | Mentions légales