begin process at 2010 02 09 17:47:06
  Trouver un code source :
 
dans
 
Accueil > 

Code

 > 

Astuces

 > PARSEUR DE LIEN DE FICHIER HTML VERS FICHIER TEXTE

PARSEUR DE LIEN DE FICHIER HTML VERS FICHIER TEXTE


 Information sur la source

Note :
9 / 10 - par 2 personnes
9,00 / 10

  • 1

  • 2

  • 3

  • 4

  • 5

  • 6

  • 7

  • 8

  • 9

  • 10
Catégorie :Astuces Niveau :Débutant Date de création :06/09/2003 Date de mise à jour :06/09/2003 20:38:35 Vu :6 839

Auteur : defkrie

Ecrire un message privé
Site perso
Commentaire sur cette source (7)
Ajouter un commentaire et/ou une note

 Description

Cliquez pour voir la capture en taille normale
Voila quelqu'1 ma demander sur le forum comment récupérer tout les liens d'1 fichier html pour les enregistrer dans un fichier texte donc voila une source qui répondra à cette question

Source

  • <?
  • //<a href="lien.php">textelien</a>
  • //libre de modification et d'amélioration, ne pompez pas essayer de comprendre ct la meilleure solution
  • $fp = fopen("index.htm", "r+");//on ouvre
  • $texte = fread ($fp, 255000); //on prend le max
  • fclose($fp);//on ferme
  • $texte=strtolower($texte);// on passe tout en miniscule
  • //on récupere que ce qui est le meilleur
  • $texte=strip_tags($texte,'<title></title><script></script><a></a><head></head><style></style>');
  • //on trie (saut de ligne, blanc, title, head, style, script, inter lien)
  • $texte = str_replace("\n"," ",$texte);
  • $texte = str_replace("&nbsp;"," ",$texte);
  • $texte = preg_replace('`<head.*?/head>`', '', $texte);
  • $texte = preg_replace('`<title.*?/title>`', '', $texte);
  • $texte = preg_replace('`<script.*?/script>`', '', $texte);
  • $texte = preg_replace('`<style.*?/style>`', '', $texte);
  • $texte = preg_replace('`/a>.*?<a`', '/a><br><a', $texte);
  • $texte = str_replace(" "," ",$texte);
  • //$texte = preg_replace('`<`', '&lt;', $texte);
  • //$texte = preg_replace('`>`', '&gt;', $texte);
  • $texte = preg_replace('`&lt;br&gt;`', '<br>', $texte);
  • echo"Parseur de lien de fichier html vers fichier texte : By Defkrie !?!<br>$texte";
  • //$texte = preg_replace('`&lt;`', '<', $texte);
  • //$texte = preg_replace('`&gt;`', '>', $texte);
  • //$texte = preg_replace('`<br>`', '\n', $texte);
  • $fp2 = fopen("url.txt", "a+");
  • fclose($fp2);
  • $fp2 = fopen("url.txt", "r+");
  • fseek( $fp2, 0 );
  • fputs($fp2, $texte);
  • fclose($fp2);
  • ?>
<?
//<a href="lien.php">textelien</a>
//libre de modification et d'amélioration, ne pompez pas essayer de comprendre ct la meilleure solution
$fp = fopen("index.htm", "r+");//on ouvre
	$texte = fread ($fp, 255000); //on prend le max
	fclose($fp);//on ferme
$texte=strtolower($texte);// on passe tout en miniscule 
//on récupere que ce qui est le meilleur
$texte=strip_tags($texte,'<title></title><script></script><a></a><head></head><style></style>'); 
//on trie (saut de ligne, blanc, title, head, style, script, inter lien)
$texte = str_replace("\n"," ",$texte); 
$texte = str_replace("&nbsp;"," ",$texte); 
$texte = preg_replace('`<head.*?/head>`', '', $texte); 
$texte = preg_replace('`<title.*?/title>`', '', $texte);
$texte = preg_replace('`<script.*?/script>`', '', $texte); 
$texte = preg_replace('`<style.*?/style>`', '', $texte); 
$texte = preg_replace('`/a>.*?<a`', '/a><br><a', $texte);
$texte = str_replace("    "," ",$texte);
    
//$texte = preg_replace('`<`', '&lt;', $texte);
//$texte = preg_replace('`>`', '&gt;', $texte);
$texte = preg_replace('`&lt;br&gt;`', '<br>', $texte);
echo"Parseur de lien de fichier html vers fichier texte : By Defkrie !?!<br>$texte";
//$texte = preg_replace('`&lt;`', '<', $texte);
//$texte = preg_replace('`&gt;`', '>', $texte);
//$texte = preg_replace('`<br>`', '\n', $texte); 
$fp2 = fopen("url.txt", "a+");
fclose($fp2);
$fp2 = fopen("url.txt", "r+");
fseek( $fp2, 0 );
fputs($fp2, $texte);
fclose($fp2);
?>

 Conclusion

juste une petite source pour répondre à un sujet que je vois depuis lontemps trainer sur le forum et vu que cest mon dernier jour de vacance


 Sources du même auteur

FICHIER ( ÉCRITURE, LECTURE....) POUR DÉBUTANT
Source avec Zip Source avec une capture CÉSAR PLUS (CRYPTAGE, DÉCRYPTAGE AVEC CLÉ ALÉATOIRE)
Source avec Zip Source avec une capture CÉSAR
Source avec Zip Source avec une capture NUMBER TO IMG
Source avec Zip Source avec une capture VOTEMEMBERS POUR PHPMYTEAM 2.0

 Sources de la même categorie

Source avec une capture PAGINATION EN PHP par Orangina
Source avec Zip POO - DEBUGGER par DiGhan
Source avec Zip CRAWLER DE SITE EN PHP par Mcjo
DÉCOUPAGE D'UN TEXTE EN FONCTION DES SAUTS DE LIGNES par biloubil
RÉCUPÉRER LE CHEMIN RELATIF D'UN OBJET PAR RAPPORT À LA RACI... par FredPsy

Commentaires et avis

Commentaire de quiaimeflash le 27/06/2004 23:18:52

Il est plutot sympa ton script, j'avais commencer un truc du genre moi aussi...
Mais je supprimais pqs asser de truc.

Par contre, dit si je me trompe mais je crois que le script fonctionne mieux si on ouvre pas le fichier en lecture/ecriture mais juste en lecture, faut juste enlever le + mais bn je recolle ton code :

&lt;?
//&lt;a href="lien.php"&gt;textelien&lt;/a&gt;
//libre de modification et d'amélioration, ne pompez pas essayer de comprendre ct la meilleure solution
$fp = fopen("index.htm", "r");//on ouvre
    $texte = fread ($fp, 255000); //on prend le max
    fclose($fp);//on ferme
$texte=strtolower($texte);// on passe tout en miniscule
//on récupere que ce qui est le meilleur
$texte=strip_tags($texte,'&lt;title&gt;&lt;/title&gt;&lt;script&gt;&lt;/script&gt;&lt;a&gt;&lt;/a&gt;&lt;head&gt;&lt;/head&gt;&lt;style&gt;&lt;/style&gt;');
//on trie (saut de ligne, blanc, title, head, style, script, inter lien)
$texte = str_replace("\n"," ",$texte);
$texte = str_replace("&nbsp;"," ",$texte);
$texte = preg_replace('`&lt;head.*?/head&gt;`', '', $texte);
$texte = preg_replace('`&lt;title.*?/title&gt;`', '', $texte);
$texte = preg_replace('`&lt;script.*?/script&gt;`', '', $texte);
$texte = preg_replace('`&lt;style.*?/style&gt;`', '', $texte);
$texte = preg_replace('`/a&gt;.*?&lt;a`', '/a&gt;&lt;br&gt;&lt;a', $texte);
$texte = str_replace("  "," ",$texte);
    
//$texte = preg_replace('`&lt;`', '&lt;', $texte);
//$texte = preg_replace('`&gt;`', '&gt;', $texte);
$texte = preg_replace('`&lt;br&gt;`', '&lt;br&gt;', $texte);
echo"Parseur de lien de fichier html vers fichier texte : By Defkrie !?!&lt;br&gt;$texte";
//$texte = preg_replace('`&lt;`', '&lt;', $texte);
//$texte = preg_replace('`&gt;`', '&gt;', $texte);
//$texte = preg_replace('`&lt;br&gt;`', '\n', $texte);
$fp2 = fopen("url.txt", "a+");
fclose($fp2);
$fp2 = fopen("url.txt", "r+");
fseek( $fp2, 0 );
fputs($fp2, $texte);
fclose($fp2);
?&gt;

Et pis voila...

Commentaire de defkrie le 28/06/2004 16:24:19

oui tu as raison jai pas fait gaffe je laisse toujours trainer le + or inutile ct vrai en lecture...
je travaille sur une autre source qui fait la meme chose mais en moins de ligne si ja la fini un jour.
Merci.

Commentaire de kegi le 02/01/2005 23:27:06

le script est suposer faire quoi ?

moi il ne fais qu'enlever les balises html head etc... je pensais qu'il me listerait les liens.. ex:

http://www.monsite1.com
http://www.monsite2.com

merci de me répondre...

cordialement,
kevin (kegi@hotmail.com)

Commentaire de defkrie le 06/01/2005 17:13:53

Il sert à récuperer les liens html d'un fichier et à les afficher.
Prenons un exemple tu as une page sur le web qui a 50 liens et tu souhaites les télécharger. Au lieu de cliquer 50 fois tu enrigistres ta page en html tu lances le script et tu aura tout les liens de la page dans $texte.
Ce script n'est pas optimisé il est la à titre d'exemple.
si jai le temps jen donnerais un nouveau avec stockage des liens dans un tableau et traitement sur les liens (java,image, email....) enfin si jai le temps.
Il existe plein d'autres utilisations possibles.
@+

Commentaire de kegi le 07/01/2005 01:15:28

merci bien,
mais si quelqu'un aurait un bout de code qui liste les liens, (d'une simplicité remarquable) ca serait vraiment utile. Merci d'avance ;)

cordialement,
kevin (kegi@hotmail.com)

Commentaire de kegi le 07/01/2005 01:19:26

désolé, je me suis rendu compte qu'il y avais une erreur...
le script est bien ce que je cherche mais...
chez moi il ne fonctionne pas super bien :(
il me lesse tout le texte entre les liens

désolé, le cadrage est pourrit ici :D

cordialement,
kevin (kegi@hotmail.com)

Commentaire de Skypetarius le 06/07/2005 11:47:27

Bonjour !
Je me demandais s'il étais possible de faire le contraire :
Au lieu de supprimer tout ce qui n'est pas un lien, le script pourrait seulement extraire les infos voulues.
Il stockerai dans des variables ce qui est contenu entre les '<a href="' et '">', par exemple...

Est-ce possible ? (je suis débutant alors ne m'en voulez pas...)

 Ajouter un commentaire




Nos sponsors


Sondage...

CalendriCode

Février 2010
LMMJVSD
1234567
891011121314
15161718192021
22232425262728

Consulter la suite du CalendriCode

 
Développement réalisé par Nicolas SOREL (Nix) avec l'aide de : Cyril DURAND et Emmanuel (EBArtSoft), Merci à Vincent pour ses précieux conseils.
CodeS-SourceS.com© Toute reproduction même partielle est interdite sauf accord écrit du Webmaster
CodeS-SourceS.com© est une marque déposée tous droits réservés

Google Coop CodeS-SourceS Google Coop CodeS-SourceS
Temps d'éxécution de la page : 0,359 sec (3)

Nous contacter | Annoncer sur CodeS-SourceS | Mentions légales