Bonjour, je souhaite créer un script permettant d'extraire tous les liens d'un site, et d'inscrire l'adresse du lien et la description du lien (ce qu'il y a entre <a> et </a>) dans une base de donnée. Pouvez-vous m'aider ? J'ai déja trouver un script de ce genre mais il ne fonction que en internet et non en externe, voici le code :
<?
$fp = fopen("index.html", "r+");//on ouvre
$texte = fread ($fp, 255000); //on prend le max
fclose($fp);//on ferme
$texte=strtolower($texte);// on passe tout en miniscule
//on récupere que ce qui est le meilleur
$texte=strip_tags($texte,'<title></title><script></script><a></a><head></head><style></style>');
//on trie (saut de ligne, blanc, title, head, style, script, inter lien)
$texte = str_replace("\n"," ",$texte);
$texte = str_replace(" "," ",$texte);
$texte = preg_replace('`<head.*?/head>`', '', $texte);
$texte = preg_replace('`<title.*?/title>`', '', $texte);
$texte = preg_replace('`<script.*?/script>`', '', $texte);
$texte = preg_replace('`<style.*?/style>`', '', $texte);
$texte = preg_replace('`/a>.*?<a`', '/a><br><a', $texte);
$texte = str_replace(" "," ",$texte);
//$texte = preg_replace('`<`', '<', $texte);
//$texte = preg_replace('`>`', '>', $texte);
$texte = preg_replace('`<br>`', '<br>', $texte);
echo"Parseur de lien de fichier html vers fichier texte : By Defkrie !?!<br>$texte";
//$texte = preg_replace('`<`', '<', $texte);
//$texte = preg_replace('`>`', '>', $texte);
//$texte = preg_replace('`<br>`', '\n', $texte);
$fp2 = fopen("url.txt", "a+");
fclose($fp2);
$fp2 = fopen("url.txt", "r+");
fseek( $fp2, 0 );
fputs($fp2, $texte);
fclose($fp2);
?>
=>>>> Tony 4758 <<<<=