begin process at 2008 08 28 19:10:37
1 233 316 membres
412 nouveaux aujourd'hui
14 291 membres club

Vous ne trouvez pas de réponse à votre problème ? Alors posez la question dans le forum.
Souvenez-vous qu'il n'y a jamais de question bête, mais rester dans l'ignorance parce que l'on n'ose pas poser une question, ça c'est une erreur !

Sujet : Problème extraction liens [ Archives / AU SECOURS !!! ] (Tasslekender)

Problème extraction liens le 12/02/2004 22:00:14

Tasslekender

Bonjour ^^
Voilà, je dois réaliser un crawler dans le but de simplifier des sites de presse (dans le cadre d'un projet scolaire) et j'ai un problème dans l'extraction des liens.

Quand je le teste sur des exemples banals, ça marche mais quand je le teste sur des sites de presse, ben ça marche plus >_<

voilà sur quoi je le teste :
$url = "<a href="ofpolitique.asp?idDOC=121880&idCLA=3635" class="Noir">
<img src="http://photos.ouestfrance-enligne.com/2004/02/12/N1GE02A_20040211_vig.jpg" border="0" align="right" hspace="4">
<b>La gauche dépose un recours devant le Conseil constitutionnel</b>
La loi Perben II contestée sitôt votée
L'Assemblée nationale a voté hier le projet de loi sur la grande criminalité par 340 voix (UMP, UDF) contre 173 (PS, PCF) et 9 abstentions. Pour le Parlement, le texte est maintenant définitivement adopté. Mais le PS en appelle déjà au Conseil constitutionnel pour en obtenir l'annulation, au moins partielle.</a><a href="ofpolitique.asp?idDOC=121880&idCLA=3635" class="Noir"><img src="/commun/images/PuceFlchBtnLire.gif" width="10" height="6" border="0">Lire l'article</a>";

et voici mon code :

while($x = stristr($url, "<a ")){

$href = substr($x, 3, strpos($x, ">") -3);
$texte = $x;

if (($debut=strpos($href, """))!=0) {
$href = substr($href, $debut+1);
$fin = strpos($href, """);
$href = substr($href, 0, $fin);
}

elseif (($debut=strpos($href, "'"))!=0) {
$href = substr($href, $debut+1);
$fin = strpos($href, "'");
$href = substr($href, 0, $fin);
}

else {
$debut=strpos($href, "=");
$href = substr($href, $debut+1);
}

$texte = substr($texte, strpos($texte, ">") +1);
$texte = substr($texte,0, strpos($texte, "</a>"));

$liens[$href] = $texte;

$url = substr($url, strpos($url, "</a>") +4);
}
print_r($liens);

donc le problème est que sur les deux liens que je veux récupérer (dans la variable $url), il ne m'en sort qu'une seule et je ne vois absolument pas pourquoi :(

Quelqu'un aurait-il la bonté de m'aider ? ^^

Re : Problème extraction liens le 14/06/2004 10:16:21

myki23

salut! jsais pas ce kil en est de ton probleme mais moi jai a faire un programme ki test les liens! jai le code de test des liens, mais il me faut celui du parcours et de l'extraction des liens... donc si tu peu m'aider merci beaucoup

Re : Problème extraction liens le 08/03/2006 14:54:37

Classé sous : texte, liens, href, substr, strpos

Participer à cet échange

Pub



Appels d'offres

Recherche developpeur ...
Budget : 700€
SITE MARCHAND LOCATION...
Budget : 3 000€
SITE MARCHAND POUR HOTEL
Budget : 4 000€

CalendriCode

Août 2008
LMMJVSD
    123
45678910
11121314151617
18192021222324
25262728293031

Téléchargements

Logiciels à télécharger sur le même thème :

Boutique

Boutique de goodies CodeS-SourceS