begin process at 2010 03 21 16:25:52
  Trouver un code source :
 
dans
 
Accueil > Forum > 

Archive PHP

 > 

Archives

 > 

AU SECOURS !!!

 > 

Problème extraction liens


Derniers messages déposésPoser une question dans le forum ou lancer une discussion

Problème extraction liens

jeudi 12 février 2004 à 22:00:14 | Problème extraction liens

Tasslekender


Bonjour ^^
Voilà, je dois réaliser un crawler dans le but de simplifier des sites de presse (dans le cadre d'un projet scolaire) et j'ai un problème dans l'extraction des liens.

Quand je le teste sur des exemples banals, ça marche mais quand je le teste sur des sites de presse, ben ça marche plus >_<

voilà sur quoi je le teste :
$url = "<a href="ofpolitique.asp?idDOC=121880&idCLA=3635" class="Noir">
<img src="http://photos.ouestfrance-enligne.com/2004/02/12/N1GE02A_20040211_vig.jpg" border="0" align="right" hspace="4">
<b>La gauche dépose un recours devant le Conseil constitutionnel</b>
La loi Perben II contestée sitôt votée
L'Assemblée nationale a voté hier le projet de loi sur la grande criminalité par 340 voix (UMP, UDF) contre 173 (PS, PCF) et 9 abstentions. Pour le Parlement, le texte est maintenant définitivement adopté. Mais le PS en appelle déjà au Conseil constitutionnel pour en obtenir l'annulation, au moins partielle.</a><a href="ofpolitique.asp?idDOC=121880&idCLA=3635" class="Noir"><img src="/commun/images/PuceFlchBtnLire.gif" width="10" height="6" border="0">Lire l'article</a>";

et voici mon code :

while($x = stristr($url, "<a ")){

$href = substr($x, 3, strpos($x, ">") -3);
$texte = $x;

if (($debut=strpos($href, """))!=0) {
$href = substr($href, $debut+1);
$fin = strpos($href, """);
$href = substr($href, 0, $fin);
}

elseif (($debut=strpos($href, "'"))!=0) {
$href = substr($href, $debut+1);
$fin = strpos($href, "'");
$href = substr($href, 0, $fin);
}

else {
$debut=strpos($href, "=");
$href = substr($href, $debut+1);
}

$texte = substr($texte, strpos($texte, ">") +1);
$texte = substr($texte,0, strpos($texte, "</a>"));

$liens[$href] = $texte;

$url = substr($url, strpos($url, "</a>") +4);
}
print_r($liens);

donc le problème est que sur les deux liens que je veux récupérer (dans la variable $url), il ne m'en sort qu'une seule et je ne vois absolument pas pourquoi :(

Quelqu'un aurait-il la bonté de m'aider ? ^^
lundi 14 juin 2004 à 10:16:21 | Re : Problème extraction liens

myki23


salut! jsais pas ce kil en est de ton probleme mais moi jai a faire un programme ki test les liens! jai le code de test des liens, mais il me faut celui du parcours et de l'extraction des liens... donc si tu peu m'aider merci beaucoup
mercredi 8 mars 2006 à 14:54:37 | Re : Problème extraction liens


Cette discussion est classée dans : texte, liens, href, substr, strpos


Répondre à ce message

Sujets en rapport avec ce message

Tronquer un texte contenant des balises <html> avec substr [ par tonic1 ] Bonjour à tous, je suis confronté à un petit probleme, et pas moyen de trouver une solution sur le forum.J aimerai decoupé un texte avec la fonction s vérifier les liens dans un texte [ par songes ] je veux vérifier les liens que mettent mes utilisateurs de cette mannière- que les balises html sont correcte- si l utilisateur a seulement mis http: Probleme avec du texte et des liens! [ par john1983 ] Bonjours a tous, voila j'aurai deux question a poser :Tout d'abord, j'ai une zone de texte, defini en tant qeu longtext dans ma bdd , et le probleme e Problème de quantité d'info [ par cmaiche ] Bonjour,Voici mon problème.Je veux récupérer un texte placer dans un textearea.Si le texte n'est pas trop long, aucun problème.Sinon (taille du texte Formatage de texte [ par juki_webmaster ] Bonjour à tous,Je developpe un petit projet baser en php/sql et j'aurais besoin d'un code (fonction toute faite) pour formater une variable (son conte Regexp [ par coockiesch ] Salut!J'ai du texte avec des balises [code_php][/code_php]Ce qui est entre les balises est multi-lignes et je ne sais comment faire, j'ai testé qq tru Retour à la Ligne flash4 [ par Jeromedab ] Salut !J'ai un petit problème avec un scroll de texte (flash 4).Je ne sais pas quelle balise incorporer à mon texte pour faire un retour à la ligne. L Sauver uniquement les changements dans un texte [ par fluminis ] Bonjour,Voila ma base de donnees commence a devenir de plus en plus grosse et je voudrais reduire sa taille.Pour le moment je stocke dans ma base de d texte perso sur image [ par masseur ] Salut.Je voudrais mettre sur mon site une image d'un maillot par exemple et mettre un champ ou la personne tape son pseudo et hop ca réaffiche le mail Inserer smiley par simple clic [ par zgrominet ] Bonjour, Je voudrais mettre dans mon forum une liste de smiley, et par un clic sur le smiley, celui ci s'insere dans un champs de saisi texte Mais je


Nos sponsors


Sondage...

Comparez les prix


HTC Hero

Entre 550€ et 550€

CalendriCode

Mars 2010
LMMJVSD
1234567
891011121314
15161718192021
22232425262728
293031    

Consulter la suite du CalendriCode

 
Développement réalisé par Nicolas SOREL (Nix) avec l'aide de : Cyril DURAND et Emmanuel (EBArtSoft), Merci à Vincent pour ses précieux conseils.
CodeS-SourceS.com© Toute reproduction même partielle est interdite sauf accord écrit du Webmaster
CodeS-SourceS.com© est une marque déposée tous droits réservés

Google Coop CodeS-SourceS Google Coop CodeS-SourceS
Temps d'éxécution de la page : 0,140 sec (4)

Nous contacter | Annoncer sur CodeS-SourceS | Mentions légales