Vous ne trouvez pas de réponse à votre problème ? Alors posez la question dans le forum. Souvenez-vous qu'il n'y a jamais de question bête, mais rester dans l'ignorance parce que l'on n'ose pas poser une question, ça c'est une erreur !

PARSER DES MOTS-CLÉS AVANT DE LANCER LA RECHERCHE


Information sur la source

Description

Pour un moteur de recherche, il fô nettoyer les mots-clés des internautes en supprimant les mots de moins de 3 lettres ou les expressions de coordination (mais où et donc or ni car ;o) pour garder que les mots pertinents.
 

Source

  • //Petit nettoyage
  • $motscles = strtolower(trim($motscles));
  • $motscles = str_replace(array(",","-",".",":",";","'")," ",$motscles);
  • $motscles = str_replace(" "," ",$motscles);
  • $motscles = str_replace(" "," ",$motscles);
  • //Decomposition des mots-cles mot à mot
  • $mots = explode(" ",$motscles);
  • $petitmots = array("une","les","aux","des","mais","ton","tes","son","ses","ces","est","donc","car");
  • //Boucle d'analyse de chaques mots
  • $nbmots = count($mots);
  • for ($i = 0; $i < $nbmots; $i++)
  • {
  • if (strlen($mots[$i]) < 3)
  • {
  • $mots[$i] = "";
  • }
  • else if (in_array($mots[$i],$petitmots))
  • {
  • $mots[$i] = "";
  • }
  • }
  • //Recolle les mots
  • $motscles = implode(" ",$mots);
//Petit nettoyage
	$motscles = strtolower(trim($motscles));
	$motscles = str_replace(array(",","-",".",":",";","'")," ",$motscles);
	$motscles = str_replace("   "," ",$motscles);
	$motscles = str_replace("  "," ",$motscles);
	
	//Decomposition des mots-cles mot à mot
	$mots = explode(" ",$motscles);
	
	$petitmots = array("une","les","aux","des","mais","ton","tes","son","ses","ces","est","donc","car");
	
	//Boucle d'analyse de chaques mots
	$nbmots = count($mots);
	for ($i = 0; $i < $nbmots; $i++)
		{
		if (strlen($mots[$i]) < 3)
			{
			$mots[$i] = "";
			}
		else if (in_array($mots[$i],$petitmots))
			{
			$mots[$i] = "";
			}
		}
		
	//Recolle les mots
	$motscles = implode(" ",$mots);

Conclusion

NB: moà, zaime pô les ereg :o|
 

Commentaires et avis

signaler à un administrateur
Commentaire de olid le 22/12/2003 13:18:34

Et comme zest bientot noyel, v'là comment rapidement construire la requete pour la recherche SQL à partir des mots-clés au-dessus :

$motsclestitre = str_replace(" ","%') AND (titre LIKE '%",$motscles);
$motsclestexte = str_replace(" ","%') AND (texte LIKE '%",$motscles);

$newsresult=mysql_query("SELECT * FROM news WHERE (((titre LIKE '%$motsclestitre%')) OR ((texte LIKE '%$motsclestexte%'))) ORDER BY date DESC");

NB: les doubles parathezes sont indispensables !!! ;op

signaler à un administrateur
Commentaire de bprod le 20/07/2004 17:37:00

juste ce qui me fallait, enfin plus ou moins mais c cool... merci, je vais tester ça tout de suite (niark,niark!)

signaler à un administrateur
Commentaire de olid le 21/07/2004 19:24:04

Explik ze que tu veux faire.... kurieux un kat :op

signaler à un administrateur
Commentaire de bprod le 22/07/2004 08:52:52

c'est que je fais un moteur de recherche ou tu peux choisir le type (soit "et" soit "ou" ) pour la recherche ds la baz donc tu m'a aider pour le parsing des mots clés sans les jonctions et tout et tout ...
Donc merci !

signaler à un administrateur
Commentaire de olid le 22/07/2004 19:37:52

Je te conseil la syntax Google...

les espaces equivaut à un OU sauf si un groupe de mots est dans des double quote "... Dans ce cas les espaces (dans les quotes) equivaut à ET.

Alors, tu fais un premier parsing via un explode des quotes "...Dans le tableau, les resultats pair seront avec ET et les impairs avec OU
Sauf le cas particulier quand la requete commence par une quote...Fô inverser ;op

Tout compris ? :o|

signaler à un administrateur
Commentaire de bprod le 23/07/2004 08:52:21

Bonne remarque constructive ,je m'y mettrai dés que j'aurais un peu de temps...
Le résultat sera en ligne (<url=www.vendeeconcept.com>vendeeconcept.com</url>) d'ici peu mais là j'ai des problème avec France télécom qui met trop lgt pour faire le chgmt de délégation...
Merci encore pour ton aide précieuse ;op

Ajouter un commentaire



Nos sponsors

Sondage...

CalendriCode

Octobre 2008
LMMJVSD
  12345
6789101112
13141516171819
20212223242526
2728293031  

Consulter la suite du CalendriCode



Développement réalisé par Nicolas SOREL (Nix) avec l'aide de : Cyril DURAND et Emmanuel BAÏSE, Merci à Vincent pour ses précieux conseils
CodeS-SourceS.com© Toute reproduction même partielle est interdite sauf accord écrit du Webmaster
CodeS-SourceS.com© est une marque déposée tous droits réservés
Temps d'éxécution de la page : 0,140 sec

Google Coop CodeS-SourceS Google Coop CodeS-SourceS


Certaines images présentes sur le site (notament certains avatars) sont issues des collections IconShock, donc si vous souhaitez utiliser ces icons vous devez les acheter, ne les copiez pas et ne utilisez pas dans vos sites et applications sans les avoir commandé.