Accueil > Forum > > > > Meta moteur de recherche autonome?
Meta moteur de recherche autonome?
jeudi 3 avril 2008 à 00:32:53 |
Meta moteur de recherche autonome?

Ahamayed
|
Meta moteur de recherche autonome? Bonjour, bon voila , je suis sur un projet de creation de moteur de recherche externe .En quelque sort le moteur de recherche ne sera pas dans une page web d'un site comme etant en interne , non mais plutot tout une page est occupée par le moteur; un peut comme google mais moins en fonctionalités. j'ai fait le tour du web cherchant une methode qui me permetrait de developper un meta moteur de recherche qui index des pages web selon une liste de combo contenant les URL souhetés.c'est-a-dire que seulement la recherche sera effectué sur les adresses indiquées au script. au debut j'ai pensé aspirer les sites puis de créer une base de données pour tous les sites aspirés et enfin un script qui va lire dans les dossiers des sites pour afficher les resultats de la requete .
je voulais donc votre avis sur les deux methode ( soit une liste d'url ou aspirer les sites) est-ce vraiment possible ? aussi je voudrais bien que vous me proposier un langage qui saurait faire la tache demandée !
je me debrouille en php - MySQL , C , C++ , Javascript, python , Ruby.
|
|
jeudi 3 avril 2008 à 02:19:20 |
Re : Meta moteur de recherche autonome?

coucou747
|
salut ta methode est la bonne, cependant, tu dois noter plusieurs choses avant de commencer ton projet -c'est un projet qui a des contraintes enormes
- temps de recherche de pages a partir de criteres donnees - fiabilite de l'indexation (si je cherche "captcha, php", je dois avoir des reponses correctes, sinon, ton projet ne sert a rien) - indexation rapide (si tu mets longtemps pour indexer les pages d'un site web, tu ne pourras pas en indexer beaucoup, et tu ne pourras pas non plus verifier les mises a jours, t'aurais donc peu de choix dans tes resultats) - bande passante (tu vas consommer pour indexer...) - nombre d'entrees dans une table (en general, c'est 2^32 la limite, or, exalead en est "deja" a 2^34 sites references, et c'est deja enorme... je sais pas si t'imagines le temps de calcule de n'importe quelle requete select avec un where sur un champ sans index, sur une table comme ca...)
-c'est pas un projet simple -t'as beaucoup de concurence -l'orthographe n'est pas toujours la bonne pour les mots d'une page... faut que t'en tiennes compte
exalead a refait son propre sgbd pour ce projet, et ils ont fait leur propre langage... a mon avis, ton script qui indexe les pages doit-etre fait dans un langage rapide, php c'est mort... python, a la limite, ruby, j'en sais rien. C, ca peut-etre interessant, mais pour parser une page, ca va pas etre tres tres simple. faut que tu puisses adresser ton sgbd perso a partir du langage que tu utiliseras, donc je te deconseille le php si tu recodes ton sgbd... sinon, t'as l'embaras du choix... /** * @author coucou747 <coucou747@hotmail.com> * @see irc://cominweb.uni-irc.net/#programmation */
|
|
vendredi 4 avril 2008 à 20:22:21 |
Re : Meta moteur de recherche autonome?

malalam
|
Hello,
concernant la techno à utiliser : PHp me semble en effet trop lent pour ça. Python, je suis d'accord, ça me semble tout indiqué, alliant simplicité et performances. Ruby est plus lent que PHP. Perl et PHP se valent. L'idéal restant le C en effet. Et sincèrement pour un projet tel que celui-là, je priviligierais les performances à la simplicité du code. Donc, je pencherais pour du bas niveau type C. Même si Python, pourquoi pas... Et...un GROS (voire plusieurs) serveur.
|
|
vendredi 4 avril 2008 à 20:44:29 |
Re : Meta moteur de recherche autonome?

coucou747
|
faudrait qu'on fasse des benchs serieux, parce-que j'ai de gros doutes sur ce que tu dis... j'avais pas du tout mesure les memes choses que toi quand j'avais fait mes benchs (c'etait il y a plusieurs annees), php etait terriblement lent compare au perl... cote vitesse, j'avais : python > perl > php que tu annonces ruby plus lent que php m'etonne aussi... faudrait qu'on fasse plusieurs programmes betes comme : acces aux donnees d'un tableau, tri d'un tableau, concatenation et substring de chaines de caracteres et regexp, en php, ruby, et perl, pour pouvoir comparer les langages, mais je doutes franchement que php s'en sorte correctement... /** * @author coucou747 <coucou747@hotmail.com> * @see irc://cominweb.uni-irc.net/#programmation */
|
|
vendredi 4 avril 2008 à 21:11:14 |
Re : Meta moteur de recherche autonome?

malalam
|
python > perl > php : je n'au pas dit le contraire, sauf que j'ai dit que php et perl se valent, et je le maintiens : Python est nettement plus rapide. Perl et PHP se valent, avec généralement un très léger avantage pour Perl, mais qui est négligeable et dépend des fonctionnalités utilisées. Et Perl ne dispose pas de toute la puissance communautaire ET du support de PHP (évolutions fréquentes de la part de ses développeurs), ce qui amène à penser que PHP, dans l'avenir, sera de toute manière lus intéressant. Ruby est TRES lent...en tous cas, dans un contexte web. Ruby est un merveilleux langage, attention...j'aime bcp. Elegant, racé...et complet, aussi. Mais pour le moment, il n'a pas les armes pour lutter avec PHP. Et je ne dis pas ça en tant que pro-PHP : j'adore PHP, mais je n'aurais aucun scrupule à le lâcher pour un langage qui me convient mieux. Alors j'aime Ruby, il est très agréable de coder avec, et pour des applications simples, il est plus performant que PHP en termes de temps de développement (et ça, c'était une gageure!). Mais pour des développements complexes...il ne peut pas lutter (pour le moment...mais quand même, précisions que Ruby est un langage qui a un certain âge, et qu'il est juste à a mode grâce à son framework web : Ruby On Rails...on le redécouvre, un peu comme XMLHTTP. Et Ruby On Rails n'évoluera sans doute pas autant que PHP, voyons les choses en face).
|
|
vendredi 4 avril 2008 à 22:45:43 |
Re : Meta moteur de recherche autonome?

Ahamayed
|
au fait vous devez savoir que google a été programmé en Python enfin d'après certains articles que j'ai lu sur le web.Mais en toute franchise , pour moi google c'est une arnaque tout simplement. a quoi lui sert la grande capacité de ses serveur , une memoire titanesque, une capacité de calcul montrieuse ...il serait stupide de ma part de ne pas reconaitre la performence de ce moteur ,mais le monde ne doit pas baisser les bras devant ce geni. je suis sur et certain qu'il y a une methode simple de comprendre le fonctionnement de google et meme de le surpasser. et dire que google se fait de l'argent avec l'algèbre linéaire ... j'ai fais une petite esperience sur mon PC: j'ai stocké dans une clé USB un dossier composé de 842 sous repertoire contenant 2138 fichiers de toutes sortes d'extensions. le tout avait une taille de 118 Mo. l'objectif etait de lancer une requette a l'assistant de recherche de windows xp dans le but de rechercher un mot ou un ensemble de mots clés en lisant les fichiers dans le repertoire principal . le temps max de recherche dependait du mot ou de l'expression rechercher. plus les fichier on en commun l'expression recherché plus le temps pour afficher les premiers resultat etait court (2 a 3 second pour une vingtaine de resultats mais la recherche totale ne dure jamais 30s).pour l'instant je tente de faire le raport entre la capacité de la RAM , la vitesse du processeur , le nombre de fichiers et de repertoires a traiter et le temps de recherche.
je suis entreins egalement de faire un petit programme ecrit en php , C, Python pour une comparaison .la future experience va porté sur un site aspiré; le programme va lire dans les repertoire du site et dans le corps des fichiers lisibles a la recherche d'une expression . la page qui contiendra le plus de mot qu'il y a dans l'expression aura la note max c'est a dire 50 de facon arbitraire. les autres pages une note inferieure. puis une fois que le prgramme index la meilleure page , il va devoir nous afficher le lien principale de cette page . pour l'instant seul le parametre temps m'interesse.
j'espere que c'est la peine tout ça ....!!
|
|
vendredi 4 avril 2008 à 23:24:59 |
Re : Meta moteur de recherche autonome?

malalam
|
Hmmm...
mon message ne va pas être très gentil : je demande pardon par avance. Ce n'est pas personnel...c'est juste à destination d'un certain état d'esprit semi rebelle à la con. Il faut arrêter les conneries : le jour ou tu seras capable de réaliser ce qu'ont réalisé les développeurs de Google, tu pourras la ramener. Coder un truc sur son pc perso, et coder pour le WWW sont deux choses très différentes. Soyons clair : Google est énorme...et fais un max de thunes! Ouais...mais en quoi cela nous autorise t il à les critiquer pour la simple raison qu'ils font de la thune ? Parce que le fond du problème est là. Les grands, on les fustige parce que ça fait bien. Ouis mais voilà : les développeurs de Google ont fait beaucoup de choses...beaucoup grauites, beaucoup en open source, et beaucoup très en avance sur leur temps. Google est un excellent moteur de recherche à la base. Et il n'y a pas que ça : il y a tout l'univers google, toutes leurs idées. Ils font des choses vraiment impressionnantes.
Alors franchement...ta recherche sur ta clef USB, comparée à une recherche sur le web...il y a de quoi rire. Je ne remets pas en cause TA recherche, ton algo, ton code...je remets en cause ta comparaison. 2138 fichiers, 842 sous répertoires, 118Mo. Il y a de quoi s'extasier, là? Il y a de quoi dire : Google, c'est de la merde, du foutage de gueule, regardez ce que j'arrive à faire avec mes petits moyens ? Faut arrêter le "rebellisme" à 2 balles. Commence par surpasser Google, et ensuite tu pourras la ramener. Mais là, tu ne fais qu'exposer des idées abstraites "je suis sûr qu'on peut faire mieux donc ce sont des cons". Ouais, moi aussi, je suis sûr qu'Einstein était un donc et qu'on peut remettre en question ses théories. Demain, je m'y mets...donc vous pouvez me croire : c'était un con, puisque demain, je ferai mieux. D'ailleurs en voilà la pruve : moi, j'au réussi à prouver que 1+1 = 2! Avec MES petits moyens! Alors forcément, vous imaginez bien que je peux faire bien mieux que les grands scientifiques si j'avais les mêmes moyens qu'eux ! Faut arrêter... "le monde ne doit pas baissre les bras devant ce génie"...ah non pardon "geni"...bref : ouais, c'est clair, ne nous laissons pas avoir par les génies, il faut combattre les idées géniales! Rallions-nous tous contre le génie!! A bas le génie! Le génie, c'est le mal! Pfff...
|
|
vendredi 4 avril 2008 à 23:51:20 |
Re : Meta moteur de recherche autonome?

Ahamayed
|
Merci Malalam pour ta remarque. mais j'aimerais bien que tu sache que google est mon favoris en matiere d'internet et d'ailleur pas seulement sur internet mais dans tous les domaines ! a te dire vrai dans ma chambre j'ai un poster du logo de google ! tout simplement parce que google m'impressionne , google est la reference en tout , et jai pris conscience que tout ce qui est comme google ou microsoft ou apple ou youtube ou yahoo et j'en passe , sera demain. mon message n'avait pas pour but de denigrer et de rabaisser google , non ! loin de moi cette idée ! mais seulement les mot etaient en guise d'encouragement ! il est certain que rien n'est eternel ! et si j'ai agi ainsi c'est dans l'espoir d'etre parmi les heritiers de google ... pourquoi diable je suis dans l'incapacité de coder un moteur de recherche qui etablie sa recherche sur une liste de 60 URL de sites differents ? je me souvient qu'il n ' y meme pas une semaine de cela que le reseaux internet de ma ville etait tombé en panne et drole de panne , seul google ne marchait pas et cela a duré 3 jours . subitement on a senti l'interet d'avoir google pret de soit ! on avait meme pensé que c'etait la fin de google mais bon.... si t'as une idé sur le projet et bien fait nous signe ! en tout cas moi je suis entrein de bosser ladessus et je souhete reussir et le publié sur le forum . 
|
|
vendredi 4 avril 2008 à 23:59:29 |
Re : Meta moteur de recherche autonome?

coucou747
|
je doute que google soit entierement fait en python... exalead c'est un langage qu'ils ont fait pour l'occasion... /** * @author coucou747 <coucou747@hotmail.com> * @see irc://cominweb.uni-irc.net/#programmation */
|
|
samedi 5 avril 2008 à 00:05:16 |
Re : Meta moteur de recherche autonome?

malalam
|
Alors si j'ai mal interprété ton message, pardonne-moi. Mais comprends une chose : google et toi, vous n'avez pas les mêmes moyens. Oh, que cela ne t'empêche pas d'essayer de faire mieux, et je te souhaite de réussir. On a toujours besoin de mieux. Mais voilà, Google, c'est tout un tas de développeurs doués, un tas de grosses machines, et un gros tas d'argent pour faire avancer tout ça. Voilà pourquoi toi, dans ta chambre, tu as tant de mal à lutter. Et c'est normal. Mais rien ne t'empêche d'essayer et, si tu as l'idée de génie, de réussir. C'est l'avantage avec le web : on peut encore réussir ce genre de prouesses...mais il faut se dépêcher, parce que ça ne va pas durer...comme dans tous les domaines de l'informatique. On ne crée plus un ordinateur génial dans son garage...on ne crée plus un jeu qui deviandra un blockbuster seul dans sa chambre...et bientôt, on ne révolutionnera plus le net sans de gros moyens. Mais là, il est encore temps pour le net...encore un peu. Mais c'est d'idées nouvelles dont tu as besoin, pas de reproduire ce qui existe déjà.
|
|
Cette discussion est classée dans : recherche, sites, moteur, autonome, meta
Répondre à ce message
Sujets en rapport avec ce message
moteur de recherche (meta donnees full text sur pdf, word et xml) [ par bidani ]
Bonjour à tous, je suis habitué à Java et à LUCENE (http://lucene.apache.org/java/docs/) et je cherche à savoir s'il existe qqchose d'equivalent dans
Moteur de recherche sur des fichiers [ par airben ]
Bonjour Quelqu'un peut'il m'aider s'il vous plait . Etant debutant , est il possible de crée un moteur de recherche sur des fichiers avec comme langa
moteur de recherche interne [ par clippy ]
Bonjour,Je dois absolument faire un moteur de recherche interne sur mon site pour mon travail de fin d'année. malgré tous les tutoriaux je n'y arrive
moteur de recherche [ par lorenzophar ]
Bonjour, je suis à la recherche d'un moteur performant permettant de chercher ds une BDD une chaine de caractère mais je ne sais pas comment faire ça
création d'un moteur de recherche spécifique [ par zemappeur ]
Salut a tous je suis actuellement en train de modifier tout mon site web et j'aimerai créer un moteur de recherche permettant de trouver dans un base
Recherche moteur de workflow [ par dannywilde ]
Bonjour a tous, je recherche un moteur de création de workflow en php ayant une interface graphique permettant de "dessiner" la définition des process
besoin d'aide pour un moteur de recherche [ par greg13127 ]
bonjour voila je voudrai faire un moteur de recherche style google je demande pas aussi bien mais du même style avec un système d'ajout des sites po
moteur de recherche ... [ par djagger ]
Salut !Je voudrais mettre un moteur de recherche sur mon site.Le problème c'est que tout est en PHP, je m'explique.En fait j'ai qu'une seule page, qui
Positionnement d'un site dans un moteur de recherche [ par spardo ]
Bonjour, Voilà, je voudrais créer un petit programme qui analyse le positionnement d'un site dans un moteur de recherche à partir de mots-clés. Par ex
Recherche multicritere [ par kestacrew ]
Bonsoir à tous,je souhaite réaliser un petit moteur de recherche multicritère et je ne sais pas trop comment m'y prendre ?En fait j'ai créé une cinqua
Livres en rapport
|
Derniers Blogs
ROSLYN FLUENT APIS: ROSLYNHELPER NUGET PACKAGEROSLYN FLUENT APIS: ROSLYNHELPER NUGET PACKAGE par Matthieu MEZIL
Si vous utilisez Roslyn et que vous vous voulez vous simplifier le code du code rewriter, je vous conseille d'installer mon NuGet package RoslynHelper ....(read more) ...
Cliquez pour lire la suite de l'article par Matthieu MEZIL POUR RAPPEL ! LES SPéCIFICATIONS DES PROTOCOLES OFFICE ET SHAREPOINT SONT DISPONIBLES SUR MSDNPOUR RAPPEL ! LES SPéCIFICATIONS DES PROTOCOLES OFFICE ET SHAREPOINT SONT DISPONIBLES SUR MSDN par neodante
Quelle est le point commun entre : Microsoft il y a 10 ans et Apple aujourd'hui ? Réponse: avoir une politique de protocoles propriétaires et fermés :) Car pour rappel (si si je vous assure c'est important de le rappeler), la majorité des spécifications e...
Cliquez pour lire la suite de l'article par neodante JOYEUX ANNIVERSAIRE NIXJOYEUX ANNIVERSAIRE NIX par ebartsoft
Souhaitons un bon et joyeux anniversaire à notre hôte à tous, Nix.
Je ne le répéterais jamais assez mais sans lui rien ne serait possible. Il défit en permanence les lois de la gravité et comme il le dit si bien, si tu lui fais confiance ça devra...
Cliquez pour lire la suite de l'article par ebartsoft IMAGINE CUP 2012, MAKE A SIGN EN FINALEIMAGINE CUP 2012, MAKE A SIGN EN FINALE par junarnoalg
Voilà qui est fait, la nouvelle est officielle ! L'équipe belge "Make a Sign" va au pays des kangourous défendre son projet dans la catégorie Software Design. http://www.imaginecup.com/CompetitionsContent/Competition/WorldwideFinalists.aspx V...
Cliquez pour lire la suite de l'article par junarnoalg KINECT 1.5 IS OUT !KINECT 1.5 IS OUT ! par Vko
La version 1.5 du Kinect For Microsoft vient tout juste de sortir ! Plein de nouveautés: Tracking de squelette en Near Mode Détection en position assise Détection faciale avec un SDK dédié Documentation et des guideline (enfin) Un out...
Cliquez pour lire la suite de l'article par Vko
Logiciels
sDEVIS-FACTURES vlPRO (8.1.0.3)SDEVIS-FACTURES VLPRO (8.1.0.3)sDEVIS-FACTURES vlPRO a été mis au point pour les particuliers, créateurs, entrepreneurs, artisa... Cliquez pour télécharger sDEVIS-FACTURES vlPRO 974 Application Server (12.2.4.6)974 APPLICATION SERVER (12.2.4.6)Développez de puissantes applications dans un environnement de 'cloud computing', clusterisé, séc... Cliquez pour télécharger 974 Application Server vPicture (1.4.2.1)VPICTURE (1.4.2.1)Avec vPicture, hébergez vos images facilement et rapidement.
vPicture est un utilitaire simple, ... Cliquez pour télécharger vPicture Easy-Planning (2.2.1.6)EASY-PLANNING (2.2.1.6)Easy-Planning permet de créer des plannings sous la représentation de diagrammes et est adapté au... Cliquez pour télécharger Easy-Planning COM-BACKUP (2.0)COM-BACKUP (2.0)
COM-BACKUP est un logiciel de sauvegarde qui permet de planifier les sauvegardes de vos dossiers ...
Cliquez pour télécharger COM-BACKUP
|