begin process at 2012 05 30 17:16:50
  Trouver un code source :
 
dans
 
Accueil > Forum > 

PHP

 > 

Web 2.0

 > 

Autre

 > 

Parser un SUPER fichier xml zippé(.gz)!


Derniers messages déposésPoser une question dans le forum ou lancer une discussion

Parser un SUPER fichier xml zippé(.gz)!

vendredi 22 février 2008 à 19:07:13 | Parser un SUPER fichier xml zippé(.gz)!

alifarah7

Bonjour,

et excusez moi pour le derangement

J'ai un fichier que je reçois chaque jour d'une société et qui contient leur flux rss contenant leurs produits, prix, categorie ....
le problème qu'il m'envoient ce fichier zippé (.gz) avec une taille incroyable 600 Méga car le fichier xml d'origine est de 5 Go !!!!
J'ai essayé de lire le fichier .gz directement ça n'a pas marché, j'ai essayé de le dézipper avnant de l'exploiter ça a bloqué le serveur sans ouvrir même le .gz avec gzopen()...je ne peux pas faire l'extraction manuellement car je fais un site dynamique qui doit faire tt automatiquement par les cron.

Je sais pas si quelqu'un de vous a déjà été ds un tel prob...
Je vx soit une façon de lire le .gz directement soit n'importe quelle idée qui me resolve le prob !!!!
Merci d'avance

vendredi 22 février 2008 à 19:24:02 | Re : Parser un SUPER fichier xml zippé(.gz)!

malalam

Administrateur CodeS-SourceS
Hello,

tu ne t'en sortiras pas en php.
A vrai dire, un fichier de 5go, j'aimerais bien savoir comment, eux, ils l'exploitent...quel que soit le langage.
Je ne sais pas ce que tu dois faire de ce fichier...mais à mon avis, tu dois faire appel au shell : décompresser l'archive via le shell, puis découper le fichier.
Ensuite, tu pourras exploiter les petits fichiers en php.

Ceci dit...ils changent tous les jours tout leur catalogue, la société en question...? Ou est-ce simplement que leurs informaticiens sont incapables de faire une mise à jour différentielle...parce qu'un nouveau catalogue xml de 5go par jour, je n'y crois absolument pas, moi.
vendredi 22 février 2008 à 19:49:28 | Re : Parser un SUPER fichier xml zippé(.gz)!

alifarah7

Merci pour ta reponse malalam :)
pour ce qui concerne la société en question c la fameuse buy.com et les fichiers de 5Go ils ne comportent que les informations differencielles!!! mais eux ils m'envoient un fichier .gz de 600Méga de taille et en plus chaque jour!!!

pour ta solution de shell je pense que ça serait une bonne idée mais j'ai besoin de plus de details car j'ai jamais utilisé cette fonctionnalité...et en plus est ce que mon fichier xml conserverait t'il son format aprés decompression?et en cas de decompression tu penses que shell serait intelligent et ne couperais t'il pas de n'importe où dans n'importe quel balise?

Merci infiniment malalam

vendredi 22 février 2008 à 20:39:50 | Re : Parser un SUPER fichier xml zippé(.gz)!

malalam

Administrateur CodeS-SourceS
Pour la décompression, je crois que c'est
tar -xtvf nom_du_fichier
un truc dans le genre, je me mélange tjrs les pinceaux avec les options.

Le shell ne fera que ce que tu lui demandes, à toi de coder un petit batch shell  pour découper correctement ton xml (et ajouter à chaque fichier un en-tête correct, évidemment).


samedi 23 février 2008 à 01:35:20 | Re : Parser un SUPER fichier xml zippé(.gz)!

coucou747

Administrateur CodeS-SourceS
mais si c'est faisable :)

la decompression doit se faire ailleur que dans php, ensuite, faut lire par blocs, et traiter "tout ce qu'on peut traiter", avant de lire le bloc suivant (en evitant de garder des choses en memoire)

c'est clair qu'un file_get_contents ou autre, tu peux oublier...

les parseurs xml classiques sont a oublier aussi... tu vas devoir te faire un truc pour gerer un "flux", et un truc pour gerer ton parsing xml du "flux"

je te conseille des langages compiles pour ca, ou au moins compiles en bytecode, mais en php c'est faisable...

/**
* @author coucou747 <coucou747@hotmail.com>
* @see irc://cominweb.uni-irc.net/#programmation
*/
samedi 23 février 2008 à 09:55:43 | Re : Parser un SUPER fichier xml zippé(.gz)!

AlexN

L'analyse d'un tel fichier devrait être possible avec php, mais il faut choisir le bon type de d'analyseur xml.

Il existe deux familles de parsers :

- les parsers hierarchiques qui construisent en mémoire un arbre DOM du fichier xml. Ils doivent pouvoir charger la totalité du fichier en mémoire pour construire l'arbre.
- les parsers évènementiels qui répondent à des évènements au cours de la lecture du fichier qui se fait par morceau. Le fichier n'est pas chargé intégralement en mémoire. (API SAX)

Pour un fichier de 5Go, seuls les parsers évènementiels pourront le gérer : http://fr3.php.net/xml

Pour la décompression, je ne crois pas non plus que php sera capable de gérer un tel fichier. La solution sera de lancer la décompression soit manuellement, soit par cron, mais effictivement dans un environnement de type shell.
samedi 23 février 2008 à 11:16:27 | Re : Parser un SUPER fichier xml zippé(.gz)!

malalam

Administrateur CodeS-SourceS
Hello,

le problème ne vient pas de si on pourrait ou pas lire un tel fichier. Le problème est que php gère très mal la mémoire : même s'il faisait du "ligne à ligne" (entre guillemete, on parle de xml là hein), je doute fort qu'il soit capable de désallouer suffisemment de mémoire à chaque "itération" pour aller au bout. Même en l'aidant au maximum.
Mais bon...ça ne coûte rien d'essayer.
mardi 26 février 2008 à 16:19:08 | Re : Parser un SUPER fichier xml zippé(.gz)!

alifarah7

Merci pourr vos suggextions, j'ai essayé les parsers evenementiels ligne par ligne mais ça marche pas mais maintenant j'essaye de mettre en oeuvre une solution perl car perl peux en même temps compresser les .gz facilement et peux lire ligne par ligne le fichier xml....
l'essai de cette solution est en cours (excusez moi pour ce retard  pour repondre car je travaille pas sur un seul projet et celui ci est en priorité basse) et je vais vous mettre au courant pour le resultat

Merci tous pour votre interêt

lundi 16 février 2009 à 14:53:38 | Re : Parser un SUPER fichier xml zippé(.gz)!

anisis

bonjour,
en fait je suis tombé dans un cas pareil que le votre sauf que pour moi j'arrive pas à atteindre les Go , bref je reçoie au quotidien des flux xml de taille variées ( entre 30 Mo et 100 Mo) compressé (.rar ) qui contient les produits et leur prix et que je dois les parser et mettre à jour ma base . c'est à dire je cherche une methode de décompression en ligne (en php si c'est possible) et comme ça je peux les parser.
J'espère que mon problème est clair pour vous et que vous pourriez m'aider à trouver le chemin pour la solution.
Merci d'avance.


Cette discussion est classée dans : fichier, xml, parser, zippé, gz


Répondre à ce message

Sujets en rapport avec ce message

Au secours : comment parser un fichier xml et inserer a la volé dans une base mysql [ par deblok83 ] Bonjour,     c'est mon premier post ici alors je me permet de me presenter je suis le webmaster de deblok83.com . j'ai un petit probleme je veux fair XML et EncryptedData ? [ par debuger ] Bonjour,J'aimerai savoir s'il est possible de Parser un fichier XML qui est crypté ! ? et celà avec une feuille de style XSL bien sur ?d'ailleurs comm Parser XML à partir d'un DTD externe [ par sokyra ] Bonjour, Je dois vérifier la cohérence d'un fichier XML par rapport à un fichier DTD. Or ce fichier XML ne contient pas de balise <!DOCTYPE . Dan Formulaire OK sous FF mais pas sous IE [ par fdlps ] Bjr,Ce php est associé a un fichier swf loader, un swf mail 1, un fichiet HTML et un CSS.j'ai un souci avec mon formulaire il fonctionne sous FF mais Problème expression régulière [ par nounours21_6 ] Bonjour, J'ai un souci de construction d'expression régulière. J'ai un fichier XML et il faut que j'enlève l'en-tête grace à une ER.Voila le fichier modification de propriétés d'une balise dans un fichier XML [ par RV2931 ] Bonjour,Je travaille sur une application qui doit manipuler un gros fichier SVG et j'aurai voulu savoir comment faire pour charger un fichier SVG (XML Ecrire dans mon fichier XML [ par LiTtLeBuBu ] Bonjour,Voila je vous expose ma demande. J'ai un fichier XML qui gère mon diaporama FLASH. J'aimerais grace a php mettre ce fichier à jour. Il y a une xml [ par vieu6c ] salut j aimerai bien savoir comment convertir un fichier xml en fichier pdfvotre aide me sera precieuse.thanks charger fichier xml [ par alipo ] Salut a tousje creer un fichier xml avec php5 .il fonctionne dans la localhost et lorsque j'ai instaler sur le serveur ftp il s'affiche le erreur suiv écrire dans un fichier xml [ par nicomilville ] Salut,j'ai un code php pour écrire dans un fichier XML qui ne marche pas comme je voudrai : je voudrai que le message et le pseudo s'ajoute dans le fi


Nos sponsors


Sondage...

Comparez les prix

CalendriCode

Mai 2012
LMMJVSD
 123456
78910111213
14151617181920
21222324252627
28293031   

Consulter la suite du CalendriCode

Photothèque

A découvrir



 
Développement réalisé par Nicolas SOREL (Nix) avec l'aide de : Cyril DURAND et Emmanuel (EBArtSoft), Merci à Vincent pour ses précieux conseils.
CodeS-SourceS.com© Toute reproduction même partielle est interdite sauf accord écrit du Webmaster
CodeS-SourceS.com© est une marque déposée tous droits réservés

Google Coop CodeS-SourceS Google Coop CodeS-SourceS
Temps d'éxécution de la page : 0,983 sec (4)

Nous contacter | Annoncer sur CodeS-SourceS | Mentions légales