Accueil > Forum > > > > Parser un SUPER fichier xml zippé(.gz)!
Parser un SUPER fichier xml zippé(.gz)!
vendredi 22 février 2008 à 19:07:13 |
Parser un SUPER fichier xml zippé(.gz)!

alifarah7
|
Bonjour,
et excusez moi pour le derangement 
J'ai un fichier que je reçois chaque jour d'une société et qui contient leur flux rss contenant leurs produits, prix, categorie .... le problème qu'il m'envoient ce fichier zippé (.gz) avec une taille incroyable 600 Méga car le fichier xml d'origine est de 5 Go !!!! J'ai essayé de lire le fichier .gz directement ça n'a pas marché, j'ai essayé de le dézipper avnant de l'exploiter ça a bloqué le serveur sans ouvrir même le .gz avec gzopen()...je ne peux pas faire l'extraction manuellement car je fais un site dynamique qui doit faire tt automatiquement par les cron.
Je sais pas si quelqu'un de vous a déjà été ds un tel prob... Je vx soit une façon de lire le .gz directement soit n'importe quelle idée qui me resolve le prob !!!! Merci d'avance 
|
|
vendredi 22 février 2008 à 19:24:02 |
Re : Parser un SUPER fichier xml zippé(.gz)!

malalam
|
Hello,
tu ne t'en sortiras pas en php. A vrai dire, un fichier de 5go, j'aimerais bien savoir comment, eux, ils l'exploitent...quel que soit le langage. Je ne sais pas ce que tu dois faire de ce fichier...mais à mon avis, tu dois faire appel au shell : décompresser l'archive via le shell, puis découper le fichier. Ensuite, tu pourras exploiter les petits fichiers en php.
Ceci dit...ils changent tous les jours tout leur catalogue, la société en question...? Ou est-ce simplement que leurs informaticiens sont incapables de faire une mise à jour différentielle...parce qu'un nouveau catalogue xml de 5go par jour, je n'y crois absolument pas, moi.
|
|
vendredi 22 février 2008 à 19:49:28 |
Re : Parser un SUPER fichier xml zippé(.gz)!

alifarah7
|
Merci pour ta reponse malalam :) pour ce qui concerne la société en question c la fameuse buy.com et les fichiers de 5Go ils ne comportent que les informations differencielles!!! mais eux ils m'envoient un fichier .gz de 600Méga de taille et en plus chaque jour!!!
pour ta solution de shell je pense que ça serait une bonne idée mais j'ai besoin de plus de details car j'ai jamais utilisé cette fonctionnalité...et en plus est ce que mon fichier xml conserverait t'il son format aprés decompression?et en cas de decompression tu penses que shell serait intelligent et ne couperais t'il pas de n'importe où dans n'importe quel balise?
Merci infiniment malalam 
|
|
vendredi 22 février 2008 à 20:39:50 |
Re : Parser un SUPER fichier xml zippé(.gz)!

malalam
|
Pour la décompression, je crois que c'est tar -xtvf nom_du_fichier un truc dans le genre, je me mélange tjrs les pinceaux avec les options.
Le shell ne fera que ce que tu lui demandes, à toi de coder un petit batch shell pour découper correctement ton xml (et ajouter à chaque fichier un en-tête correct, évidemment).
|
|
samedi 23 février 2008 à 01:35:20 |
Re : Parser un SUPER fichier xml zippé(.gz)!

coucou747
|
mais si c'est faisable :) la decompression doit se faire ailleur que dans php, ensuite, faut lire par blocs, et traiter "tout ce qu'on peut traiter", avant de lire le bloc suivant (en evitant de garder des choses en memoire) c'est clair qu'un file_get_contents ou autre, tu peux oublier... les parseurs xml classiques sont a oublier aussi... tu vas devoir te faire un truc pour gerer un "flux", et un truc pour gerer ton parsing xml du "flux" je te conseille des langages compiles pour ca, ou au moins compiles en bytecode, mais en php c'est faisable... /** * @author coucou747 <coucou747@hotmail.com> * @see irc://cominweb.uni-irc.net/#programmation */
|
|
samedi 23 février 2008 à 09:55:43 |
Re : Parser un SUPER fichier xml zippé(.gz)!

AlexN
|
L'analyse d'un tel fichier devrait être possible avec php, mais il faut choisir le bon type de d'analyseur xml.
Il existe deux familles de parsers :
- les parsers hierarchiques qui construisent en mémoire un arbre DOM du fichier xml. Ils doivent pouvoir charger la totalité du fichier en mémoire pour construire l'arbre. - les parsers évènementiels qui répondent à des évènements au cours de la lecture du fichier qui se fait par morceau. Le fichier n'est pas chargé intégralement en mémoire. (API SAX)
Pour un fichier de 5Go, seuls les parsers évènementiels pourront le gérer : http://fr3.php.net/xml
Pour la décompression, je ne crois pas non plus que php sera capable de gérer un tel fichier. La solution sera de lancer la décompression soit manuellement, soit par cron, mais effictivement dans un environnement de type shell.
|
|
samedi 23 février 2008 à 11:16:27 |
Re : Parser un SUPER fichier xml zippé(.gz)!

malalam
|
Hello,
le problème ne vient pas de si on pourrait ou pas lire un tel fichier. Le problème est que php gère très mal la mémoire : même s'il faisait du "ligne à ligne" (entre guillemete, on parle de xml là hein), je doute fort qu'il soit capable de désallouer suffisemment de mémoire à chaque "itération" pour aller au bout. Même en l'aidant au maximum. Mais bon...ça ne coûte rien d'essayer.
|
|
mardi 26 février 2008 à 16:19:08 |
Re : Parser un SUPER fichier xml zippé(.gz)!
|
lundi 16 février 2009 à 14:53:38 |
Re : Parser un SUPER fichier xml zippé(.gz)!

anisis
|
bonjour, en fait je suis tombé dans un cas pareil que le votre sauf que pour moi j'arrive pas à atteindre les Go , bref je reçoie au quotidien des flux xml de taille variées ( entre 30 Mo et 100 Mo) compressé (.rar ) qui contient les produits et leur prix et que je dois les parser et mettre à jour ma base . c'est à dire je cherche une methode de décompression en ligne (en php si c'est possible) et comme ça je peux les parser. J'espère que mon problème est clair pour vous et que vous pourriez m'aider à trouver le chemin pour la solution. Merci d'avance.
|
|
Cette discussion est classée dans : fichier, xml, parser, zippé, gz
Répondre à ce message
Sujets en rapport avec ce message
Au secours : comment parser un fichier xml et inserer a la volé dans une base mysql [ par deblok83 ]
Bonjour, c'est mon premier post ici alors je me permet de me presenter je suis le webmaster de deblok83.com . j'ai un petit probleme je veux fair
XML et EncryptedData ? [ par debuger ]
Bonjour,J'aimerai savoir s'il est possible de Parser un fichier XML qui est crypté ! ? et celà avec une feuille de style XSL bien sur ?d'ailleurs comm
Parser XML à partir d'un DTD externe [ par sokyra ]
Bonjour, Je dois vérifier la cohérence d'un fichier XML par rapport à un fichier DTD. Or ce fichier XML ne contient pas de balise <!DOCTYPE . Dan
Formulaire OK sous FF mais pas sous IE [ par fdlps ]
Bjr,Ce php est associé a un fichier swf loader, un swf mail 1, un fichiet HTML et un CSS.j'ai un souci avec mon formulaire il fonctionne sous FF mais
Problème expression régulière [ par nounours21_6 ]
Bonjour, J'ai un souci de construction d'expression régulière. J'ai un fichier XML et il faut que j'enlève l'en-tête grace à une ER.Voila le fichier
modification de propriétés d'une balise dans un fichier XML [ par RV2931 ]
Bonjour,Je travaille sur une application qui doit manipuler un gros fichier SVG et j'aurai voulu savoir comment faire pour charger un fichier SVG (XML
Ecrire dans mon fichier XML [ par LiTtLeBuBu ]
Bonjour,Voila je vous expose ma demande. J'ai un fichier XML qui gère mon diaporama FLASH. J'aimerais grace a php mettre ce fichier à jour. Il y a une
xml [ par vieu6c ]
salut j aimerai bien savoir comment convertir un fichier xml en fichier pdfvotre aide me sera precieuse.thanks
charger fichier xml [ par alipo ]
Salut a tousje creer un fichier xml avec php5 .il fonctionne dans la localhost et lorsque j'ai instaler sur le serveur ftp il s'affiche le erreur suiv
écrire dans un fichier xml [ par nicomilville ]
Salut,j'ai un code php pour écrire dans un fichier XML qui ne marche pas comme je voudrai : je voudrai que le message et le pseudo s'ajoute dans le fi
Livres en rapport
|
Derniers Blogs
POUR RAPPEL ! LES SPéCIFICATIONS DES PROTOCOLES OFFICE ET SHAREPOINT SONT DISPONIBLES SUR MSDNPOUR RAPPEL ! LES SPéCIFICATIONS DES PROTOCOLES OFFICE ET SHAREPOINT SONT DISPONIBLES SUR MSDN par neodante
Quelle est le point commun entre : Microsoft il y a 10 ans et Apple aujourd'hui ? Réponse: avoir une politique de protocoles propriétaires et fermés :) Car pour rappel (si si je vous assure c'est important de le rappeler), la majorité des spécifications e...
Cliquez pour lire la suite de l'article par neodante JOYEUX ANNIVERSAIRE NIXJOYEUX ANNIVERSAIRE NIX par ebartsoft
Souhaitons un bon et joyeux anniversaire à notre hôte à tous, Nix.
Je ne le répéterais jamais assez mais sans lui rien ne serait possible. Il défit en permanence les lois de la gravité et comme il le dit si bien, si tu lui fais confiance ça devra...
Cliquez pour lire la suite de l'article par ebartsoft IMAGINE CUP 2012, MAKE A SIGN EN FINALEIMAGINE CUP 2012, MAKE A SIGN EN FINALE par junarnoalg
Voilà qui est fait, la nouvelle est officielle ! L'équipe belge "Make a Sign" va au pays des kangourous défendre son projet dans la catégorie Software Design. http://www.imaginecup.com/CompetitionsContent/Competition/WorldwideFinalists.aspx V...
Cliquez pour lire la suite de l'article par junarnoalg KINECT 1.5 IS OUT !KINECT 1.5 IS OUT ! par Vko
La version 1.5 du Kinect For Microsoft vient tout juste de sortir ! Plein de nouveautés: Tracking de squelette en Near Mode Détection en position assise Détection faciale avec un SDK dédié Documentation et des guideline (enfin) Un out...
Cliquez pour lire la suite de l'article par Vko LES ACTUALITéS DE LA SEMAINE SUR C2I.FR (14 MAI - 20 MAI) LES ACTUALITéS DE LA SEMAINE SUR C2I.FR (14 MAI - 20 MAI) par richardc
Mise à jour des Web API du 14 Mai
Réservez dès maintenant votre journée du 20 juin pour le Windows Azure Dev Camp 2012 à Paris
Mise à jour de Team Foundation Service
MechCommander 2 sur Windows 8
Entity Framework 5 Release Candidate e...
Cliquez pour lire la suite de l'article par richardc
Forum
BALISE D'ANCREBALISE D'ANCRE par FADEST
Cliquez pour lire la suite par FADEST
Logiciels
sDEVIS-FACTURES vlPRO (8.1.0.3)SDEVIS-FACTURES VLPRO (8.1.0.3)sDEVIS-FACTURES vlPRO a été mis au point pour les particuliers, créateurs, entrepreneurs, artisa... Cliquez pour télécharger sDEVIS-FACTURES vlPRO 974 Application Server (12.2.4.6)974 APPLICATION SERVER (12.2.4.6)Développez de puissantes applications dans un environnement de 'cloud computing', clusterisé, séc... Cliquez pour télécharger 974 Application Server vPicture (1.4.2.1)VPICTURE (1.4.2.1)Avec vPicture, hébergez vos images facilement et rapidement.
vPicture est un utilitaire simple, ... Cliquez pour télécharger vPicture Easy-Planning (2.2.1.6)EASY-PLANNING (2.2.1.6)Easy-Planning permet de créer des plannings sous la représentation de diagrammes et est adapté au... Cliquez pour télécharger Easy-Planning COM-BACKUP (2.0)COM-BACKUP (2.0)
COM-BACKUP est un logiciel de sauvegarde qui permet de planifier les sauvegardes de vos dossiers ...
Cliquez pour télécharger COM-BACKUP
|