begin process at 2012 05 31 13:50:06
  Trouver un code source :
 
dans
 
Accueil > Forum > 

PHP

 > 

Divers

 > 

Divers

 > 

récupérer le texte d'un document .docx


Derniers messages déposésPoser une question dans le forum ou lancer une discussion

récupérer le texte d'un document .docx

mardi 29 janvier 2008 à 10:29:58 | récupérer le texte d'un document .docx

the_number_9

bonjour, je voudrais savoir comment on fiat pour récupérer le texte d'un document .docx? si vous avez une idée. voila merci bien

mardi 29 janvier 2008 à 11:28:18 | Re : récupérer le texte d'un document .docx

codefalse

Administrateur CodeS-SourceS
Yop ! :)

Un document Docx n'est tout simplement qu'une archive ZIP contenant un élement xml pour le corps du fichier, ainsi que des dossiers (pour les images, etc).

Tu n'a donc qu'a dézipper le fichier et récuperer le xml, ensuite si tu veux juste récuperer le texte sans mise en forme, tu supprime toutes les balises et ca devrait etre a peu pres bon.

walawala
mardi 29 janvier 2008 à 11:47:13 | Re : récupérer le texte d'un document .docx

the_number_9


merci bien ça a marché, le seul probleme est maintenant tous les caracteres speciaux.

mardi 29 janvier 2008 à 11:49:16 | Re : récupérer le texte d'un document .docx

codefalse

Administrateur CodeS-SourceS
si tu fait tout manuellement (dézip avec 7zip, winzip, winrar) et que tu ouvre le xml avec un éditeur de texte, tu a aussi des problemes d'encodages ?

si "non", alors utilise les fonction utf8_decode/utf8_encode (ca va dépendre du sens d'encodage, essaye une, puis l'autre si la premiere ne marche pas) et ton probleme devrait etre résolu ! :)
mardi 29 janvier 2008 à 12:58:27 | Re : récupérer le texte d'un document .docx

the_number_9

non j'utilise une fonction en php qui génére le chagment du .docx en .zip, puis le dezippe et va chercher dans le bon document le texte. en fait j'ai fait cela pour récupérer les mots clés d'un document. j'ai utilisé ta fonction utf8_decode etil y a beaucoup de "?" et avec l'autre il y a plein de caractere illisible donc j'ai pris la premiere.

mardi 29 janvier 2008 à 14:19:24 | Re : récupérer le texte d'un document .docx

codefalse

Administrateur CodeS-SourceS
si tu affiche ton fichier xml sans le modifier, tu devrai avoir l'indication sur le charset (utf8, iso8859), regarde cela, ensuite dans ton script php tu fait un header ("charset=utf8"); (faudra regarder la syntaxe exact sur le web) et tu ne devrait plus avoir de problemes d'encodage
mardi 29 janvier 2008 à 14:36:28 | Re : récupérer le texte d'un document .docx

the_number_9

merci beaucoup

dans mon doc XML j'ai ça :
 <?xml version="1.0" encoding="UTF-8" standalone="yes"
?>
donc j'ai copié ça dans ma page :
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=utf-8">
et j'ai toujours les "?". de plus a cause de cet encodage des mots se coupent pas au bon endroit ce qui fausse ma recherche de mots clés.

mardi 29 janvier 2008 à 15:04:52 | Re : récupérer le texte d'un document .docx

codefalse

Administrateur CodeS-SourceS
fait dans ton php :

header('Content-type: text/html; charset=UTF-8');

ensuite tu met
echo file_get_contents ('tonfichierxmldézippé.xml');
?>

et tu devrait plus avoir de problemes d'accents
mardi 29 janvier 2008 à 15:43:36 | Re : récupérer le texte d'un document .docx

the_number_9

ok merci bcp ca marche nikel!!!!

mardi 29 janvier 2008 à 16:18:18 | Re : récupérer le texte d'un document .docx

codefalse

Administrateur CodeS-SourceS
Réponse acceptée !
coche un "Réponse accepté" afin d'indiquer aux autres que c'est bon pour toi merci :)

1 2

Cette discussion est classée dans : récupérer, texte, document, docx


Répondre à ce message

Sujets en rapport avec ce message

Récuperer un texte entre deux balises spécifiques [ par yvain91 ] Bonjour j'aurai besoin de récupérer du texte dans un fichier que j'ai ouvert avec la fonction fopen. Ce texte se trouve entre deux balises facilement Récupération de texte dans une adresse internet [ par ICIoBRa ] Salut a tous !Je voudrai savoir comment faire pour récupérer le texte "voila" dans cette adresse : www.site.fr/voila< récupérer la valeur d'un champ texte [ par ghizlanekh ] bjr, je reviens avec une autre question.dans mon formulaire j'ai un champ texte input type ="text" et je veux enregistrer son contenu dans ma base de Récupérer la valeur d'un champ texte [ par Sytchev3 ] Sur un formulaire je dispose d'un champ texte, je voulais savoir :comment récupérer sa valeurTester si sa valeur est vide Si la valeur est différente récupérer des données de la BD dans des champs texte [ par adil9999 ] Bonjour. J'ai un formulaire (champs texte) dans lequel je veux récupérer le résultat d'une selection de la table : stagiaire(N°_stagiaire,nom petit problème pour adapter un scipt de news [ par voxibis ] Bonjour, J'ai un petit problème pour adapter un script de news !Je reçois cette erreur :Notice: Undefined variable: report in d:\intranetok\news\postn WYSIWYG ... [ par Hector78 ] Hello !J'ai trouvé un code (http://www.javascriptfr.com/code.aspx?ID=25847) permettant la modification de texte et la mise en forme online (WYSIWYG ou Récupèrer les donnés d'un formulaire sans recharger la page [ par blackshadows ] Bonjour, J'ai besoin d'aide j'ai un script d'upload d'images[url=www.fidjiforum.info](VISIBLE ICI)[/url].Mon problème est que je voudrais que l'upload Problème création d'une Iframe pour ne pas recharger la page... [ par blackshadows ] Bonsoir, J'ai besoin d'aide j'ai un script d'upload d'images([url=http://www.fidjiforum.info]visible ici[/url]) créer avec le concour de "CODE57"que j récupérer les variables d'une page web [ par bizarr ] Bonjour à tous, je cherche à récupérer une variable inscrite dans une page web pour l'utiliser comme donnée dans mon script. Par exemple récupérer le


Nos sponsors


Sondage...

CalendriCode

Mai 2012
LMMJVSD
 123456
78910111213
14151617181920
21222324252627
28293031   

Consulter la suite du CalendriCode

A découvrir



 
Développement réalisé par Nicolas SOREL (Nix) avec l'aide de : Cyril DURAND et Emmanuel (EBArtSoft), Merci à Vincent pour ses précieux conseils.
CodeS-SourceS.com© Toute reproduction même partielle est interdite sauf accord écrit du Webmaster
CodeS-SourceS.com© est une marque déposée tous droits réservés

Google Coop CodeS-SourceS Google Coop CodeS-SourceS
Temps d'éxécution de la page : 0,421 sec (4)

Nous contacter | Annoncer sur CodeS-SourceS | Mentions légales