Bonjour,
je suis actuellement en train de développer en PHP un gestionnaire de documents avec un système d'indexation.
Pour l'instant, je n'index que les documents pdf grâce à pdftotext qui fonctionne à merveille.
Seulement, maintenant, je voudrais attaquer Word et Excel mais je n'ai trouvé aucun moyen de lire le contenu des fichiers en clair (il reste tout cet amas de hieroglyphes autour du texte). Evidemment, il faut que la solution fonctionne sous Linux :-)
Avez vous une idée sur la manière de procéder ?
Merci d'avance pour vos réponses. :-)