cocoon-users-fr mailing list archives

Site index · List index
Message view « Date » · « Thread »
Top « Date » · « Thread »
From Frédéric Glorieux <frederic.glori...@ajlsm.com>
Subject wordGenerator, pdfGenerator ?
Date Mon, 06 Jun 2005 09:56:14 GMT

   Bonjour,

J'ai besoin d'extraire au moins le texte de fichiers word et pdf. Il 
faut craindre que le XML généré se résumera d'abord à un seul élément 
racine du genre <text/>.

Est-ce que cette sorte de generators auraient déjà été faits ou pensés? 
Pour l'instant je vois 2 librairies sur lesquelles s'appuyer, 
<http://www.textmining.org> et <http://www.pdfbox.org/>. Est-ce qu'il y 
aurait mieux ?


-- 
Frédéric Glorieux ("AJLSM", <http://ajlsm.com>)



---------------------------------------------------------------------
Liste francophone Apache Cocoon -- http://cocoon.apache.org/fr/
Pour vous desinscrire : mailto:users-fr-unsubscribe@cocoon.apache.org
Autres commandes : mailto:users-fr-help@cocoon.apache.org


Mime
View raw message