cocoon-users-fr mailing list archives

Site index · List index
Message view « Date » · « Thread »
Top « Date » · « Thread »
From "Verachten Bruno" <Bruno.Verach...@atosorigin.com>
Subject RE: Intégrer HTML mal formé
Date Fri, 08 Jul 2005 08:41:29 GMT
Bonjour,

> Je dois intégrer dans un site web basé sur cocoon 2.1.7 des 
> pages HTML existantes.
> Le problème est que cocoon n'accepte que les documents bien formés.
>  
> Comment procéder?
>  
> Sitemap : 
>   <map:match pattern="">
>     <map:generate src="actualite.html"/>  // Document mal 
> formé  (Généré à partir de word)
>     <map:transform src="actualite.xsl"/>
>            <map:parameter name="arbo-file" value="arborescence.xml"/>
>            <map:parameter name="toc-file" value="menu.xml"/>
>            <map:parameter name="base-url" value="/cocoon/intranet"/>
>     </map:transform>
>     <map:serialize/>
>    </map:match>
Je connais vraiment très mal Cocoon, mais j'ai l'habitude de travailler
avec des pages HTML faites par Word. Pour les nettoyer, j'utilise
généralement JTidy[1]. Pour les donner en entrée à une transformation XSLT,
j'utilise le parseur NekoHTML[2].
Je ne sais pas dans quelle mesure vous pourrez brancher l'un ou l'autre
dans votre chaîne.

Bruno Verachten

[1] : http://sourceforge.net/projects/jtidy
[2] : http://people.apache.org/~andyc/neko/doc/html/index.html

---------------------------------------------------------------------
Liste francophone Apache Cocoon -- http://cocoon.apache.org/fr/
Pour vous desinscrire : mailto:users-fr-unsubscribe@cocoon.apache.org
Autres commandes : mailto:users-fr-help@cocoon.apache.org


Mime
View raw message