Hi Pradeep,
you could generate a parser in java with the ANTLR parser generator. See
http://antlr.org for details. If you download ANTLR you will find an example
definition to generate a HTML-Parser. ANTLR is easy to use and I imagine you
could easily define a parser for the other file formats as well.
Yours,
Christoph Breidert
-----Ursprüngliche Nachricht-----
Von: Pradeep Kumar K [mailto:pradeepk@robosoftin.com]
Gesendet: Samstag, 24. August 2002 06:49
Betreff: Parsers
Hi friends
I need parsers for the following file formats
1. HTML
2. PDF
3. MSWord
4. RTF
4. Simple text
Do any body developed parsers( in java) for all/any of the file formats?
If you have please tell me the links so that I can download.
Thanks in Advance
Pradeep
--------------------------------------------------------------
Robosoft Technologies - Partners in Product Development
--
To unsubscribe, e-mail:
<mailto:lucene-user-unsubscribe@jakarta.apache.org>
For additional commands, e-mail:
<mailto:lucene-user-help@jakarta.apache.org>
<<<<<<<<<<<<<<<<<<<<<<<<<<<
sitewaerts GmbH
Hebelstraße 15
D-76133 Karlsruhe
Tel: +49 (721) 920 918 0
Fax: +49 (721) 920 918 29
http://www.sitewaerts.de
>>>>>>>>>>>>>>>>>>>>>>>>>>>
Der Inhalt dieser E-Mail ist vertraulich und ausschließlich für den
bezeichneten Adressaten bestimmt. Wenn Sie nicht der vorgesehene Adressat
dieser E-Mail oder dessen Vertreter sein sollten, so beachten Sie bitte, daß
jede Form der Kenntnisnahme, Veröffentlichung, Vervielfältigung oder
Weitergabe des Inhalts dieser E-Mail unzulässig ist. Wir bitten Sie, sich in
diesem Fall mit dem Absender der E-Mail in Verbindung zu setzen. Aussagen
gegenüber dem Adressaten unterliegen den Regelungen des zugrundeliegenden
Angebotes bzw. Auftrags, insbesondere den Allgemeinen Auftragsbedingungen
und der individuellen Haftungsvereinbarung. Der Inhalt der E-Mail ist nur
rechtsverbindlich, wenn er unsererseits durch einen Brief entsprechend
bestätigt wird.
--
To unsubscribe, e-mail: <mailto:lucene-user-unsubscribe@jakarta.apache.org>
For additional commands, e-mail: <mailto:lucene-user-help@jakarta.apache.org>
|