lucene-java-user mailing list archives

Site index · List index
Message view « Date » · « Thread »
Top « Date » · « Thread »
From "Tun Lin" <chen...@singnet.com.sg>
Subject Translation.
Date Wed, 03 Dec 2003 01:42:02 GMT
Hi,

Can anyone translate this text for me? I cannot understand the instructions.
Please help!

Thanks.

===========
 ____________
|            |
| LUCY 1.1   |   readme.txt    Ultimo aggiornamento: 18/03/2003
|____________|





STRUTTURA


Lucy 1.1	-> Lucene 1.2
		-> HTMLParser 1.2
		-> PdfBox 0.5.6
		-> wvWare 0.7.2-3
		-> xlhtml 0.4.9
		-> antiword 0.33
		-> Xpdf 2.01 
		-> Snowball 0.1
		-> NGramJ 01.12.11
		-> it.corila.lucy	-> IndexAll.java
					-> SearchIndex.java
					-> HTMLDocument.java
					-> PDFDocument.java
					-> ExternalParser.java
					-> ItalianStemFilter.java
					-> EnglishStemFilter.java
					-> ApostropheFilter.java
					-> IndexAnalyzer.java
					-> SearchAnalyzer.java
					-> LanguageCategorizer
					-> NgramjCategorizer.java





DESCRIZIONE

Lucy e' in grado di indicizzare tutti i files con estensione txt, html, pdf,
doc, ppt, xls contenuti in una cartella base e nelle sue sottocartelle. Consente
ricerche da linea di comando DOS oppure mediante interfaccia web. Gestisce testi
in Italiano e Inglese con procedure di elaborazione lessicale specifiche.





SISTEMI OPERATIVI SUPPORTATI

Windows 98 / Windows 2000 / Windows XP





REQUISITI DI SISTEMA

Nessuno tranne i permessi necessari alla scrittura di files su una cartella del
sistema
Per utilizzare il modulo di ricerca con interfaccia web e' necessario disporre
di Apache Tomcat, versione 3 o 4.




INSTALLAZIONE

Lanciare la procedura automatica di installazione Lucy1.1.exe, oppure
scompattare
il file Lucy1.1.zip in una cartella (NB: il percorso non deve contenere spazi).
L'applicazione utilizza di default una propria java virtual machine. E'
possibile utilizzarne un'altra gia' installata nel sistema modificando il valore
della variabile MYJAVAPATH nel file jvm.bat
In questo caso la cartella jre puo' essere eliminata per ridurre l'occupazione
di spazio su disco di circa 40 MBytes.




CONFIGURAZIONE

Modificare i valori delle variabili contenute nel file properties.txt, nella
cartella base dell'applicazione:


lucy.path: cartella in cui si e' installata l'applicazione 

log.files.dir: cartella in cui verranno creati i files di log

del.temp.files: eliminazione dei files temporanei alla fine dell'indicizzazione
(yes/no)

doc.parser: parser da utilizzare per i files .doc (antiword/wvware)

pdf.parser: parser da utilizzare per i files .pdf (xpdf/pdfbox)

index.dir: cartella in cui verranno memorizzati gli indici

index.name: nome dell'indice che deve essere creato

indexing.folder: cartella che deve essere indicizzata


IMPORTANTE: tutti i percorsi devono essere indicati utilizzando come separatori
di directory due barre rovesciate (\\) anziche' una barra singola




MODALITA' DI UTILIZZO

I tre files batch nella cartella base dell'applicazione sono attivabili
direttamente da Windows con doppio click.

indicizza.bat					       crea un indice

aggiorna.bat					       modifica un indice

cerca.bat					       effettua ricerche su un
indice

Tutti i parametri necessari (nome e localizzazione dell'indice, percorso della
cartella da indicizzare) vanno specificati a priori nel file properties.txt


E' possibile in alternativa utilizzare le procedure da riga di comando dos,
sempre con la modifica preventiva del file properties.txt
In questo caso inoltre, mediante la sintassi:

cerca percorso-indice

si possono effettuare ricerche su altri indici creati in precedenza, senza
modificare il file properties.txt




NOTE SULL'UTILIZZO DEI PARSERS

I valori di default impostati per i parsers sono quelli consigliati per la prima
esecuzione dell'indicizzazione. In un secondo momento e' possibile modificarli
ai valori alternativi e procedere a un aggiornamento dell'indice. In questo modo
i documenti che non sono stati indicizzati per errori di parsing vengono
processati anche dai due parsers alternativi.

Qualora il processo di parsing portasse ad errori di sistema che costringessero
a interrompere il processo di indicizzazione, l'utente potra' riprendere
l'indicizzazione da dove si e' interrotta utilizzando la procedura di
aggiornamento, avendo cura di rimuovere - prima di lanciarla - il file
write.lock dalla cartella che contiene i file dell'indice.





UTILIZZO COME WEB APPLICATION PER RICERCHE TESTUALI

Se nel sistema e' installato il motore per servlet e jsp Apache Tomcat, e'
possibile effettuare le ricerche sugli indici tramite un'interfaccia web. Se e'
presente anche una web server application le ricerche possono avvenire da un
browser remoto connesso a internet. La procedura di configurazione e' la
seguente:


- copiare il file lucyweb.war nella sottocartella webapps di Tomcat 


- far partire Tomcat mediante la procedura di startup, in modo che il file war
venga scompattato


- nel file configuration.jsp della cartella webapps\lucyweb cosi' ottenuta,
devono essere impostate tre variabili:

  1) indexLocation deve puntare alla cartella in cui e' contenuto l'indice sul
quale si vogliono compiere le ricerche

  2) siteIP deve contenere l'ip della macchina di pubblicazione dei documenti

  3) serverRoot deve essere uguale al percorso su disco della cartella di
pubblicazione del web server

  Nel caso non si disponga di un web server e quindi si effettuino le ricerche
con interafaccia web solo in locale, le ultime due variabili devono essere
lasciate vuote ("")


- per accedere localmente alla pagina delle ricerche digitare nella barra
indirizzi del browser l'url 
  
  http://localhost:8080/lucyweb 

  Per l'accesso da browser remoto usare l'indirizzo ip del server seguito dal
percorso della cartella lucyweb.



La sintassi ammessa per le query e' consultabile in una pagina di help on line.



NOTA: l'indice non potra' essere eliminato se prima non viene eseguito lo
shutdown di Tomcat. Potra' pero' essere aggiornato in contemporanea a processi
di ricerca.

==============


Mime
  • Unnamed multipart/alternative (inline, None, 0 bytes)
View raw message