lucene-java-user mailing list archives

Site index · List index
Message view « Date » · « Thread »
Top « Date » · « Thread »
From "Stephane NOBILET" <snobi...@sqli.com>
Subject Re: Wildcards problem
Date Tue, 09 Mar 2004 17:18:35 GMT
donc c'est possible que lorsque je cherche comp* ma requête développée
contienne les mots comme
comptage, compte ( d'ailleurs il me ramène des docs contenants ces mots )
mais pas comptable car il y a trop de lettre ????

c'est possible ?

il n'y a pas un paramètre qui limite le nombre de mots dans la requête
développée ? ou le nombre de caractères derrière "* " ?






----- Original Message -----
From: "Paladin " <paladin3@club-internet.fr>
To: "Stephane NOBILET" <snobilet@sqli.com>
Sent: Tuesday, March 09, 2004 6:04 PM
Subject: Re: Wildcards problem


Attention ;)
La recherche peut tomber en erreur meme si il y a peu de documents, en fait
ca vient surtout de la taille de la requété "developpé" (là où je travaille
si tu recherches les articles "francais" ca marche (3 millions de
documents), si tu recherche les 14* (ce qui correspond aux articles
francais; 3 millions toujours) ca ne marche plus (nuance de taille, je me
suis battu avec pendant 1 mois pour comprendre exactement le mécanisme de ce
plantage et gérer correctement le problème).
Pour expliquer le phénoméne de l'* on va prendre une liste numérique.
1400 bleu
1401 bleu
1403 bleu
1410 bleu
1412 bleu
Si tu recher sur "bleu" ta requété "developpé" ne contiendra que "bleu", si
tu recherche 14*, ta requete va contenir 1400 ou 1401 ou.... 1412. D'ou un
plantage mémoire AVANT la recherche.
Cela dit ca n'a pas l'air d'être le cas ici car dans ce cas lucene ne doit
rien ramener (en 1.2 en tout cas, ca a peut etre changer en 1.3 !)

Il faut (à mon avis) vérifier l'indexation de tes documents et l'analyseur
de requete.
Essaye de poster un morceau de ton code comme otis te le suggére (je vois
que c'est fait et je pense comme lui meme si je n'écarte pas un probléme
memoire du a la requete)

----- Original Message -----
From: "Stephane NOBILET" <snobilet@sqli.com>
To: "Paladin " <paladin3@club-internet.fr>
Sent: Tuesday, March 09, 2004 5:49 PM
Subject: Re: Wildcards problem


> Non elle ne tombe pas en erreur car elle me ramène d'autres documents ...
>
> et on retrouve ce pb lorsqu'il y a peu de document !!!
>
>
>
>
> ----- Original Message -----




---------------------------------------------------------------------
To unsubscribe, e-mail: lucene-user-unsubscribe@jakarta.apache.org
For additional commands, e-mail: lucene-user-help@jakarta.apache.org


Mime
View raw message