lucene-java-user mailing list archives

Site index · List index
Message view « Date » · « Thread »
Top « Date » · « Thread »
From "Erick Erickson" <erickerick...@gmail.com>
Subject Re: problem undestanding the hits.score
Date Thu, 01 Nov 2007 22:56:08 GMT
What leads you to expect that ordering? Scoring in Lucene is
NOT simply counting the number of times a word appears.

That said, I really have no clue how the scoring algorithm
works since it's always been "good enough for me". But
if you search the mail archive for scoring, you'll find a
wealth of info.

But a cursory look at the Lucene website turned up
this:
http://lucene.apache.org/java/docs/scoring.html

which goes into some detail about scoring..

Best
Erick

On 10/31/07, Jamal jamalator <jtandina@yahoo.fr> wrote:
>
>
> Hi
>
> I have indexed this html document
> =============z1========================
> <html>
>   <body>
> <h1>zo zo zo zo zo zo zo zo zo zo zo zo </h1><br>
> <h1>zo zo zo zo zo zo zo zo zo zo zo zo </h1><br>
> <h1>zo zo zo zo zo zo zo zo zo zo zo zo </h1>
>   </body>
> </html>
> =============z2=========================
> <html>
>    <body>
> <h1>zo zo zo zo zo zo zo zo zo zo zo zo </h1><br>
> <h1>zo zo zo zo zo zo zo zo zo zo zo zo </h1><br>
>    </body>
> </html>
> =============z3==========================
> <html>
>    <body>
> <h1>zo zo zo zo zo zo zo zo zo zo zo zo </h1><br>
>    </body>
> </html>
> =========================================
> with this code
>
> Field contentK1 = new  Field("htmlcontent",httpd.getContentKeywords(),
> Field.Store.NO,Field.Index.TOKENIZED );
> contentK1.setBoost(1/10f);  //10%
> doc.add(contentK1);
>
> and when a search "zo" with luke i have (whitespaceanalyser):
>
> (score , id   )
> (0,0957,z2 )
> (0,0947,z3 )
> (0,0938,z1)
>
> NORMALY the resut expected have to be z1 z2 z3
>
> Some One have an idea ??
>
> Thank you all
>
>
>
> ---------------------------------
>   Ne gardez plus qu'une seule adresse mail ! Copiez vos mails vers Yahoo!
> Mail
>
>
> ---------------------------------
> Ne gardez plus qu'une seule adresse mail ! Copiez vos mails vers Yahoo!
> Mail

Mime
  • Unnamed multipart/alternative (inline, None, 0 bytes)
View raw message