lucene-solr-user mailing list archives

Site index · List index
Message view « Date » · « Thread »
Top « Date » · « Thread »
From "Tim Mahy" <t...@infosupport.com>
Subject RE: Highlight - get terms used by lucene
Date Thu, 27 Mar 2008 15:22:01 GMT
Hi,

thanks for the answer, with that information I can pull out the term frequency. Reason for
all this, is that we want to use this scoring algorithm: http://download-uk.oracle.com/docs/cd/B19306_01/text.102/b14218/ascore.htm

but is there a performance cost on the explain, that can be painfull for production (16 million
documents), since we would have to always use the explain feature for every request ..

hoping someone can answer this and help us out,

greetings,
Tim


-----Oorspronkelijk bericht-----
Van: Chris Hostetter [mailto:hossman_lucene@fucit.org]
Verzonden: do 27-3-2008 7:36
Aan: solr-user@lucene.apache.org
Onderwerp: Re: Highlight - get terms used by lucene
 

: we use highlighting and snippets for our searches. Besides those two, I 
: would want to have a list of terms that lucene used for the 
: highlighting, so that I can pull out of a "Tim OR Antwerpen AND Ekeren" 
: the following terms : Antwerpen, Ekeren if let's say these are the only 
: terms that gave results ...

the closest you can get is the "explain" info in the debugging output.

currently that comes back as a big string you would need to parse, but 
since the topic of progromaticly accessing that data seems to have come up 
quite a bit more then i ever really expected, i will point out that 
internally it's a fairly well structured class that could be output as a 
hierarchy of NamedLists (funny bit of trivia: i wrote that code once upon 
a time before SOlr was an Apache project, but it wouldn't work because the 
XmlResponseWriter had a bug where it couldn't handle NamedLists more then 
3 levels deep)

a patch would be fairly simple if someone wanted to write one.



-Hoss






Info Support - http://www.infosupport.com 

Alle informatie in dit e-mailbericht is onder voorbehoud. Info Support is op geen enkele wijze
aansprakelijk voor vergissingen of onjuistheden in dit bericht en staat niet in voor de juiste
en volledige overbrenging van de inhoud hiervan. Op al de werkzaamheden door Info Support
uitgevoerd en op al de aan ons gegeven opdrachten zijn - tenzij expliciet anders overeengekomen
- onze Algemene Voorwaarden van toepassing, gedeponeerd bij de Kamer van Koophandel te Utrecht
onder nr. 30135370. Een exemplaar zenden wij u op uw verzoek per omgaande kosteloos toe.

De informatie in dit e-mailbericht is uitsluitend bestemd voor de geadresseerde. Gebruik van
deze informatie door anderen is verboden. Openbaarmaking, vermenigvuldiging, verspreiding
en/of verstrekking van deze informatie aan derden is niet toegestaan. 

Dit e-mailbericht kan vertrouwelijke informatie bevatten. Indien u dit bericht dus per ongeluk
ontvangt, stelt Info Support het op prijs als u de zender door een antwoord op deze e-mail
hiervan op de hoogte brengt en deze e-mail vervolgens vernietigt. 

Mime
  • Unnamed multipart/alternative (inline, None, 0 bytes)
View raw message