Return-Path: Delivered-To: apmail-couchdb-user-archive@www.apache.org Received: (qmail 22596 invoked from network); 11 Jun 2009 18:31:08 -0000 Received: from hermes.apache.org (HELO mail.apache.org) (140.211.11.3) by minotaur.apache.org with SMTP; 11 Jun 2009 18:31:08 -0000 Received: (qmail 42834 invoked by uid 500); 11 Jun 2009 18:31:19 -0000 Delivered-To: apmail-couchdb-user-archive@couchdb.apache.org Received: (qmail 42773 invoked by uid 500); 11 Jun 2009 18:31:19 -0000 Mailing-List: contact user-help@couchdb.apache.org; run by ezmlm Precedence: bulk List-Help: List-Unsubscribe: List-Post: List-Id: Reply-To: user@couchdb.apache.org Delivered-To: mailing list user@couchdb.apache.org Delivered-To: moderator for user@couchdb.apache.org Received: (qmail 92389 invoked by uid 99); 11 Jun 2009 17:58:40 -0000 X-ASF-Spam-Status: No, hits=-0.0 required=10.0 tests=SPF_PASS X-Spam-Check-By: apache.org Received-SPF: pass (nike.apache.org: local policy) Message-ID: <4A314597.7060102@freenet.de> Date: Thu, 11 Jun 2009 19:57:43 +0200 From: Heiko Henning User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.8.1.21) Gecko/20090302 Lightning/0.9 Thunderbird/2.0.0.21 Mnenhy/0.7.6.666 MIME-Version: 1.0 To: user@couchdb.apache.org Subject: Anfrage auf Performance und Realisierbarkeit X-Enigmail-Version: 0.95.7 Content-Type: text/plain; charset=ISO-8859-15 Content-Transfer-Encoding: 8bit X-Virus-Checked: Checked by ClamAV on apache.org -----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 Hallo, ich habe gerade den CCC exp podcast mit genuss geh�rt. Und finde eure Datenbank sehr interessant. w�rde Sie auch gerne f�r http://www.jepaa.com/ verweden und w�rde dich/euch mal kurz drum bitten mir zu sagen wir realistisch das ist: Eine Seite schaut ca so aus: { "domain" : "anzeigenmarkt.tel", "txt" : "bli bla blub", "kontakte" : [ { "name" : "Anfrage", "ort" : "work", "data" : "info@domain.de", "type" : "mail" }, { "name" : "Suppport", "ort" : "work", "data" : "support@domain.de", "type" : "mail" }, ], "standort" : { "lat" : 145.32423432, "lon" : 232.232 }, "keywords" : [ { "ul" : "Gesch�ft", "fn" : "Max", "ln" : "Muster", "nn" : "musti", "st" : "mustergasse" }, { "ul" : "Privat", "fn" : "Max", "ln" : "Muster", "nn" : "musti", "st" : "dorfstrasse" }, ] } Davon so 300 000 St�ck. Nun m�chte ich eine Fultext Index mit Bewertung erzeugen: var stopwordfilter = new Array('ohne', 'Um', der', 'die' .....) function split(txt) { var data = txt.split("/[\s\,\.\!\?\-\_]+/"); for(i in stopwordfilter) for(x in data) if (data[x]==stopwordfilter[i]) delete data[x]; return data; } var domainParts = seite.domain.split("/\./"); domainParts.arrayReverse(); var points = 5; for(var i=1 ; i0 ; l--) { addToIndex(domainParts.substr(0, l), points*basePoints); basePoints--; } points=points/2; } und das auch f�r titel und text und keywords usw aber halt auf jedes Feld eine andere Bewertung und so das z.B. das Wort "anzeigenmarkt" in der Domain 10 Punkte bekommt und anzeigenmark nur noch 9 weil die �bereinstimmung kleiner ist. Dann bei der Suche wird dann Gesucht: Suchsring: "gr�ne Gra� Wiese" Suche nach "gr�ne" oder "Gra�" oder "Wiese" und seite.standort.lat zwischen 100 und 130 und seite.standort.lon zwischen 200 und 220 ist Sortiere nach der Bewertung im Index aber wenn eine Seite "gr�ne" und "Wiese" enth�lt dann multipliziere die gefunden Bewertungen miteinander. Und vorallem wie performant das ist? -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.4.2 (MingW32) Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org iD8DBQFKMUWXNPIVS5vtVToRAt84AJ4letTBUy7s7yHqdf9NA8zXxciNfgCgtrv3 lPgdAqDEiJu9H/HF+tKc09k= =ikjv -----END PGP SIGNATURE-----