[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [InetBib] Syntax von Suchanfragen: best practices



Hallo Herr Szott,

Am 13.08.12 19:44, schrieb Sascha Szott:
Ich habe das mal kurz exemplarisch in verschiedenen Systemen ausprobiert
(Primo, Summon, VuFind) und festgestellt, dass es hier offenbar keine
einheitliche Behandlung gibt. In den meisten Fällen bekomme ich auch "a
algorithm …" bzw. "b trees" als Suchtreffer ausgegeben (ich habe jeweils
die Titelsuche gewählt, um auszuschließen, dass der Hit irgendwo im TOC,
Abstract oder Volltext enthalten ist).
um explizit bestimmte unerwünschte Suchtreffer auszuschliessen, gibt es 
weitere Operatoren, z.B.

Google:

"b+ trees" -"b trees"

CQL-Syntax:

title = "\"b+-trees\"" not title = "\"b trees\""

mit anderen Worten, eine "andnot"-Operation kann gewährleisten, dass 
Treffer gefiltert werden, die "b tree" enthalten. Falls es jedoch keine 
Indexierung des speziellen Symbols '+' oder andere Vorkehrungen zur 
Phrasensuche gegeben hat, ergibt sich häufig die leere Menge.

Mit Google funktioniert es z.B. ganz gut
https://www.google.de/search?q=%22b%2B+trees%22+-%22b+trees%22

Eine Anfrageformulierung mit einer Differenzmengenoperation erscheint 
mir persönlich relativ zum erzielten Ergebnis etwas umständlich. 
Vielleicht ist das Geschmackssache. Gute Implementierungen leisten durch 
das Rankingverfahren (Gewichtung des Abstands der getroffenen Wörter im 
Dokument), dass die gewünschten Treffer bereits mit einer einfach 
formulierbaren Ein-Phrasen-Suche ganz oben in der Treffermenge auftauchen.

Viele Grüße

Jörg Prante

-- 
http://www.inetbib.de

Listeninformationen unter http://www.inetbib.de.