PostgreSQL FTS - Tipps und Tricks: Unterschied zwischen den Versionen

Aus Geoinformation HSR
Wechseln zu: Navigation, Suche
K (Die Seite wurde neu angelegt: „Siehe auch: * PostgreSQL, PostgreSQL - Tipps und Tricks * http://delicious.com/sfkeller/fulltext == Allgemeines == Zur Konfiguration von Full Text Sear…“)
 
K
Zeile 35: Zeile 35:
 
tbd.
 
tbd.
  
=== Importieren von Wikipedia/Wikinews ===
+
=== Konvertieren von Wikipedia/Wikinews nach SQL Dump ===
  
 
tbd.
 
tbd.

Version vom 29. April 2013, 10:21 Uhr

Siehe auch:

Allgemeines

Zur Konfiguration von Full Text Search (FTS).

Wenn man...

  • (allgemeine) englische Texte durchsuchen will, muss man nichts umkonfigurieren (ausser den Index).
  • fachspezifische Texte hat, dann ist ein sep. Thesaurus zu konfigurieren (.syn + .thes laden).
  • (allgemeine) deutsche Texte hat, dann kann man für's Erste den Stemmer umkonfigurieren (plus Index).
  • ...

Die effiziente Textsuche kann verschiedene Ziele verfolgen:

  • Suche in deutschen (ev. auch gemischten de+en Dokumenten) allgemein.
  • Suche in fach- oder branchen-spezifische Texten.
  • Exakte Suche oder unscharfe Suche.

Als unscharfe Suche kommen in PG in Frage:

  • soundex, metaphone, dmetaphone (built-in Fn.) und Levenshtein (Modul fuzzystrmatch).
  • Trigramm (zusammen mit dem speziellen GiST/kNN-Index).

Dictionaries

Freie Text-Corpora (Corpus):

Tipps und Tricks

Einlesen von externen Dateien

tbd.

Konvertieren von Wikipedia/Wikinews nach SQL Dump

tbd.