Diskussion:POI-Service: Unterschied zwischen den Versionen

Aus Geoinformation HSR
Wechseln zu: Navigation, Suche
(Tag-Suchstrategie)
Zeile 13: Zeile 13:
  
 
Services:  
 
Services:  
* Taginfo API (inkl. neu: get RelatedTerms).
 
 
* Bing Translation API (sonst Chemnitzer Tools).
 
* Bing Translation API (sonst Chemnitzer Tools).
* Taginfo API mit Set von RelatedTerms aus beliebigen OSM-Wiki-Seiten (deutschen und englischen).
+
* [[Taginfo]] API, geplant neu mit Set von RelatedTerms aus beliebigen OSM-Wiki-Seiten (deutschen und englischen).
 
* (Weitere Linguistik-Tools:
 
* (Weitere Linguistik-Tools:
 
** Wortübersetzung: Bing API (Google Translate API wird kostenpflichtig). [http://www-user.tu-chemnitz.de/~fri/ding/ Chemnitzer Dictionary (en=>de)]. Google Translate API (ist obsolet).
 
** Wortübersetzung: Bing API (Google Translate API wird kostenpflichtig). [http://www-user.tu-chemnitz.de/~fri/ding/ Chemnitzer Dictionary (en=>de)]. Google Translate API (ist obsolet).

Version vom 31. August 2011, 23:33 Uhr

Allgemeines

...


Tag-Suchstrategie

Begriffliches:

  • Term: meist identisch mit Wort, jedoch möglicherweise zusammengesetz bzw. mit Space getrennt
  • Tag: Kombination von Key und Value.

Input: Suchbegriff (z.B. "Schloss" mit Sprachcode, z.B. "DE")

Services:

  • Bing Translation API (sonst Chemnitzer Tools).
  • Taginfo API, geplant neu mit Set von RelatedTerms aus beliebigen OSM-Wiki-Seiten (deutschen und englischen).
  • (Weitere Linguistik-Tools:
    • Wortübersetzung: Bing API (Google Translate API wird kostenpflichtig). Chemnitzer Dictionary (en=>de). Google Translate API (ist obsolet).
    • OpenOffice/WordNet-Synonyme (englisch und andere Sprachen) oder OpenThesaurus.de (Deutsch).
    • Ontologie, z.B. SKOS: => zu komplex für OSM-Leute?)

Preprocessing:

  1. Add RelatedTerms to AnyLanguage-Termlist: RelatedTerms zu "Schloss" auslesen. Die DE-Termliste enthält nun "Schloss, Villa, Ruine" (via neue Taginfo API, Resultat: AnyLanguage-Termlist)
  2. Translate (AnyLanguage=>EN): Im Beispiel ergibt das eine EN-Termliste "castle, villa, ruin" (mit Bing API, Resultat: EN-Termlist)
  3. Add RelatedTerms to EN-Termlist: EN-Termliste mit RelatedTerms erweitern: EN-Termliste hat nun nebst "castle, villa, ruin" palace" zusätzlich "manor, bunker, chateau, citadel" (via neue Taginfo API, Resultat: Erweiterte EN-Termlist)
  4. Statistik zu EN-Termliste sammeln:
    1. Terms je als Keys und als Values abfragen (bestehende Taginfo API).
    2. Eigennamen ("name = Schloss X") herausfiltern.

Ranking (Vorschlag SK):

  1. Kommt urspr. Suchbegriff als Key vor?
    1. falls value "YES/NO" ist => Rückgabe. Z.B. Suche nach DE:Bank => "EN:bench" ergibt "bench=yes" und "amenity=bench".
    2. ansonsten => Rückgabe Liste mit allen zugehörigen Values (z.B. z.B. Suche nach "EN:amenity" ergibt "amenity=parking; amenity=restaurant; amenity=bench; ...".
  2. Kommt urspr. Suchbegriff als Value vor?
    1. => Rückgabe Value mit entsprechendem KEy. Z.B. Suche nach DE:Bank => "EN:bench" ergibt "amenity=bench".
    2. Zusätzliche positive Gewichtung falls es eine Wiki-Seite zum Suchbegriff gibt.
  3. Dann dasselbe wiederholen mit der EN-Wortliste im Sinne von schwächerem Ranking und "Meinten Sie..."?

Taginfo-Beispiele siehe Taginfo.

Weblinks

Notizen

  • Eine Tag=Value-Paar-Statistik kann auch aktuell und direkt aus der OSM-DB berechnet werden. Das dauert lange - nur schon für CH z.Zt. drei Minuten! - die Daten ändern sich aber nicht so schnell grundlegend). Das bietet auch die TagInfo API.