|
|
(26 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt) |
Zeile 1: |
Zeile 1: |
− | == Allgemeines ==
| |
| | | |
− | ...
| |
− |
| |
− |
| |
− | == Tag-Suchstrategie ==
| |
− |
| |
− | Begriffliches:
| |
− | * Term: meist identisch mit Wort, jedoch möglicherweise zusammengesetz bzw. mit Space getrennt
| |
− | * Tag: Kombination von Key und Value.
| |
− |
| |
− | Input: Suchbegriff (z.B. "Schloss" mit Sprachcode, z.B. "DE")
| |
− |
| |
− | Services:
| |
− | * Taginfo API (inkl. neu: get RelatedTerms).
| |
− | * Bing Translation API (sonst Chemnitzer Tools).
| |
− | * Taginfo API mit Set von RelatedTerms aus beliebigen OSM-Wiki-Seiten (deutschen und englischen).
| |
− | * (Weitere Linguistik-Tools:
| |
− | ** Wortübersetzung: Bing API (Google Translate API wird kostenpflichtig). [http://www-user.tu-chemnitz.de/~fri/ding/ Chemnitzer Dictionary (en=>de)]. Google Translate API (ist obsolet).
| |
− | ** [http://lingucomponent.openoffice.org/thesaurus.html OpenOffice]/WordNet-Synonyme (englisch und andere Sprachen) oder [http://www.openthesaurus.de/ OpenThesaurus.de] (Deutsch).
| |
− | ** Ontologie, z.B. SKOS: => zu komplex für OSM-Leute?)
| |
− |
| |
− | Preprocessing:
| |
− | # Add RelatedTerms to AnyLanguage-Termlist: RelatedTerms zu "Schloss" auslesen. Die DE-Termliste enthält nun "Schloss, Villa, Ruine" (via neue Taginfo API, Resultat: AnyLanguage-Termlist)
| |
− | # Translate (AnyLanguage=>EN): Im Beispiel ergibt das eine EN-Termliste "castle, villa, ruin" (mit Bing API, Resultat: EN-Termlist)
| |
− | # Add RelatedTerms to EN-Termlist: EN-Termliste mit RelatedTerms erweitern: EN-Termliste hat nun nebst "castle, villa, ruin" palace" zusätzlich "manor, bunker, chateau, citadel" (via neue Taginfo API, Resultat: Erweiterte EN-Termlist)
| |
− | # Statistik zu EN-Termliste sammeln:
| |
− | ## Terms je als Keys und als Values abfragen (bestehende Taginfo API).
| |
− | ## Eigennamen ("name = Schloss X") herausfiltern.
| |
− |
| |
− | Ranking (Vorschlag SK):
| |
− | # Kommt urspr. Suchbegriff als Key vor?
| |
− | ## falls value "YES/NO" ist => Rückgabe. Z.B. Suche nach DE:Bank => "EN:bench" ergibt "bench=yes" und "amenity=bench".
| |
− | ## ansonsten => Rückgabe Liste mit allen zugehörigen Values (z.B. z.B. Suche nach "EN:amenity" ergibt "amenity=parking; amenity=restaurant; amenity=bench; ...".
| |
− | # Kommt urspr. Suchbegriff als Value vor?
| |
− | ## => Rückgabe Value mit entsprechendem KEy. Z.B. Suche nach DE:Bank => "EN:bench" ergibt "amenity=bench".
| |
− | ## Zusätzliche positive Gewichtung falls es eine Wiki-Seite zum Suchbegriff gibt.
| |
− | # Dann dasselbe wiederholen mit der EN-Wortliste im Sinne von schwächerem Ranking und "Meinten Sie..."?
| |
− |
| |
− | Taginfo-Beispiele siehe [[Taginfo]].
| |
− |
| |
− | == Weblinks ==
| |
− |
| |
− | * [http://taginfo.openstreetmap.org/apidoc Taginfo API]
| |
− | * [http://wiki.openstreetmap.org/wiki/Wiki_Translation]
| |
− |
| |
− | == Notizen ==
| |
− |
| |
− | * Eine Tag=Value-Paar-Statistik kann auch aktuell und direkt aus der OSM-DB [http://bit.ly/rutOT2 berechnet] werden. Das dauert lange - nur schon für CH z.Zt. drei Minuten! - die Daten ändern sich aber nicht so schnell grundlegend). Das bietet auch die TagInfo API.
| |