Diskussion:Taginfo/RelatedTerm: Unterschied zwischen den Versionen
Stefan (Diskussion | Beiträge) |
Stefan (Diskussion | Beiträge) |
||
Zeile 2: | Zeile 2: | ||
Teilnehmer/innen: | Teilnehmer/innen: | ||
− | * [[Benutzer:Stefan|Stefan]] | + | * [[Benutzer:Stefan|Stefan]] |
* Daniela | * Daniela | ||
* Marc | * Marc |
Version vom 6. September 2011, 20:09 Uhr
Projekt RelatedTerms in OSM 2011
Teilnehmer/innen:
- Stefan
- Daniela
- Marc
Fortschrittsanzeige: http://wiki.openstreetmap.org/wiki/Special:WhatLinksHere/Template:RelatedTerm
Task List RelatedTerm-Erfassung
Erfassen von Synonymen als RelatedTerm-Templates (v.a. englisch) von häufigsten OSM-Tags im Wiki (ca. 1000).
Ein einer ersten Phase werden nur dort RelatedTerms erfasst, wo (englische oder deutsche) Wiki-Seiten vorhanden sind.
Wenn immer möglich, sind englische Synonyme zu erfassen. Dict.cc und Beolingus bieten solche Services an: Vgl. die Links auf http://www.openthesaurus.de/synonyme/Kirche rechts unten.
Habe die RelatedTerms nun auch offiziell auf dem OSM Wiki dokumentiert: http://wiki.openstreetmap.org/wiki/Taginfo/RelatedTerm und das Template bereitgestellt: http://wiki.openstreetmap.org/wiki/Template:RelatedTerm . Auf http://wiki.openstreetmap.org/wiki/Tag:amenity=place_of_worship sieht man eine erste echtes Beispielanwendung.
Achtung: Habe noch Probleme bei der Darstellung von Begriffen, die aus mehreren Worten bestehen: z.B. „prayer house“ wird als „house prayer house“ dargestellt. Das ist aber „nur“ ein Problem des MediaWiki-Templates.
Die Hauptinformationsquelle über vorhandene Tags in OSM ist schon http://wiki.openstreetmap.org/wiki/Special:Search und http://taginfo.openstreetmap.ch/ (weitere Tipps hier: http://www.gis.hsr.ch/wiki/POI-Service#POIs_finden_und_visualisieren ).
Wenn immer möglich, sind englische Synonyme zu erfassen. Dict.cc und Beolingus bieten solche Services an: Vgl. die Links auf http://www.openthesaurus.de/synonyme/Kirche rechts unten.
Zur möglichen Automatisierung hier das Thesaurus API (deutsch): http://www.openthesaurus.de/about/api . Ein API zu MediaWiki gibt es. Die wichtigsten Infos sind hier http://www.mediawiki.org/wiki/API:Main_page und v.a. das Bot-Howto: http://en.wikipedia.org/wiki/Wikipedia:Creating_a_bot .
- Extrahieren/Preprocessing:
- pro Wiki-Seite wird nach 'RelatedTerm' geparst und in die wiki-Tabelle der taginfo-db abgelegt.
- Ruby-Code ([1]), wo MediaWiki-Templates schon ausgelesen werden, zurzeit jedoch nur die Templates "Key" und "Tag". => Hier könnte man in der taginfo-wiki.db ein weiteres Feld "related_terms" (o.ä.) anlegen, dort die Terms Strichpunkt-separiert ablegen