Diskussion:Taginfo/RelatedTerm: Unterschied zwischen den Versionen
Stefan (Diskussion | Beiträge) |
Stefan (Diskussion | Beiträge) (→Task List RelatedTerm-Erfassung) |
||
Zeile 7: | Zeile 7: | ||
Wenn immer möglich, sind englische Synonyme zu erfassen. Dict.cc und Beolingus bieten solche Services an: Vgl. die Links auf http://www.openthesaurus.de/synonyme/Kirche rechts unten. | Wenn immer möglich, sind englische Synonyme zu erfassen. Dict.cc und Beolingus bieten solche Services an: Vgl. die Links auf http://www.openthesaurus.de/synonyme/Kirche rechts unten. | ||
− | Habe die RelatedTerms nun auch offiziell auf dem OSM Wiki dokumentiert: http://wiki.openstreetmap.org/wiki/Taginfo/RelatedTerm und das Template bereitgestellt: http://wiki.openstreetmap.org/wiki/Template:RelatedTerm . Auf http://wiki.openstreetmap.org/wiki/Tag:amenity=place_of_worship sieht man eine erste echtes Beispielanwendung. | + | Habe die RelatedTerms nun auch offiziell auf dem OSM Wiki dokumentiert: http://wiki.openstreetmap.org/wiki/Taginfo/RelatedTerm und das Template bereitgestellt: http://wiki.openstreetmap.org/wiki/Template:RelatedTerm . Auf http://wiki.openstreetmap.org/wiki/Tag:amenity=place_of_worship sieht man eine erste echtes Beispielanwendung. |
+ | |||
+ | Achtung: Habe noch Probleme bei der Darstellung von Begriffen, die aus mehreren Worten bestehen: z.B. „prayer house“ wird als „house prayer house“ dargestellt. Das ist aber „nur“ ein Problem des MediaWiki-Templates. | ||
Die Hauptinformationsquelle über vorhandene Tags in OSM ist schon http://wiki.openstreetmap.org/wiki/Special:Search und http://taginfo.openstreetmap.ch/ (weitere Tipps hier: http://www.gis.hsr.ch/wiki/POI-Service#POIs_finden_und_visualisieren ). | Die Hauptinformationsquelle über vorhandene Tags in OSM ist schon http://wiki.openstreetmap.org/wiki/Special:Search und http://taginfo.openstreetmap.ch/ (weitere Tipps hier: http://www.gis.hsr.ch/wiki/POI-Service#POIs_finden_und_visualisieren ). |
Version vom 6. September 2011, 10:17 Uhr
Task List RelatedTerm-Erfassung
Erfassen von Synonymen als RelatedTerm-Templates (v.a. englisch) von häufigsten OSM-Tags im Wiki (ca. 1000).
Ein einer ersten Phase werden nur dort RelatedTerms erfasst, wo (englische oder deutsche) Wiki-Seiten vorhanden sind.
Wenn immer möglich, sind englische Synonyme zu erfassen. Dict.cc und Beolingus bieten solche Services an: Vgl. die Links auf http://www.openthesaurus.de/synonyme/Kirche rechts unten.
Habe die RelatedTerms nun auch offiziell auf dem OSM Wiki dokumentiert: http://wiki.openstreetmap.org/wiki/Taginfo/RelatedTerm und das Template bereitgestellt: http://wiki.openstreetmap.org/wiki/Template:RelatedTerm . Auf http://wiki.openstreetmap.org/wiki/Tag:amenity=place_of_worship sieht man eine erste echtes Beispielanwendung.
Achtung: Habe noch Probleme bei der Darstellung von Begriffen, die aus mehreren Worten bestehen: z.B. „prayer house“ wird als „house prayer house“ dargestellt. Das ist aber „nur“ ein Problem des MediaWiki-Templates.
Die Hauptinformationsquelle über vorhandene Tags in OSM ist schon http://wiki.openstreetmap.org/wiki/Special:Search und http://taginfo.openstreetmap.ch/ (weitere Tipps hier: http://www.gis.hsr.ch/wiki/POI-Service#POIs_finden_und_visualisieren ).
Wenn immer möglich, sind englische Synonyme zu erfassen. Dict.cc und Beolingus bieten solche Services an: Vgl. die Links auf http://www.openthesaurus.de/synonyme/Kirche rechts unten.
Zur möglichen Automatisierung hier das Thesaurus API (deutsch): http://www.openthesaurus.de/about/api . Ein API zu MediaWiki gibt es. Die wichtigsten Infos sind hier http://www.mediawiki.org/wiki/API:Main_page und v.a. das Bot-Howto: http://en.wikipedia.org/wiki/Wikipedia:Creating_a_bot .
- Extrahieren/Preprocessing:
- pro Wiki-Seite wird nach 'RelatedTerm' geparst und in die wiki-Tabelle der taginfo-db abgelegt.
- Ruby-Code ([1]), wo MediaWiki-Templates schon ausgelesen werden, zurzeit jedoch nur die Templates "Key" und "Tag". => Hier könnte man in der taginfo-wiki.db ein weiteres Feld "related_terms" (o.ä.) anlegen, dort die Terms Strichpunkt-separiert ablegen