Diskussion:Taginfo/RelatedTerm: Unterschied zwischen den Versionen
Aus Geoinformation HSR
Stefan (Diskussion | Beiträge) |
Iocast (Diskussion | Beiträge) (→Teilprojekt Taginfo API 'relatedterms') |
||
Zeile 39: | Zeile 39: | ||
* pro Wiki-Seite wird nach 'RelatedTerm' geparst und in die wiki-Tabelle der taginfo-db abgelegt. | * pro Wiki-Seite wird nach 'RelatedTerm' geparst und in die wiki-Tabelle der taginfo-db abgelegt. | ||
* Ruby-Code ([https://github.com/joto/taginfo/blob/master/sources/wiki/get_wiki_data.rb ]), wo MediaWiki-Templates schon ausgelesen werden, zurzeit jedoch nur die Templates "Key" und "Tag". => Hier könnte man in der taginfo-wiki.db ein weiteres Feld "related_terms" (o.ä.) anlegen, dort die Terms Strichpunkt-separiert ablegen | * Ruby-Code ([https://github.com/joto/taginfo/blob/master/sources/wiki/get_wiki_data.rb ]), wo MediaWiki-Templates schon ausgelesen werden, zurzeit jedoch nur die Templates "Key" und "Tag". => Hier könnte man in der taginfo-wiki.db ein weiteres Feld "related_terms" (o.ä.) anlegen, dort die Terms Strichpunkt-separiert ablegen | ||
+ | * API ([https://github.com/joto/taginfo/blob/master/web/lib/api/wiki.rb]): Weiter soll eine API angeboten werden, um nach den related Terms zu suchen. Dabei soll das existierende Ruby-Script (wiki.rb) erweitert werden. Die Paramter sollen die gleichen Namen erhalten wie bei der bestehenden API bspw. für den Suchstring soll 'q' als Paramter verwendet werden. | ||
Stand: offen. | Stand: offen. | ||
Task List: | Task List: | ||
− | + | # Preprocessing | |
+ | ## Erweitern der DB-Tabelle "wikipages" um ein Attribut "related_terms" | ||
+ | ## Ergänzen des "INSERT"-Statements im get_wiki_data.rb Script (Methode: def insert(db)) | ||
+ | ## evtl. Anpassung von weiteren Methoden. | ||
+ | # API | ||
+ | ## Anbieten einer neuen API-Methode (bspw. 'wiki/relatedterms' oder ähnliches) | ||
+ | ##: Input: q -> Query string (required), key -> key (optional), value -> value (optional) | ||
+ | ##: Output: |
Version vom 20. September 2011, 14:00 Uhr
Projekt RelatedTerms in OSM 2011
Idee/Koordination: Stefan
Teilprojekt RelatedTerm-Ersterfassung
Projekt-Teilnehmer/innen:
- Daniela
- Marc
Das Ziel dieses Teilprojekts ist das Erfassen von Synonymen, bzw. alltemein verwandte Begriffe als RelatedTerm-Templates (v.a. englisch) von häufigsten OSM-Tags im Wiki (ca. 1000).
Etappierung:
- In einer ersten Phase werden nur dort RelatedTerms erfasst, wo (englische oder deutsche) Wiki-Seiten vorhanden sind.
- In einer späteren Phase wird aufgrund z.B. eine Liste das OSM Wiki gezielt mit neuen Wiki-Seiten ergänzt, die das dokumentieren, was schon in den Daten ist und verwandte Begriffe (Related Terms) dazu erfasst.
Stand:
- Fortschrittsanzeige: http://wiki.openstreetmap.org/wiki/Special:WhatLinksHere/Template:RelatedTerm
Infos/Regelungen:
- Wenn immer möglich, sind englische Synonyme zu erfassen.
- Die offizielle Dokumentation der RelatedTerms ist auf dem OSM Wiki dokumentiert: http://wiki.openstreetmap.org/wiki/Taginfo/RelatedTerm
- Hier das zugehörige Template: http://wiki.openstreetmap.org/wiki/Template:RelatedTerm .
- Auf http://wiki.openstreetmap.org/wiki/Tag:amenity=place_of_worship sieht man eine erste 'echte' Anwendung.
Quellen:
- Die Hauptinformationsquelle über vorhandene Tags in OSM ist schon http://wiki.openstreetmap.org/wiki/Special:Search und http://taginfo.openstreetmap.ch/ (weitere Tipps hier: http://www.gis.hsr.ch/wiki/POI-Service#POIs_finden_und_visualisieren ).
- Wenn immer möglich, sind englische Synonyme zu erfassen. Dict.cc und Beolingus bieten solche Services an: Vgl. die Links auf http://www.openthesaurus.de/synonyme/Kirche rechts unten.
- Zur möglichen Automatisierung hier das Thesaurus API (deutsch): http://www.openthesaurus.de/about/api . Ein API zu MediaWiki gibt es. Die wichtigsten Infos sind hier http://www.mediawiki.org/wiki/API:Main_page und v.a. das Bot-Howto: http://en.wikipedia.org/wiki/Wikipedia:Creating_a_bot .
Projekt-Teilnehmer/innen:
- Michel
- Mirko
Extrahieren/Preprocessing:
- pro Wiki-Seite wird nach 'RelatedTerm' geparst und in die wiki-Tabelle der taginfo-db abgelegt.
- Ruby-Code ([1]), wo MediaWiki-Templates schon ausgelesen werden, zurzeit jedoch nur die Templates "Key" und "Tag". => Hier könnte man in der taginfo-wiki.db ein weiteres Feld "related_terms" (o.ä.) anlegen, dort die Terms Strichpunkt-separiert ablegen
- API ([2]): Weiter soll eine API angeboten werden, um nach den related Terms zu suchen. Dabei soll das existierende Ruby-Script (wiki.rb) erweitert werden. Die Paramter sollen die gleichen Namen erhalten wie bei der bestehenden API bspw. für den Suchstring soll 'q' als Paramter verwendet werden.
Stand: offen.
Task List:
- Preprocessing
- Erweitern der DB-Tabelle "wikipages" um ein Attribut "related_terms"
- Ergänzen des "INSERT"-Statements im get_wiki_data.rb Script (Methode: def insert(db))
- evtl. Anpassung von weiteren Methoden.
- API
- Anbieten einer neuen API-Methode (bspw. 'wiki/relatedterms' oder ähnliches)
- Input: q -> Query string (required), key -> key (optional), value -> value (optional)
- Output:
- Anbieten einer neuen API-Methode (bspw. 'wiki/relatedterms' oder ähnliches)