Diskussion:Taginfo/RelatedTerm: Unterschied zwischen den Versionen

Aus Geoinformation HSR
Wechseln zu: Navigation, Suche
(Teilprojekt Taginfo API 'relatedterms')
(Der Seiteninhalt wurde durch einen anderen Text ersetzt: „Siehe Diskussion:RelatedTerms“)
 
(2 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt)
Zeile 1: Zeile 1:
'''Projekt RelatedTerms in OSM 2011'''
+
Siehe [[Diskussion:RelatedTerms]]
 
 
Idee/Koordination: [[Benutzer:Stefan|Stefan]]
 
 
 
== Teilprojekt RelatedTerm-Ersterfassung ==
 
 
 
Projekt-Teilnehmer/innen:
 
* Daniela
 
* Marc
 
 
 
Das Ziel dieses Teilprojekts ist das Erfassen von Synonymen, bzw. alltemein verwandte Begriffe als RelatedTerm-Templates (v.a. englisch) von häufigsten OSM-Tags im Wiki (ca. 1000).
 
 
 
Etappierung:
 
# In einer ersten Phase werden nur dort RelatedTerms erfasst, wo (englische oder deutsche) Wiki-Seiten vorhanden sind.
 
# In einer späteren Phase wird aufgrund z.B. eine Liste das OSM Wiki gezielt mit neuen Wiki-Seiten ergänzt, die das dokumentieren, was schon in den Daten ist und verwandte Begriffe (Related Terms) dazu erfasst.
 
 
 
Stand:
 
* Fortschrittsanzeige: http://wiki.openstreetmap.org/wiki/Special:WhatLinksHere/Template:RelatedTerm
 
 
 
Infos/Regelungen:
 
* Wenn immer möglich, sind englische Synonyme zu erfassen.
 
* Die offizielle Dokumentation der RelatedTerms ist auf dem OSM Wiki dokumentiert: http://wiki.openstreetmap.org/wiki/Taginfo/RelatedTerm
 
* Hier das zugehörige Template: http://wiki.openstreetmap.org/wiki/Template:RelatedTerm .
 
* Auf http://wiki.openstreetmap.org/wiki/Tag:amenity=place_of_worship sieht man eine erste 'echte' Anwendung.
 
 
 
Quellen:
 
* Die Hauptinformationsquelle über vorhandene Tags in OSM ist schon http://wiki.openstreetmap.org/wiki/Special:Search und http://taginfo.openstreetmap.ch/ (weitere Tipps hier: http://www.gis.hsr.ch/wiki/POI-Service#POIs_finden_und_visualisieren ).
 
* Wenn immer möglich, sind englische Synonyme zu erfassen. Dict.cc und Beolingus bieten solche Services an: Vgl. die Links auf http://www.openthesaurus.de/synonyme/Kirche rechts unten.
 
 
 
* Zur möglichen Automatisierung hier das Thesaurus API (deutsch): http://www.openthesaurus.de/about/api . Ein API zu MediaWiki gibt es. Die wichtigsten Infos sind hier http://www.mediawiki.org/wiki/API:Main_page und v.a. das Bot-Howto: http://en.wikipedia.org/wiki/Wikipedia:Creating_a_bot .
 
 
 
== Teilprojekt Taginfo API 'relatedterms' ==
 
 
 
Projekt-Teilnehmer/innen:
 
* Michel
 
* Mirko
 
 
 
Extrahieren/Preprocessing:
 
* pro Wiki-Seite wird nach 'RelatedTerm' geparst und in die wiki-Tabelle der taginfo-db abgelegt.
 
* Ruby-Code ([https://github.com/joto/taginfo/blob/master/sources/wiki/get_wiki_data.rb ]), wo MediaWiki-Templates schon ausgelesen werden, zurzeit jedoch nur die Templates "Key" und "Tag". => Hier könnte man in der taginfo-wiki.db ein weiteres Feld "related_terms" (o.ä.) anlegen, dort die Terms Strichpunkt-separiert ablegen
 
* API ([https://github.com/joto/taginfo/blob/master/web/lib/api/wiki.rb]): Weiter soll eine API angeboten werden, um nach den related Terms zu suchen. Dabei soll das existierende Ruby-Script (wiki.rb) erweitert werden. Die Paramter sollen die gleichen Namen erhalten wie bei der bestehenden API bspw. für den Suchstring soll 'q' als Paramter verwendet werden.
 
* Suche mit Synonyme-Lookup erweitern.
 
 
 
Stand: offen.
 
 
 
Task List:
 
# Preprocessing
 
## Erweitern der DB-Tabelle "wikipages" um ein Attribut "related_terms"
 
## Ergänzen des "INSERT"-Statements im get_wiki_data.rb Script (Methode: def insert(db))
 
## evtl. Anpassung von weiteren Methoden.
 
# API 1
 
## Anbieten einer neuen API-Methode (bspw. 'wiki/kvrp' oder ähnliches)
 
##* <strong>Input:</strong> q -> String (required), lang -> ISO (optional), rp -> integer(optional), page -> Integer (optional), sortorder -> {asc, desc} (optional), sortname -> String (optional)
 
##: q = Query String
 
##: rp = Results per Page
 
##: sortname = one of the result attribute
 
##* <strong>Output:</strong> (tags_linked attribute muss zusätzlich berücksichtigt werden)
 
  {"total":INT,
 
  "rp":INT,
 
  "page":INT,
 
    "data":[{
 
      {"key":"historic","value":"castle"},
 
      {"key":"amenity","value":"building"},
 
      ...
 
    }]  
 
  }
 
# API 2
 
## (bspw. 'wiki/relatedterms')
 
##* <strong>Input:</strong> q -> String (required), lang -> ISO (optional), rp -> integer(optional), page -> Integer (optional), sortorder -> {asc, desc} (optional), sortname -> String (optional)
 
##* <strong>Output:</strong>
 
  {"total":INT,
 
  "rp":INT,
 
  "page":INT,
 
    "data":[{
 
      {"term":"castle","lang":"EN"},
 
      {"term":"Schloss","lang":"DE"},
 
      ...
 
    }]  
 
  }
 

Aktuelle Version vom 27. September 2011, 23:22 Uhr

Siehe Diskussion:RelatedTerms