Diskussion:Taginfo/RelatedTerm: Unterschied zwischen den Versionen

Aus Geoinformation HSR
Wechseln zu: Navigation, Suche
(Teilprojekt Taginfo API 'relatedterms')
(Teilprojekt Taginfo API 'relatedterms')
Zeile 37: Zeile 37:
  
 
Extrahieren/Preprocessing:
 
Extrahieren/Preprocessing:
* pro Wiki-Seite wird nach 'RelatedTerm' geparst und in die wiki-Tabelle der taginfo-db abgelegt.
+
* pro Wiki-Seite wird nach 'RelatedTerm' geparst und in die wiki-Tabelle, Kolonne 'relatedterms' kommasepariert, der taginfo-db abgelegt.
 
* Ruby-Code ([https://github.com/joto/taginfo/blob/master/sources/wiki/get_wiki_data.rb ]), wo MediaWiki-Templates schon ausgelesen werden, zurzeit jedoch nur die Templates "Key" und "Tag". => Hier könnte man in der taginfo-wiki.db ein weiteres Feld "related_terms" (o.ä.) anlegen, dort die Terms Strichpunkt-separiert ablegen
 
* Ruby-Code ([https://github.com/joto/taginfo/blob/master/sources/wiki/get_wiki_data.rb ]), wo MediaWiki-Templates schon ausgelesen werden, zurzeit jedoch nur die Templates "Key" und "Tag". => Hier könnte man in der taginfo-wiki.db ein weiteres Feld "related_terms" (o.ä.) anlegen, dort die Terms Strichpunkt-separiert ablegen
 
* API ([https://github.com/joto/taginfo/blob/master/web/lib/api/wiki.rb]): Weiter soll eine API angeboten werden, um nach den related Terms zu suchen. Dabei soll das existierende Ruby-Script (wiki.rb) erweitert werden. Die Paramter sollen die gleichen Namen erhalten wie bei der bestehenden API bspw. für den Suchstring soll 'q' als Paramter verwendet werden.
 
* API ([https://github.com/joto/taginfo/blob/master/web/lib/api/wiki.rb]): Weiter soll eine API angeboten werden, um nach den related Terms zu suchen. Dabei soll das existierende Ruby-Script (wiki.rb) erweitert werden. Die Paramter sollen die gleichen Namen erhalten wie bei der bestehenden API bspw. für den Suchstring soll 'q' als Paramter verwendet werden.

Version vom 21. September 2011, 14:08 Uhr

Projekt RelatedTerms in OSM 2011

Idee/Koordination: Stefan

Teilprojekt RelatedTerm-Ersterfassung

Projekt-Teilnehmer/innen:

  • Daniela
  • Marc

Das Ziel dieses Teilprojekts ist das Erfassen von Synonymen, bzw. alltemein verwandte Begriffe als RelatedTerm-Templates (v.a. englisch) von häufigsten OSM-Tags im Wiki (ca. 1000).

Etappierung:

  1. In einer ersten Phase werden nur dort RelatedTerms erfasst, wo (englische oder deutsche) Wiki-Seiten vorhanden sind.
  2. In einer späteren Phase wird aufgrund z.B. eine Liste das OSM Wiki gezielt mit neuen Wiki-Seiten ergänzt, die das dokumentieren, was schon in den Daten ist und verwandte Begriffe (Related Terms) dazu erfasst.

Stand:

Infos/Regelungen:

Quellen:

Teilprojekt Taginfo API 'relatedterms'

Projekt-Teilnehmer/innen:

  • Michel
  • Mirko

Extrahieren/Preprocessing:

  • pro Wiki-Seite wird nach 'RelatedTerm' geparst und in die wiki-Tabelle, Kolonne 'relatedterms' kommasepariert, der taginfo-db abgelegt.
  • Ruby-Code ([1]), wo MediaWiki-Templates schon ausgelesen werden, zurzeit jedoch nur die Templates "Key" und "Tag". => Hier könnte man in der taginfo-wiki.db ein weiteres Feld "related_terms" (o.ä.) anlegen, dort die Terms Strichpunkt-separiert ablegen
  • API ([2]): Weiter soll eine API angeboten werden, um nach den related Terms zu suchen. Dabei soll das existierende Ruby-Script (wiki.rb) erweitert werden. Die Paramter sollen die gleichen Namen erhalten wie bei der bestehenden API bspw. für den Suchstring soll 'q' als Paramter verwendet werden.
  • Suche mit Synonyme-Lookup erweitern.

Stand: offen.

Task List:

  1. Preprocessing
    1. Erweitern der DB-Tabelle "wikipages" um ein Attribut "related_terms"
    2. Ergänzen des "INSERT"-Statements im get_wiki_data.rb Script (Methode: def insert(db))
    3. evtl. Anpassung von weiteren Methoden.
  2. API 1
    1. Anbieten einer neuen API-Methode (bspw. 'wiki/kvrp' oder ähnliches)
      • Input: q -> String (required), lang -> ISO (optional), rp -> integer(optional), page -> Integer (optional), sortorder -> {asc, desc} (optional), sortname -> String (optional)
      q = Query String
      rp = Results per Page
      sortname = one of the result attribute
      • Output: (tags_linked attribute muss zusätzlich berücksichtigt werden)
 {"total":INT, 
  "rp":INT, 
  "page":INT, 
   "data":[{
     {"key":"historic","value":"castle"},
     {"key":"amenity","value":"building"},
     ...
   }] 
 }
  1. API 2
    1. (bspw. 'wiki/relatedterms')
      • Input: q -> String (required), lang -> ISO (optional), rp -> integer(optional), page -> Integer (optional), sortorder -> {asc, desc} (optional), sortname -> String (optional)
      • Output:
 {"total":INT, 
  "rp":INT, 
  "page":INT, 
   "data":[{
     {"term":"castle","lang":"EN"},
     {"term":"Schloss","lang":"DE"},
     ...
   }] 
 }