[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[InetBib] Einladung zu Smart Harvesting II Workshop: Einführung in die Abfragesprache OXPath



Liebe Kolleginnen und Kollegen,

hiermit möchten wir Sie einladen an unserem kostenfreien „Smart Harvesting II 
Workshop: Einführung in die Abfragesprache OXPath“ teilzunehmen. Die 
Veranstaltung findet am 20.03.2018 von 10:00 bis 17:30 Uhr bei GESIS Köln im 
Konferenzraum West II statt.

Im DFG-geförderten Projekt Smart Harvesting II werden softwarebasierte Lösungen 
zur Erfassung und Aufbereitung bibliographischer Metadaten aus dem Web für 
Literaturdatenbanken wie dblp, entwickelt. Durch die vorherrschende 
Heterogenität solcher Rohdaten ist diese Arbeit im Falle der manuellen 
Erfassung sehr personal- und zeitintensiv. In Fällen, in denen bereits auf 
technische Unterstützung gesetzt wird, werden hierfür spezialisierte Programme, 
sogenannte Wrapper, eingesetzt, die von fachkundigen Softwareentwicklern 
erstellt und gewartet werden müssen. Ein Teil unseres Projektes ist es daher, 
wartungsarme Wrapper zu entwickeln, die auch von Nicht-Informatikern, z.B. 
Bibliothekaren oder Dokumentaren, einfach bedient und auf häufig neugestaltete, 
dynamische Webapplikationen angepasst werden können. Hierfür setzen wir auf die 
quelloffene Abfragesprache OXPath - eine Erweiterung von XPath, die eine 
deklarative Nachahmung der Interaktion mit einer Website erlaubt und in diesem 
Zuge Daten gezielt extrahieren kann. Erste Erfahrungen in einem Workshop mit 
Bibliothekaren und in Übungsgruppen mit Studierenden haben gezeigt, dass 
bereits Grundkenntnisse in XML und XPath ausreichen, um in den Prozess der 
Erstellung und Wartung von OXPath-Wrappern einzusteigen. Die gewonnenen Daten 
können vielseitig eingesetzt werden.
          
In diesem Workshop soll das DFG-geförderte Projekt Smart Harvesting II aus 
praktischer Sicht vorgestellt werden. Neben einem kurzen Gesamtüberblick über 
das Projekt wird daher zunächst explizit die Abfragesprache OXPath vorgestellt. 
Dieser Workshop soll dazu beitragen, die potenzielle Nutzergruppe unserer 
Projektergebnisse zu erweitern.

Im Rahmen dieses Workshops sollen die Teilnehmer anhand eines konkreten 
Beispiels an OXPath herangeführt und in die Lage versetzt werden, eigene 
Ausdrücke für ihre Anwendungsfälle zu entwerfen. Die in Smart Harvesting II 
entwickelten Softwarelösungen werden dabei ebenfalls vorgestellt, um zu zeigen, 
wie diese zusätzliche Hilfestellungen bei der Metadatengewinnung aus dem Web 
bieten können.

Eine Vorabversion unseres OXPath-Tutorials finden Sie unter:

http://dblps.uni-trier.de/~michels/oxpath-tutorial/

Benutzername: tutorial
Kennwort: N2M5YWZkZGRjYjFmNmRiOTNiYjg4MzUz

Auch wenn die Teilnahme kostenfrei ist, bitten wir um eine verbindliche 
Registrierung unter:

https://training.gesis.org/?site=pDetails&child=full&pID=0x06A1BF499EC14F77B9D68A9B4868240D

Mit freundlichen Grüßen

Ihr Smart Harvesting 2 Team

-- 
Prof. Dr. Philipp Schaer
Institute of Information Science
Managing Director of the Institute of Information Management
Technische Hochschule Köln (University of Applied Sciences)
Gustav-Heinemann-Ufer 54, 50968 Köln, Germany

Visit me at Campus Südstadt, Claudiusstr. 1, Room B5.420  
Tel: + 49 221 / 8275-3845

https://ir.web.th-koeln.de

Listeninformationen unter http://www.inetbib.de.