Liebe Kolleginnen und Kollegen,
hiermit möchten wir Sie einladen an unserem kostenfreien „Smart Harvesting II Workshop:
Einführung in die Abfragesprache OXPath“ teilzunehmen. Die Veranstaltung findet am 20.03.2018
von 10:00 bis 17:30 Uhr bei GESIS Köln im Konferenzraum West II statt.
Im DFG-geförderten Projekt Smart Harvesting II werden softwarebasierte Lösungen zur Erfassung und Aufbereitung bibliographischer
Metadaten aus dem Web für Literaturdatenbanken wie dblp, entwickelt. Durch die vorherrschende Heterogenität solcher Rohdaten ist diese
Arbeit im Falle der manuellen Erfassung sehr personal- und zeitintensiv. In Fällen, in denen bereits auf technische Unterstützung
gesetzt wird, werden hierfür spezialisierte Programme, sogenannte Wrapper, eingesetzt, die von fachkundigen Softwareentwicklern erstellt
und gewartet werden müssen. Ein Teil unseres Projektes ist es daher, wartungsarme Wrapper zu entwickeln, die auch von Nicht-Informatikern,
z.B. Bibliothekaren oder Dokumentaren, einfach bedient und auf häufig neugestaltete, dynamische Webapplikationen angepasst werden
können. Hierfür setzen wir auf die quelloffene Abfragesprache OXPath - eine Erweiterung von XPath, die eine deklarative Nachahmung der
Interaktion mit einer Website erlaubt und in diesem Zuge Daten gezielt extrahieren kann. Erste Erfahrungen in einem Workshop mit Bibliothekaren
und in Übungsgruppen mit Studierenden haben gezeigt, dass bereits Grundkenntnisse in XML und XPath ausreichen, um in den Prozess der
Erstellung und Wartung von OXPath-Wrappern einzusteigen. Die gewonnenen Daten können vielseitig eingesetzt werden.
In diesem Workshop soll das DFG-geförderte Projekt Smart Harvesting II aus praktischer Sicht vorgestellt werden. Neben einem kurzen Gesamtüberblick über das Projekt wird daher zunächst explizit die Abfragesprache OXPath vorgestellt. Dieser Workshop soll dazu beitragen, die potenzielle Nutzergruppe unserer Projektergebnisse zu erweitern.
Im Rahmen dieses Workshops sollen die Teilnehmer anhand eines konkreten Beispiels an OXPath herangeführt und
in die Lage versetzt werden, eigene Ausdrücke für ihre Anwendungsfälle zu entwerfen. Die in Smart
Harvesting II entwickelten Softwarelösungen werden dabei ebenfalls vorgestellt, um zu zeigen, wie diese
zusätzliche Hilfestellungen bei der Metadatengewinnung aus dem Web bieten können.
Eine Vorabversion unseres OXPath-Tutorials finden Sie unter:
http://dblps.uni-trier.de/~michels/oxpath-tutorial/
Benutzername: tutorial
Kennwort: N2M5YWZkZGRjYjFmNmRiOTNiYjg4MzUz
Auch wenn die Teilnahme kostenfrei ist, bitten wir um eine verbindliche
Registrierung unter:
https://training.gesis.org/?site=pDetails&child=full&pID=0x06A1BF499EC14F77B9D68A9B4868240D
Mit freundlichen Grüßen
Ihr Smart Harvesting 2 Team