[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[InetBib] AW N: Archivierung von Webseiten zu Förderprojekten
- Date: Wed, 3 Apr 2019 12:42:30 +0200
- From: Michael Frank via InetBib <inetbib@xxxxxxxxxx>
- Subject: [InetBib] AW N: Archivierung von Webseiten zu Förderprojekten
Guten Tag miteinand,
eine Antwort eines Medieninformatikers, der Versuch zumindest.
Fall 1: Wir kopieren statische Zustände der Webseite herunter und archivieren
diese auf einem anderen Server. (Internet Wayback Machine klassisch.) Die
Navigation zwischen den Zuständen müsste händisch oder per Script nachgepflegt
werden, da sich die URLs verändern.
Webseiten sollten konsequent in HTML5 und CSS, ggf. nur für die Navigation mit
einzelnen JavaScript-Funktionen programmiert sein.
Hintergrund ist, dass allein die Verwendung sogenannter Web Components (also
Funktionsteile in der Optik, die in HTML5 nicht definiert sind) bereits
abhängig von der Mitlieferung der Bibliothek an Web Components oder sogar von
Teilen eines Frameworks (und das in Abhängigkeit von der Versionsnummer in
gewisser kleiner Variation) sein kann, was die Lauffähigkeit der
"abgegriffenen" Webseite angeht. (Im Sinne der Internet Wayback Machine.)
Es ist zu vermeiden, Single Page Applications oder gar Progressive Web Apps
(PWAs) als Programmierform zu wählen, da diese auf dem Client ihre
HTML-Darstellung im Zuge des Benutzungszustands verändern können. Dann weiß man
nicht, welchen Zustand man gerade statisch herunterkopiert hat.
Videos, Audios und manchmal auch Bilder werden meist ob des Urheberrechts oder
ob der schnellen Veränderung von Datenformaten, die Webbrowser akzeptieren,
nicht mit gespeichert. Wichtige Aussagen müssen deshalb im Text stecken.
Das Angebot muss „self-contained“ sein, also nicht über mehrere URLs per
Verlinkungen erst einen Sinn ergeben.
Fall 2: Das bestehende Webangebot konservieren, in die Ewigkeit aufbewahren.
Dazu müsste man es am besten in einer Virtual Machine mit Webserver und
Internetangebot installieren und davon Images aufbewahren. Diese Images könnte
man dann auch als Virtual Machine unverändert auf anderen, späteren
Betriebssystemen und Rechnerarchitekturen wieder aufspielen. Auch die Hardware
darf veralten oder „aussteigen“. Kein Problem bis auf nachlassenden Virenschutz
mangels verfügbarer Updates und Upgrades ab einem gewissen Verfallsdatum der
bei der Erstellung genutzten Technologien.
In diesem Fall wäre alles erlaubt, was technologisch einsetzbar ist. Die
Unsicherheit liegt nur in der Außerkraftsetzung gewissen JavaScript-Funktionen
und in sich ändernden Video- und Audio-Formaten in der Zukunft in Webbrowsern.
Ansonsten gilt: Das Web ist ein kurzlebiges Medium. Im Ernstfall hilft nur ein
guter PDF-Erzeuger, der die Webseite jeweils statisch als PDF konservieren
kann, wie sie aussah.
Es wird durchaus auch andere Erfahrungen geben – Tipps und Tricks würde ich
gern erfahren.
Mit freundlichen Grüßen
Michael Frank.
HTWK Leipzig, Fak. Informatik und Medien.
--------------------------------------------------------------------------
-----Ursprüngliche Nachricht-----
Von: InetBib [mailto:inetbib-bounces@xxxxxxxxxx] Im Auftrag von Bargheer, Margo
via InetBib
Gesendet: Mittwoch, 3. April 2019 09:27
An: Patrick Sahle; inetbib@xxxxxxxxxx
Betreff: Re: [InetBib] Antw: Re: Archivierung von Webseiten zu Förderprojekten
Liebe Liste,
da auch andere FIDs und Institutionen Langzeitverantwortung für digitale
Portale tragen (mit den von Patrick skizzierten Herausforderungen) oder
demnächst übernehmen sollten/müssten, wäre es interessant zu erfahren, ob es
übergreifende Ansätze für die skalierbare Konservierungsstrategie gibt und in
welcher Governance Struktur die stattfinden (sollten).
Gibt es bestimmt, aber da wir in unserem Team „Elektronisches Publizieren“ eher
an der Erstellung solcher Portale beteiligt sind, würden wir gern
sicherstellen, dass wir die Autoren/Redakteure/Projekte schon zu Beginn in die
Richtung leiten, in der mittel- und langfristig die — zu definierende —
Funktionalität und Erreichbarkeit der Portale gewährleistet ist.
Als Anregung: das Thema der 2019 Open Access Tage in Hannover lautet
„Nachhaltigkeit“. Bis 15.04.2019<x-apple-data-detectors://0> können noch
Vorschläge für Workshops und Vorträge eingereicht werden. Falls jemand aus
diesem Themenkreis dort vortragen wird, ich werde garantiert in Ihrer
Veranstaltung sitzen!
Viele Grüße
Margo Bargheer
https://open-access.net/community/open-access-tage/open-access-tage-2019/call-for-proposals-open-access-tage-2019/
sent from an UGOE-iPhone
Electronic Publishing
University Library Göttingen
Margo Bargheer
mbarghe@xxxxxxx<mailto:mbarghe@xxxxxxx>
+49 1515 288 1644
https://orcid.org/0000-0001-8246-8210
Am 28.03.2019 um 10:05 schrieb Patrick Sahle via InetBib
<inetbib@xxxxxxxxxx<mailto:inetbib@xxxxxxxxxx>>:
Liebe Liste,
ok, ich sehe, wir brauchen ein Mindestmaß an Differenzierung und
Begriffsklärung. Wir reden hier wohl von zwei grundlegend unterschiedlichen
Ansätzen.
1) Archivierung im engeren Sinne: harvest/download/freeze - daran schließt sich
die Frage der funktionalen Reduktion an
2) Archvierung im weiteren Sinne: Pflege und Vorhaltung von Webanwendungen -
daran schließt sich (verkürzt) die Frage nach Aufwand und Kosten an
Diesen Unterschied sollte man nicht vergessen. (1) betrifft ja nur temporäre
Snapshots "statischer" Inhalte unter Verlust aller dynamischen Funktionen und
umfasst nicht die Sicherung und dauerhafte Bereitstellung von Webseiten in
ihrem originalen "setting". Liebe Frau Herr, bitte korrigieren Sie mich, wenn
ich die genannten Dienste hier missverstehe.
Viele Grüße, Patrick Sahle
Am 27.03.2019 um 12:15 schrieb Wiebke Herr via InetBib:
Liebe Kolleginnen und Kollegen,
speziell für fachlich relevante Webinhalte bieten die Fachinformationsdienste
der Bayerischen Staatsbibliothek (Altertumswissenschaften,
Geschichtswissenschaft, Musikwissenschaft, Ost-, Ostmittel- und Südosteuropa)
eine Archivierung von Webseiten über ihren Wunschbuchservice an.
Entsprechende Wünsche können gemeldet werden unter:
https://www.bsb-muenchen.de/sammlungen/altertum/fachinformationsdienst/wunschbuch
https://beta.historicum.net/services/wunschbuch
https://www.bsb-muenchen.de/sammlungen/musik/fachinformationsdienst/wunschbuch
https://www.osmikon.de/services/wunschbuch
Sofern die Rechteinhaber zustimmen und technische Standards erfüllt sind,
erfolgt sodann die Archivierung der Website. Diese kann einmalig sein oder in
festzulegenden Abständen stattfinden.
Viele Grüße
Wiebke Herr
---
Dr. Wiebke Herr
Bayerische Staatsbibliothek
Abteilung Bestandsentwicklung und Erschließung 2
Zentrum für Elektronisches Publizieren / Fachinformation Geschichte
Stellvertretende Referatsleiterin
Ludwigstraße 16, 80539 München
Tel:+49-89-28 638-2846
E-Mail: Wiebke.Herr@xxxxxxxxxxxxxxx<mailto:Wiebke.Herr@xxxxxxxxxxxxxxx>
"Hartwig, Falk via InetBib" <inetbib@xxxxxxxxxx<mailto:inetbib@xxxxxxxxxx>>
26.03.2019 09:21 >>>
Lieber Herr Meier,
die BSB hat ein Programm zur Archivierung von Webseiten.
https://www.babs-muenchen.de/index.html?c=workflows_web&l=de
Beste Grüße,
Falk Hartwig
Bibliotheksleitung | Head of Library
Hochschule für Musik Nürnberg | Nuremberg University of Music
Veilhofstr. 34 | 90489 Nürnberg
Tel. +49(0) 911 - 21522 180
www.hfm-nuernberg.de<http://www.hfm-nuernberg.de> |
facebook.de/hfm-nuernberg<http://facebook.de/hfm-nuernberg>
-----Ursprüngliche Nachricht-----
Von: via InetBib [mailto:inetbib@xxxxxxxxxx]
Gesendet: Montag, 25. März 2019 18:28
An: inetbib@xxxxxxxxxx<mailto:inetbib@xxxxxxxxxx>
Betreff: [InetBib] Archivierung von Webseiten zu Förderprojekten
Liebe Kolleginnen und Kollegen,
seit einigen Jahren machen einige Forschungsförderer den Förderempfängern
zur Bedingung, dass das Forschungsprojekt eine eigene Website betreibt.
Diese Website belegt eine kostenpflichtige Domain, die auch nach
Projektende Kosten verursacht.
Ist das Projekt beendet, wird die Projektsite für einige Jahre weiter
betrieben. Das kostet Ressourcen, die der Betreiber nicht mehr aus
Projektmitteln bestreiten kann.
Deshalb wächst mit den Jahren die Bereitschaft, solche Projekt-Websites
abzuschalten.
Beispiel einer Projekt-Website: https://planarcal.ptb.de/
Meine Frage an Sie:
Kennen Sie Initiativen, die solche Projekt-Webseiten (Projektteilnehmer
kommen aus verschiedenen Ländern) zuverlässig archivieren
und über ihr Archiv zugänglich halten?
Ich kann mir gut vorstellen, dass die Kollegen aus der MPG und der
Helmholtz-Gemeinschaft einen Workflow haben,
die Seiten zu archivieren, die zu eigenen Projektbeteiligungen gehören.
Mir ist nicht klar, ob die DNB eine Aufgabe in der Archivierung von
solchen Projektseiten sieht.
Ich hoffe, einige von Ihnen können über die Liste Hinweise und Erfahrungen
weitergeben.
Besten Gruß
Joachim Meier
____________________________________________________
Dr.-Ing. Joachim E. Meier
Referatsleiter Q.11, Wissenschaftliche Bibliotheken
Physikalisch-Technische Bundesanstalt (PTB) (http://www.ptb.de)
PF 3345 Tel. +49-531-592-8110
38023 Braunschweig Fax. +49-531-592-8137
GERMANY E-mail:
Joachim.Meier@xxxxxx<mailto:Joachim.Meier@xxxxxx>
____________________________________________________
--
Apl. Prof. Dr. Patrick Sahle
Universität zu Köln <http://www.uni-koeln.de> - Cologne Center for eHumanities
(CCeH) <http://www.cceh.uni-koeln.de/>
Koordinierungsstelle Digital Humanities der Nordrhein-Westfälischen Akademie
der Wissenschaften <http://cceh.uni-koeln.de/DH-AWK/>
Data Center for the Humanities <http://www.dch.uni-koeln.de/>
Institut für Dokumentologie und Editorik <http://www.i-d-e.de>
Büro: Meister Ekkehart Straße 11, 50923 Köln, Raum 2.07, Tel.: 0221-470-3894
@patrick_sahle <https://twitter.com/patrick_sahle> - @CCeHum
<https://twitter.com/CCeHum> - @ideinfo <https://twitter.com/ideinfo>
Listeninformationen unter http://www.inetbib.de.