[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Suche Programm zur wiss. Verwaltung von Internetseiten



Hallo Herr Hoffmann,

> ich bin auf der Suche nach einem Programm, mit dem man
> wissenschaftlich und komfortabel Internetseiten verwalten kann
> (Zitatverwaltung).
> 
> Ich habe nach einem solchen Programm nun schon das halbe (naja)
> Internet abgesucht, konnte aber nichts finden, was meinen Ansprüchen
> genügt. Meiner Meinung nach müsste ein solches Programm geschrieben
> werden, wenn es so etwas noch nicht geben sollte.

Das Thema ist technisch betrachtet ein Faß ohne Boden.

> Das Programm sollte folgende Funktionen bieten: Übernahme des
> Source-Codes von HTML Seiten in eine interne Datenbank, mit
> Auswertung der Metainformation. (so in der Art von Powermarks)
> Darüber hinaus sollte das Besuchsdatum vermerkt werden, sowie die
> Möglichkeit zur ausführlichen Kommentierung und Kategorisierung
> bestehen.

Bis hier noch streßfrei, solange es wirklich nur um HTML-Seiten geht.
Was passiert, wenn der Browser mit XML/XSL konfrontiert wird? Was tun
mit PDF/PS/Fensterwort/Kraftpunkt/...? Flash? Java-Applets? Spätestens
hier fährt die intelligenteste Lösung mit maximaler Geschwindigkeit
vor die Wand.

> Bilder sollten ebenfalls automatisch mit abgespeichert
> werden können, der Code darf aber nicht verändert werden, das
> bedeutet eventuell dass zwei Versionen des Dokumentes abgespeichert
> werden müssen: also einmal mit angepassten Pfad für die Bilder und
> einmal das Originaldokument.

Schön wäre es, wenn es so einfach wäre. Bei den Serverprodukten, die
beispielsweise im Bereich großer Tageszeitungen eingesetzt werden, sind
Links zu Bildern zum Teil gar nicht mehr "vernünftig" maschinell
extrahierbar, weil die Bildverweise in einem unförmigen JavaScript-
und DHTML-Klumpatsch untergehen. Die eigentliche Netto-Information
macht bei solchen "Portalseiten" meist weniger als 15 % des eigentlichen
Datenberges aus. Es wundert mich auch als Softwerker jedes Mal wieder,
daß von solchen Seiten überhaupt noch was auf dem Bildschirm ankommt...

> Desweiteren könnte das Programm eine
> komfortable Anbindung an eine Textverarbeitung im Stile von Endnote
> haben, aber das ist nur Kür. Unverzichtbar dagegen ist in jedem Fall
> eine ordentliche Exportschnittstelle, am besten SQL fähig; noch
> besser: gleich netzwerkfähig, d.h. Frontend und SQL Server...

Falls Sie ein ansehnliches Budget dafür haben, unterbreitet der
Software-Entwickler in mir Ihnen immer gern ein Angebot. Ich habe
schon immer nach einem Projekt für eine richtige Rundumsanierung
gesucht... :-) :-)

Eine pragmatische Schmalspur-Lösung kann man ansonsten auf einer
(z. B.) Linux-Maschine mit wget, einer MySQL-Datenbank und einem
PHP-programmierenden Studenten sicher aufbauen. Auf diesem Wege
kann man mit relativ wenig Aufwand relativ weit kommen. Allerdings
kommt dann irgendwann der Knick in der Aufwand-zu-Kosten-Kurve,
und meine Befürchtung ist, daß Sie mit Ihren Anforderungen jenseits
des Kostenknicks liegen.


> Momentan speichere ich noch jeden einzelnen Quellcode ab und muss
> die Metainformationen ausserhalb in einer Datenbank pflegen, das ist
> auf Dauer lästig.

Ich archivere nur Quellenhinweis (URL), den Nutztext (ASCII) und bei
Bedarf relevante Bilder. Den HTML-Wust tue ich meiner Archivplatte
erst gar nicht an. Manchmal speichere ich zusätzlich noch eine Liste
aller im Dokument vorhandenen Links (Linktitel und URL) weg. Und
hartnäckige Dokumente, die sich mit einer Klartext-Extraktion einfach
nicht fassen lassen, werden zusätzlich zur ASCII-Textkopie einfach
in eine Postscript-Datei "gedruckt" und als PS-Datei zusätzlich
aufbewahrt. Für die Einsatzzwecke "Nachschlagewerk" und "Zitatensammlung"
kommt es zumindest mir nicht darauf an, aus dem lokalen Datenbestand
heraus eine 100 %ige Reproduktion der WWW-Seite durchführen zu können.
Allerdings bin ich auf kein Bibliothekar, sondern einfach nur ein
Mensch mit einer kleinen Datensammlung für den Eigenbedarf...

Viele Grüße,
Daniel Rödding


-- 
Daniel Roedding                                       phone: +49 5252 9838 0
daniel _at__ roedding.de                                      fax: +49 5252 9838 20


Listeninformationen unter http://www.inetbib.de.