[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Suchmaschinensuche: PDF is hot
Liebe INETBIB-Leser,
da sich der heutige INETBIB-Tag zum großen Teil mit Suchmaschinen und
Suchmaschinensuche beschäftigt hat, würde ich Sie gerne auf eine
Seminararbeit zu diesem Thema aufmerksam machen.
Die Idee für die Seminararbeit entstand im Sommersemester 2001 im Proseminar
"Datenerhebung, Datenstrukturierung und Datenerfassung" am Institut für
Bibliothekswissenschaft der Humboldt-Universität zu Berlin. Herrn Prof. Dr.
Umstätter leitete dieses Seminar.
Die Seminararbeit wertet Google-Treferlisten mit dem Fokus (Treffer im
PDF-Format) aus. Es kommen, bezogen auf die Anzahl der "PDF-Treffer",
unerwartete Ergebnisse zu Tage.
Abstract der Seminararbeit "Das Dateiformat PDF im Web" :
"Die statistische Erhebung "PDF im Web" befaßt sich mit der quantitativen
Evaluation des
Dateiformats Portable Document Format (PDF) im World Wide Web. Das
Hauptinteresse dieser
Arbeit besteht darin, ein Verfahren zu erläutern und zu demonstrieren, mit
dem eine
zahlenmäßige Einschätzung dieses Dateiformats im Internet möglich wird.
Hauptaugenmerk der
Analyse ist die Errechnung des Anteils der PDF-Dokumente zu bestimmten
Suchanfragen
sowie die durchschnittliche Dokumentgröße der recherchierten PDF-Dateien.
Die Erhebung basiert auf Trefferlisten des Suchmaschinenbetreiber Google,
die über
strukturierte Suchanfragen generiert werden. Das vorgestellte Verfahren wird
anhand einer
Stichprobe von 50 Anfragen exemplarisch getestet.
Im Rahmen der Auswertung werden die Ergebnisse bzgl. der beiden
Publikationssprachen
Deutsch und Englisch sowie unterschiedlich komplexer Anfragen miteinander
verglichen."
Die gesamte Arbeit finden Sie unter dem Punkt Seminararbeiten.
http://www.informatik.hu-berlin.de/~mayr/arbeit.htm
MfG
Philipp Mayr
<LINKED> http://www.informatik.hu-berlin.de/~mayr </LINKED>
_________________
E-Mail Disclaimer
Der Inhalt dieser E-Mail ist ausschliesslich fuer den bezeichneten
Adressaten bestimmt. Wenn Sie nicht der vorgesehene Adressat
dieser E-Mail oder dessen Vertreter sein sollten, so beachten Sie
bitte, dass jede Form der Kenntnisnahme, Veroeffentlichung,
Vervielfaeltigung oder Weitergabe des Inhalts dieser E-Mail
unzulaessig ist. Wir bitten Sie, sich in diesem Fall mit dem Absender
der E-Mail in Verbindung zu setzen.
The information contained in this email is intended solely
for the addressee. Access to this email by anyone else is
unauthorized. If you are not the intended recipient, any form
of disclosure, reproduction, distribution or any action taken
or refrained from in reliance on it, is prohibited and may be
unlawful. Please notify the sender immediately.
Listeninformationen unter http://www.inetbib.de.