[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[InetBib] Google Books übernimmt fehlerhafte Datensätze aus Bibliothekskatalogen und verschlimmbessert richtige
- Date: Mon, 20 Aug 2012 16:00:15 +0000
- From: <bernd.rohde@xxxxxxxxxxx>
- Subject: [InetBib] Google Books übernimmt fehlerhafte Datensätze aus Bibliothekskatalogen und verschlimmbessert richtige
Liebe Kollegen/innen,
nachdem der Kollege Harald Müller heute schon auf die kommerziellen Aspekte von
Google Books hingewiesen hat, hier noch etwas bezüglich der Datenqualität,
dessen, was sich an bibliographischen Daten bei Google Books findet.
Fall 1:
Im Alten Alphabetischen Katalog der ZB Bern findet sich folgende Titelaufnahme
(Image):
http://digibiblio.unibe.ch/Chopin/Engine/DirektSprung/DirectView.asp?KatalogID=1&RecordNum=0&ImgNum=275657
Die Firma, die den Auftrag hatte, diesen zugegebenermassen sehr eigenwilligen
Katalog zu rekatalogisieren, hat, quasi im Sinne das Beste daraus zu machen,
folgenden Satz erstellt:
LDR -----nam--22-----2u-4500
008 080530nuuuu----xx------------00----ger--
019 |a MedeaB400: 00275657 |5 rekat-ubbe
040 |a SzZuIDS BS/BE B400
100 |a Fluri, Adolf |d 1865-1930
245 |a <<Ein>> sonderbarer Schulmeister u. A. |c Adolf Fluri
260 |a [S.l.] |c [s.a.]
300 |a 1 Bd.
500 |a Sonderdruck
852 |b B400 |c 400O3 |h ZB H var 3515 |p BM1610311 |4 Bern UB ZB |5 Magazin
(O3)
SYS 004511096
Das ist nicht schlecht, für das, was der Firma als Quelle vorlag, aber leider
haben da eben frühere Berufskollegen/innen im Haus bei der Erstellung der Karte
sagen wir mal 'sehr spartanisch' katalogisiert. Tatsächlich handelt es sich um
ein Separata aus den Blättern für bernische Geschichte, Kunst und Heimatkunde,
mit drei Beiträgen des Autors, von denen der erste auf der Karte konkret
genannt ist und auf die anderen beiden mit "u.A." 'hingewiesen' wird - nur
durch Autopsie befriedigend herauszufinden. Insofern ist der Eintrag im
Zettelkatalog völlig unzureichend und der daraus entstandene Satz im IDS
Basel/Bern ist es leider auch - wobei letzterer ja von mir jetzt bearbeitet
werden kann und er danach doch deutlich anders aussehen wird. ;-)
Was findet man bei Google Books: http://books.google.ch/books?id=5LfoSAAACAAJ
Google Books krallt sich einfach ohne weitere Kontrolle Datensätze aus unseren
Katalogen. Darunter befindet sich dann eben auch einiges, was eigentlich erst
einer Nachbearbeitung bedarf (siehe auch das Katalogisierungsniveau 2 im
Leader, das einen Hinweis darauf geben könnte...), das aber womöglich dann
nicht bei Google Books nachgeführt wird(?).
Fall 2:
Den muss ich quasi persönlich nehmen. ;-)
LDR -----nam--22-----4u-4500
008 040303r20042001sz-------m----00----ger--
040 |a SzZuIDS BS/BE B400
072 |a gg
100 |a Rohde, Bernd Martin
245 |a Landkartendrucke vor 1850 |b die Altkartendatenbank und die Einbeziehung
ausgewählter baden-württembergischer Bibliotheken |c von Bernd Martin Rohde
250 |a Unveränd. Neudr.
260 |a [Bern] |b [s.n.] |c 2004
300 |a 92 Bl. |b Ill.
534 |c Stuttgart : [s.n.], 2001
502 |a Diplomarbeit, FH Stuttgart - Hochschule für Bibliotheks- und
Informationswesen, 2001
906 |a Hochschulschrift = Thèse/Mémoire
852 |b B400 |c 400M2 |h ZB RAB 5869 |p BM0668657 |4 Bern UB ZB |5 Magazin (U2)
SYS 003172773
(Anm.: Es handelt sich um einen Ausdruck aus einer pdf-Neugenerierung aus dem
Jahre 2004, die ansonsten komplett identisch mit der Originalausgabe von 2001
ist - die 2001er Ausgabe findet sich in dem einen oder anderen Verbundkatalog
in Deutschland).
Man beachte, dass die gedruckte Ausgabe im Kollationsvermerk "92 Bl." stehen
hat - ergibt sich dadurch, wenn aus einem Textverarbeitungsprogramm einseitig
ausgedruckt und das dann zusammengebunden wird. Ich habe die Datei in pdf
umgewandelt und auf meine private Website gestellt. Als elektronisches Dokument
habe ich natürlich nicht die einseitig bedruckte Druckausgabe simuliert, daher
sind es dann hier tatsächlich 92 S. Es wäre ja doch eine Idiotie, ein
pdf-Dokument ins WWW zu stellen, bei dem jede zweite Seite blank wäre und das
dann künstlich auf die doppelte Seitenanzahl aufgebläht wäre.
Das findet man bei Google Books: http://books.google.ch/books?id=6mXhHAAACAAJ&dq
Dort steht in der bibliographischen Beschreibung: "184 S." Hier hat Google sich
zwar an einem wohl an sich korrekten Datensatz aus einem Bibliothekskatalog
gelabt, jedoch fand bei der Übernahme eine wunderliche Abänderung von "92 Bl."
auf "184 S." statt! Dies führt aber eben leider auch zu einer Verfälschung.
Die Quelle ist ja übrigens unten angeben: BLB Karlsruhe (bzw. SWB). Und sucht
man den Datensatz dort im Katalog auf, steht denn auch tatsächlich dort "92
Bl."! Google Books sollte uns doch bitte mit solchen hirnrissigen
Verschlimmbesserungen von bibliographischen Angaben verschonen!
Fazit: Google Books sammelt haufenweise Datensätze, deren Qualität entweder aus
der Vorlage her fragwürdig ist - weil rekatalogisiert und noch nicht
nachbearbeitet -, oder, was das grössere Übel darstellt, nimmt an korrekt
vorliegenden Datensätzen bei der Übernahme Verschlimmbesserungen vor, die die
Angaben verfälschen.
Es wurde schon angenommen, dass die Übernahme von bibliographischen Daten aus
Bibliothekskatalogen durch Google zu einer Qualitätssteigerung führen wird. Ich
zweifle das doch sehr an! Es scheint Google Books nur darum zu gehen,
hauptsächlich eine Art parallelen WorldCat aufzubauen, bei dem a) von möglichst
vielen Werken Digitalisate vorliegen und b) der möglichst das Angebot von
Konkurrenten ausschalten soll (vielleicht nicht nur Amazon, sondern auch
WorldCat?). Dass man das über Masse statt Klasse erreichen will, zeigen schon
die Digitalisate, bei denen die Finger der Bearbeitenden zu sehen sind. Die
bibliographischen Beschreibungen bei Google Books werden in der Masse
meineserachtens genauso ein Gewurschtel bleiben, wie man aus meinen Beispielen
von Übernahmen aus Bibliothekskatalogen sehen kann.
Mehr noch: Google Books bietet mit "Zitat exportieren" die Übernahme dieser
Datensätze in Literaturverwaltungsprogramme an. Von dort können sie dann bequem
(kann unter Umständen heissen, ohne eine weitere Kontrolle auf ihre Richtigkeit
durch den Übernehmenden) in das Literaturverzeichnis von Hochschulschriften,
wie Bachelor-, Masterarbeiten, Dissertationen und Habilitationen gelangen. Auch
wenn diese Leute dann nicht wie manche Politiker (oder ähnliches...) auf das
korrekte Zitieren verzichten, so verschandeln sie sich womöglich durch die ach
so bequeme Übernahme von durch Google Books korrumpierten Datensätzen ihr
Literaturverzeichnis. Im Fall 2 beispielsweise wäre man geneigt, den Angaben
dort zu vertrauen, da als ursprüngliche Quelle ein Bibliothekskatalog angeben
ist, merkt möglicherweise jedoch nicht, dass Google Books von sich aus eine
Verfälschung vorgenommen hat.
Man könnte es etwas drastisch auch so formulieren: Eigentlich sollten unsere
Bibliotheken/Verbünde Google dafür verklagen, dass durch Google Books
verfälschte Datensätze als ihre ausgewiesen werden!
Freundliche Grüsse
Bernd Martin Rohde
_________________________________________________________
Bernd Martin Rohde, Dipl.-Bibl. (FH), UP in Rare Book Librarianship
Obergütschstrasse 9, CH 6003 Luzern
Fasanenweg 2, D 88284 Wolpertswende
mailto:b.m.rohde@xxxxxxx
http://berndmartinrohde.gmxhome.de
dienstl:
Universitätsbibliothek Bern, Zentralbibliothek
Münstergasse 61, CH 3000 Bern 8
Tel.: +41 (0)31 631 93 16
mailto:bernd.rohde@xxxxxxxxxxx
http://www.ub.unibe.ch/zb
--
http://www.inetbib.de
Listeninformationen unter http://www.inetbib.de.