[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [InetBib] Statistiklügen - War: Ein Monat InetBib ohne Jobmails
- Date: Mon, 6 May 2019 11:34:05 +0200
- From: Benjamin Dietze via InetBib <inetbib@xxxxxxxxxx>
- Subject: Re: [InetBib] Statistiklügen - War: Ein Monat InetBib ohne Jobmails
Holla, jetzt geht es ja richtig rund!
Am 06.05.19 um 10:46 schrieb fb.wirtschaftswiss via InetBib:
Die - "nicht wirklich ernst gemeinte" - Interpretation von Herrn Dietze,
dass auf 23% der Beiträge geantwortet wurde, ist eine weitverbreitete -
manchmal bewusste, oft aber auch unbewusste - Falschdeutung der
korrekten Zahlen, denn damit diese Behauptung stimmt, dürfte auf jeden
Beitrag nur genau eine oder eben keine Antwort erfolgen.
Pu, zum Glück habe ich extra darauf hingewiesen, dass meine plakative
Darstellung nicht wissenschaftlich korrekt sein soll!
Tatsächlich erfolgen aber auf viel mehr Beiträge keine Antworten,
während auf einzelne Beträge viele Antworten erfolgen. Dadurch ist der
Anteil der Beiträge, auf die eine Antwort erfolgte aber viel geringer
als die plakativen 23%.
[...]
Fasst man die Zahlen nun zusammen, könnte man bei 6 Anfangsbeiträgen und
6 Antworten zu dem _falschen_ Ergebnis kommen, dass auf jeden Beitrag
auch eine Antwort geschrieben wird.
Tatsächlich ist es aber so, dass im Mai zu 5 Anfangsbeiträgen keine
Antwort geschrieben wurde, während zu 1 Anfangsbeitag 5 Antworten
erfolgten zuzüglich einer Antwort zu einem Anfangsbeitrag, das vor Mai
gepostet wurde. Das ergäbe, das zu jedem sechsten Anfangsbeitrag ein
oder mehrere Antworten geschrieben werden.
Bei Ihrer Zählung müsste man jedoch ein wenig weiter gehen: Um es ganz,
ganz genau zu machen, müsste jede Mail semantisch analysiert und in
ihrem Kontext bewertet werden um herauszufinden, ob sie eine Antwort ist
oder nicht. Es gibt z.B. Beiträge, die sich zwar technisch auf einen
früheren Beitrag beziehen, inhaltlich von diesem jedoch völlig losgelöst
sind. So gab es bspw mal einen Teilnehmer, der der Einfachheit halber
auf eigene frühere Beiträge antwortete, den Inhalt löschte und einen
neuen Beitrag begann. Wird nun der sog. Referrer der Mail ausgewertet,
scheint dieser Beitrag eine Antwort auf einen früheren Beitrag zu sein.
Ist er aber nicht.
Anders herum gibt es Beiträge, die zwar "neu" sind, sich inhaltlich
jedoch auf frühere Beiträge beziehen, diese teilweise auch zitieren und
mithin als "Antwort" gelten müssten.
Schließlich gibt es noch eine weitere Verböserung bei der Frage "Auf wie
viele Beiträge wird geantwortet?". Wie wird das folgende Beispiel gezählt:
Beitrag 1
|_Beitrag 2
| |_Beitrag 3
| |_Beitrag 4
|_Beitrag 5
Beiträge 3 und 4 sind direkte Antworten auf #2. Lediglich #2 und #5 sind
direkte Antworten auf #1. Hat Beitrag 1 jetzt zwei oder vier Antworten?
Wenn #1 vier Antworten hat, wo sind dann die Antworten auf #2 geblieben?
Und wie lautet die Antwort auf die o.g. Frage? "1" oder "2"?
Statistik kann sooo gemein sein!! ;)
So weit zum Thema "Wie lügt man mit Statistik" und "Traue keiner
Statistik, die du nicht selbst gefälscht hast".
Da gehe ich noch einen Schritt weiter und behaupte:
"Wer eine Statistik erstellt, lügt." ;)
Gruß
Ben
Listeninformationen unter http://www.inetbib.de.