Berechnung des Matthäus-Effekts - Yule-Prozeß


Um eine gegebene Anzahl von Texten / Beiträgen etc. daraufhin zu untersuchen, wie hoch die Anzahl der Texte / Beiträge ist, die ein einzelner Autor unter Berücksichtigung des Matthäus-Effekts dazu beitragen kann, reicht es, in das Eingabefeld "Anzahl Texte (max. 25000)" (voreingestellt: 100) die Anzahl der Texte einzugeben, die untersucht werden soll. Andere Einstellungen oder Eingaben sind nicht notwendig. Für die übrigen möglichen Funktionen bzw. Einstellungen bitte die Anwendungshinweise weiter unten beachten.


Anzahl Texte (max. 25000): (Nur ganze Zahlen!)
Mit Testwert berechnen: Testwert:
Mit grafischem Verlauf ausgeben: Ab Durchgang Nr.
Button sperren: Ab Durchgang Nr.







Herkunft und Einsatzzweck des Rechners:
Dieser Rechner wurde vom Autor dieser Seite im Rahmen einer Dissertation entwickelt. Dabei ging es u.a. darum, ob die sehr häufige Nennung eines einzelnen Autors in einer bestimmten Literaturliste über den Matthäus-Effekt erklärbar ist, oder ob die Listung dieses Autors (auch) dessen Relevanz hinsichtlich eines bestimmten Themas widerspiegeln soll, wobei das nicht unwichtige Detail eines Rolle spiegeln könnte, daß die untersuchte Literaturliste durch eine Universitäts-Arbeitsstelle erstellt wurde, deren Leiter eben jener Autor ist (Anzahl Texte in der [bereinigten] Literaturliste: 729; Nennung eines einzelnen Autors dabei: 192 = 26,34 %). Die Untersuchung mit insgesamt 2000 Programmdurchläufen ergab, daß selbst unter Berücksichtigung des Matthäus-Effekts ein solcher Wert nicht erreicht werden konnte; der Höchstwert bei der zugrunde liegenden Anzahl von Texten lag bei 101. Rein rechnerisch wäre wenigstens eine Gesamttextanzahl von 1285 Texten, um den Wert von 192 zu erreichen. Allerdings handelt es sich hier eher um einen theoretischen Wert, der stark gegen null tendiert. Bei einem Gegentest mit 1285 Texten ergab sich ein Höchstwert für einen Autor von 137 Beiträgen. Erst bei einer Anzahl von 2100 Texten ergab sich ein ähnlicher Wert (194) bei 500 Programmdurchläufen. Dreimal erreicht bzw. überschritten wurde der Wert erst bei 3000, und gar zehnmal bei 4000 Texten und jeweils 500 Durchläufen. Das sehr häufige Vorkommen eines einzigen AUtors in der untersuchten Liste läßt sich also weder durch Zufall noch durch den Matthäus-Effekt erklären. Vielmehr kann vermutet werden, daß diese Liste (auch) dazu dient, die Relavenz eines bestimmten Autors herauszustellen, was wiederum auf diskursive Machtausüben etc. verweist. Mithin handelt es sich bei der untersuchten Literaturliste also um eine Form der Eristik, sofern die Liste als Argument in den Diskurs eingebracht wird.
Der Rechner läßt sich allerdings nicht nur für solche Zwecke nutzen, sondern im Prinzip für alle "schiefen" Verteilungen, die soziale Komponenten aufweisen und bei denen der Matthäus-Effekt deshalb greifen könnte, z.B. bei der Vergabe öffentlicher Aufträge an bestimmte freie Träger usw., für die Analyse der Verlinkungen bestimmter Seiten oder, wie Havemann (2009: 40) schreibt, generell "[...] zum Testen von neuen Modellen [...], für die noch keine Grenzverteilung mathematisch abgeleitet worden ist."



Technische Hinweise:
Prinzipiell können so viele Programmdurchläufe durchgeführt werden, wie man möchte. Bei Tests hat sich jedoch herausgestellt, daß aber einer gewissen Anzahl von Durchläufen keine großen Änderungen hinsichtlich der Niedrigst- bzw. Höchstwerte zu erwarten ist, wie das nachfolgende Beispiel für die Verteilung bei 100 Texten zeigt:

Beispiel für eine Berechnung mit 1000 Texten: 100 Durchgänge = 35,6 % - 164,4
200 Durchgänge = 33,08 % - 166,92
500 Durchgänge = 32,12 % - 167,88
750 Durchgänge = 30,35 % - 169,66
1000 Durchgänge = 30,35 % - 169,66
1500 Durchgänge = 22,09 % - 177,91
1750 Durchgänge = 22,09 % - 177,91
2000 Durchgänge = 22,09 % - 177,91
2250 Durchgänge = 22,09 % - 177,91
2500 Durchgänge = 22,09 % - 177,91

Dies hängt jedoch nicht mit der Anzahl der Durchläufe an sich zusammen, da bei jedem Durchlauf die gleiche Wahrscheinlichkeit besteht, einen bestimmten Wert zu erreichen, da es sich um voneinander unabhängige Ereignisse handelt. Im Grunde könnten deshalb unendlich viele Durchläufe durchgeführt werden, aus forschungspraktischen Gründen scheint eine Beschränkungauf ca. 2000 jedoch sinnvoll zu sein.
Liegt die Textanzahl weit höher als tausend, so kommt noch der Zeitfaktor hinzu. Ab 10000 Texte benötigt das hier verwendete Skript auf diesem Server knapp drei Sekunden für die Berechnung - dieser Wert steigt mit höheren Textzahlen rapide an, so daß eine Beschränkung auf 25000 Texte "eingebaut" ist. Der Grund dafür liegt nicht in der Rechenmethode selbst, sondern in der dem Skript zur Verfügung stehenden Ausführungszeit, die serverseitig auf 30 Sekunden beschränkt ist. Auf anderen Server oder bei einem Vollzugriff auf die PHP.INI, in der diese Werte eingestellt werden können, ließen sich deshalb auch höhere Zahlen berechnen.



Hinweise zur Anwendung / Eingabemöglichkeiten:
Um eine gegebene Anzahl von Texten / Beiträgen etc. daraufhin zu untersuchen, wie hoch die Anzahl der Texte / Beiträge ist, die ein einzelner Autor unter Berücksichtigung des Matthäus-Effekts dazu beitragen kann, reicht es, in das Eingabefeld "Anzahl Texte (max. 25000)" (voreingestellt: 100) die Anzahl der Texte einzugeben, die untersucht werden soll. Andere Einstellungen oder Eingaben sind nicht notwendig.
"Mit Testwert berechnen" ermöglicht die gleichzeitige Untersuchung eines Wertes (Text-/Beitragsanzahl) dahingehend, ob er überhaupt mit der gegebenen Gesamtanzahl von Texten erreicht werden könnte. Da in die Berechnung eine Zufallsvariable einfließt, läßt sich eine genaue Mindestanzahl an Texten für einen bestimmten Testwert nicht exakt ermitteln, sondern lediglich hochrechnen. Dabei ist die Erreichung dieses Wertes zwar nicht unmöglich, jedoch nur von geringer Wahrscheinlichkeit. Dennoch ermöglicht dies gewisse Vergleiche, wie sie auch für die oben beschribene, untersuchte Literaturliste vorgenommen wurden. Diese Funktion läßt sich auch während einer Durchlaufreihe ein- und ausschalten.
"Mit grafischem Verlauf ausgeben" ermöglicht die Ausgabe der Ergebnisse als Säulen- bzw. Stabdiagramm. Auf der linken Seite wird dabei der erzielte Höchstwert auf Höhe der Säule angezeigt, unterhalb des Diagramms die Nummer des Durchlaufs, bei der dieser Höchstwert erreicht wurd und rechts die insgesamt durchgeführten Durchläufe. Das Eingabefeld "Ab Durchgang Nr." neben der Checkbox ermöglicht die Ausgabe erst ab einrt bestimmten Anzahl von Durchläufen. Da die Ausgabe des Diagramms in HTML erfolgt, kann dies bei höheren Textzahlen die Ladezeit der Seite etwas verbessern. Diese Funktion läßt sich auch während einer Durchlaufreihe ein- und ausschalten. Ausgegeben wird immer das gesamte Diagramm ab Durchlauf Nr. 1.
Die Funktion ""Button sperren" ermöglicht es, den Submit-Button bei einer vorgegebenen Anzahl von Durchläufen zu sperren, um aus Versehen vorgenommene weitere Durchläufe als geplant zu verhindern. Auch diese Funktion läßt sich während einer Durchlaufreihe ein- und ausschalten. Um den Button wieder zu entsperren, den entsprechenden Programmausgaben folgen.



Erläuterungen zum Matthäus-Effekt1:
Der Matthäus-Effekt ist ein Beispiel für eine Lotka-Verteilung (benannt nach Alfred Lotka), also eine "schiefe Verteilung", die mittels mathematischer Verfahren festgestellt werden kann und anhand derer sich erkennen läßt, daß bei höheren Publikationszahlen die Zahl der häufig vertretenen Autoren rapide abnimmt, so daß also viele Autoren nur wenig publizieren, einige wenige Autoren aber viele Beiträge veröffentlichen2. Der Begriff des Matthäus-Effekts (Matthew effect) wurde dabei im Rückgriff auf das Matthäus-Evangelium3 von Robert K. Merton geprägt und wird mittlerweile auch außerhalb der Wissenschaftssoziologie verwendet4. Es beschreibt im Prinzip den kumulativen Zuwachs von Erfolg (success breeds success) oder von Besitz ("Wer hat, dem wird gegeben werden")5. Der Matthäus-Effekt steht dabei auch in Zusammenhang mit Reputation, den Havemann (2009: 39) wie folgt beschreibt:

"Wissenschaftler verkaufen das von ihnen produzierte Wissen nicht, sondern streben nach Reputation, indem sie es öffentlich machen. Reputation befähigt sie, gut dotierte Stellen zu erlangen. Voraussetzung für Reputation ist die Aufmerksamkeit der Fachkollegen - bekanntlich ein rares Gut. Sie wird - wie in Kunst, Sport und Politik - vor allem denen gegeben, die schon viel davon bekommen haben. Reputation führt aber auch zu Forschungsmitteln und damit zu neuen Chancen für wissenschaftlichen Erfolg. All das - und noch einiges mehr - bewirkt eine selbstverstärkende Rückkopplung in den Karrieren von Forschern. Ähnliche Betrachtungen kann man über den Matthäus-Effekt bei wissenschaftlichen Institutionen und Zeitschriften anstellen."

Der Matthäus-Effekt kann dabei mittels des sog. Yule-Prozesses gezeigt werden. Dabei handelt es sich um ein auf einem Potenzgesetz basierendes Verfahren, das in den 1920er Jahren von dem schottischen Statistiker George Udny Yule entwickelt und später von Herbert A. Simon weiterentwickelt und hinsichtlich der "wissenschaftlichen Produktivität" in Form von Fachartikeln erstmals herangezogen wurde6. Havemann (2009: 40) erläutert das Verfahren (inklusive Berechnungsformeln, die hier ausgelassen werden können) dermaßen einfach, daß hier wiederum auf ein wörtliches Zitat zurückgegriffen werden soll:

"Der Yule-Prozess kann mit Bezug auf Autoren und Artikel einer Bibliographie im einfachsten Fall so beschrieben werden: Zu Beginn gibt es einen Autor mit einer Publikation in der Bibliographie. In jeder Runde des Prozesses werden der Bibliographie zwei Artikel hinzugefügt, und zwar so, dass einer von einem neuen Autor publiziert wird und einer von einem Autor, der bereits in der Bibliographie vertreten ist. Der zweite Artikel wird unter den bisherigen Autoren verlost, wobei jeder Autor für jeden seiner bisherigen Artikel ein Los erhält. Ein Autor mit bisher zehn Artikeln hat damit eine zehnfach größere Chance, einen weiteren zu publizieren, als ein Autor mit nur einer Publikation. Auf diese Weise wird im Modell der Matthäus-Effekt hervorgerufen: Wer hat, dem wird gegeben."



Verweise:
1 Dieser Abschnitt inkl. Fn und wörtlicher Zitation wurde entnommen bei Janatzek 2017: 459 f.
2 Havemann 2009: 13.
3 Mt 25, 14 - 30.
4 Havemann 2009: 39; vgl. auch Merton 1985: 155.
5 Ebd.
6 Ebd.: 39 f.


Quellenangaben:

Havemann, Frank (2009): Einführung in die Bibliometrie. Berlin: Gesellschaft für Wissenschaftsforschung. Unter: https://edoc.hu-berlin.de/bitstream/handle/18452/10084/20uf7RZtM6ZJk.pdf

Janatzek, Uwe (2017): Sozialinformatik - empirisch begründete Zuordnungen und Verständnisweisen. Unter besonderer Berücksichtigung einer wissenschaftstheoretischen Verortung der managerialen Sozialinformatik als Protowissenschaft. Dissertation zur Erlangung des akademischen Grades Doktor der Philosophie (Dr. phil.) der Fakultät für Erziehungswissenschaft der Universität Bielefeld. Unter: https://pub.uni-bielefeld.de/download/2909606/2909607.

Merton, Robert K. (1985): Entwicklung und Wandel von Forschungsinteressen. Aufsätze zur Wissenschaftssoziologie. Frankfurt/M.: Suhrkamp Verlag.


Nur ganze Zahlen eingeben!