- Eine von Jan Strehmel vorgestellte Studie, einem Studenten am Institut für Theoretische Informatik des Karlsruher Instituts für Technologie.
- Es wurden mehr als 3.800 Repositories mit Beschimpfungen und mehr als 7.600 Repositories ohne Beschimpfungen gesammelt.
- Die Codequalität wurde mit SoftWipe gemessen, einem Werkzeug zur Bewertung der Qualität von C/C++-Code, und mit verschiedenen statistischen Methoden analysiert.
- Das Ergebnis: Die Qualität von Code mit Beschimpfungen war im Durchschnitt höher.
- Die Hypothese lautet, dass der Gebrauch von Beschimpfungen eine emotionale Beteiligung an der Komplexität des Codes widerspiegelt und dazu beiträgt, den Code kritischer zu analysieren und besseren Code zu erzeugen.
- In der Begutachtung der Studie wurde jedoch kritisiert, dass ein Zusammenhang zwischen Beschimpfungen und Codequalität schwer nachzuweisen sei und der Studie die Repräsentativität fehle.
11 Kommentare
Das erinnert mich an den Vektorberechnungs-Algorithmus-Code aus Quake.
float Q_rsqrt( float number )
{
long i;
float x2, y;
const float threehalfs = 1.5F;
x2 = number * 0.5F;
y = number;
i = * ( long * ) &y; // übles Floating-Point-Hacking auf Bit-Ebene
i = 0x5f3759df - ( i >> 1 ); // was zum Teufel?
y = * ( float * ) &i;
y = y * ( threehalfs - ( x2 * y * y ) ); // 1. Iteration
// y = y * ( threehalfs - ( x2 * y * y ) ); // 2. Iteration, das kann entfernt werden
return y;
}
Entgegen dem verbreiteten Klischee, dass jemand, der viel flucht, schlecht erzogen sei, zeigt eine Studie, dass Menschen, die gut fluchen können, über einen vergleichsweise größeren Wortschatz verfügen. - https://www.mk.co.kr/news/society/7115122
Es gibt auch Studien, die zeigen, dass Menschen, die gut fluchen, einen größeren Wortschatz haben. Wenn es eine Person gibt, die nur „Nein“ sagt, und eine andere, die sowohl „Nein“ als auch „Nein, verdammt“ unterscheidet und beides verwendet, dann scheint Letztere tatsächlich über mehr Wortschatz und Ausdruckskraft zu verfügen.
Nachdem ich diesen Artikel gesehen habe, habe ich die Typen in den Commit-Messages statt auf
feat:einheitlich auf das F-Wort umgestellt.Ist es nicht vielleicht so, dass der Code von jemandem geschrieben wurde, der so herausragend gut ist, dass man beim Anblick des Codes von Kollegen kaum anders kann, als zu fluchen?
Oder der Code wurde von jemandem geschrieben, der so gut ist, dass sich niemand beschweren kann, selbst wenn er Schimpfwörter in den Code schreibt, haha
Ich denke das auch. Auf einem halbwegs normalen Niveau würde man es kaum wagen, in Kommentare zu fluchen ... ich glaube, man würde sich selbst zensieren. Wahrscheinlich hinterlässt nur eine kleine Minderheit unter den wirklich herausragenden Programmierern Schimpfwörter — solche, denen es an Selbstbeherrschung fehlt oder die sich absichtlich nicht beherrschen. Im Originalkommentar wird übrigens auch Torvalds erwähnt, haha.
Das ist wohl ein Thema, das Journalistinnen und Journalisten mögen, die auf reißerische Artikel aus sind.
Irgendwie eine seltsame Studie. Wenn ich solche Kommentare mit Schimpfwörtern sehe, würde mir das wahrscheinlich die Laune verderben -.-;
Grundsätzlich heißt es auch in der Studie, dass es zwar eine Korrelation zwischen Schimpfwörtern und Codequalität gibt, aber keinen Kausalzusammenhang. Schimpfen führt also nicht dazu, dass die Codequalität besser wird.
Außerdem sei es noch etwas zu früh für ein abschließendes Fazit, und es werde weitere Forschung benötigt.
Auch auf Hacker News gibt es viele Pro-und-Contra-Debatten. Manche sagen, es stimme tatsächlich, andere widersprechen ...
In den Kommentaren heißt es unter anderem, dass in einem sicheren, nicht unterdrückenden Umfeld eher geflucht wird und in so einem Umfeld bessere Codequalität entsteht ...
Außerdem wird gesagt, dass Fluchen emotional etwas entlastet und man sich deshalb besser auf die Codequalität konzentrieren kann.
Ob das wirklich stimmt, weiß ich nicht, aber anscheinend gibt es auch im OpenJDK Schimpfwörter.
KI-Zusammenfassung der Arbeit
Das PDF erörtert, ob der Gebrauch von Schimpfwörtern in Open-Source-Code mit der Codequalität zusammenhängt.
Um dies zu untersuchen, haben die Autoren auf GitHub mehr als 3.800 C-Repositories mit Schimpfwörtern und mehr als 7.600 C-Repositories ohne Schimpfwörter gecrawlt.
Die Autoren verwendeten ein Tool namens SoftWipe, um die Codequalität der Repositories anhand der Einhaltung von Coding-Standards zu quantifizieren.
Die Ergebnisse zeigten auf Grundlage statistischer Validierung, dass Repositories mit Schimpfwörtern deutlich höhere Codequalitätswerte aufwiesen als Repositories ohne Schimpfwörter.
Die Autoren stellten die Hypothese auf, dass der Gebrauch von Schimpfwörtern auf ein stärkeres emotionales Engagement der Programmierer und eine gründlichere Analyse des Codes hinweist, was zu besserer Qualität führt.
Sie räumen jedoch ein, dass Korrelation keine Kausalität bedeutet und Schimpfwörter die Codequalität nicht automatisch verbessern.
Die Studie liefert interessante erste Ergebnisse, doch die Autoren weisen darauf hin, dass ein größerer Datensatz (einschließlich C++-Code und einer präziseren Identifizierung von Schimpfwörtern)
sowie eine genauere Untersuchung des Einflusses von Codezeilen, Sternenbewertungen und der Anzahl der Schimpfwörter auf die Ergebnisse zur Codequalität weitere Erkenntnisse liefern könnten.
Zusammengefasst ist das Hauptergebnis dieser Studie, dass in Open-Source-C-Code eine statistisch signifikante Korrelation zwischen dem Gebrauch von Schimpfwörtern und höheren Codequalitätswerten festgestellt wurde.
Die Autoren mahnen jedoch, dass weitere Forschung nötig ist, um die Gründe für diese Korrelation und ihre praktischen Implikationen besser zu verstehen.
Das könnte daran liegen, dass die vorherrschende Kultur in C eine Kultur aggressiver Kritik war.