Die Forschungsstelle sotomo hat im Rahmen des Projekts «Online Aggression From A Sociological Perspective» eine überwachte maschinelle Erkennung («supervised Classification») von aggressiven Inhalten in rund 1,3 Mio. Kommentaren von Openpetition.de durchgeführt. Für den Trainingsdatensatz wurden 3006 Kommentare durch zwei Expertinnen annotiert, ob die Aussage eine Beleidigung, Belästigung, Bedrohung oder eine andere Art von Unangemessenheit enthält. Auf diesem Trainingsdatensatz konnte ein Machine Learning mit 195’172 Modellen aus variierenden Features und Modell-Parametern durchgeführt werden. Mit der finalen Schätzung über alle Kommentare wird ein Anteil von 3,5 bzw. 6 Prozent aggressive Kommentare berechnet.
Den gesamten Bericht können Sie hier herunterladen (PDF). Die englische Version finden Sie hier (PDF).