Die For­schungs­stelle sotomo hat im Rahmen des Pro­jekts «Online Aggres­sion From A Socio­lo­gi­cal Per­spec­tive» eine überwachte maschi­nelle Erken­nung («super­vi­sed Clas­si­fi­ca­tion») von aggres­si­ven Inhal­ten in rund 1,3 Mio. Kom­men­ta­ren von Openpetition.de durchgeführt. Für den Trai­nings­da­ten­satz wurden 3006 Kom­men­tare durch zwei Exper­tin­nen anno­tiert, ob die Aus­sage eine Belei­di­gung, Beläs­ti­gung, Bedro­hung oder eine andere Art von Unan­ge­mes­sen­heit ent­hält. Auf diesem Trai­nings­da­ten­satz konnte ein Machine Lear­ning mit 195’172 Model­len aus vari­ie­ren­den Fea­tures und Modell-Para­me­tern durchgeführt werden. Mit der fina­len Schät­zung über alle Kom­men­tare wird ein Anteil von 3,5 bzw. 6 Pro­zent aggres­sive Kom­men­tare berechnet.

Den gesam­ten Bericht können Sie hier her­un­ter­la­den (PDF). Die eng­li­sche Ver­sion finden Sie hier (PDF).

Mehr aus unse­rem Port­fo­lio finden Sie hier.