Analyser l’expression du discours de haine dans les commentaires YouTube

Des chercheurs de l’Interactive Technologies Institute ont mené une étude sur le discours de haine ciblant les communautés marginalisées dans les commentaires YouTube. Cláudia Silva a rejoint une équipe de recherche dirigée par Paula Carvalho (INESC-ID/IST), qui visait à analyser la prévalence et les stratégies linguistiques sous-jacentes au discours de haine en ligne à l’encontre des communautés afro-descendantes, roms et LGBTQ+ au Portugal. La recherche a été développée dans le cadre du projet HAINE COVID-19.PT.

L’étude, publiée dans le Journal de l’agression et du conflit linguistiques, a été motivé par la présence croissante du discours de haine en ligne (OHS) sur les plateformes de médias sociaux et son impact négatif sur les individus et la société. Cependant, l’absence d’une définition universelle du discours de haine et l’absence de ressources pouvant être facilement opérationnalisées et comparées dans différents contextes linguistiques et pragmatiques ont posé des défis importants.

Les chercheurs ont créé un corpus annoté à grain fin appelé CO-HATE (Counter, Offensive and Hate speech) pour remédier à ces limitations. Ce corpus comprend 20 590 commentaires postés par 8 485 internautes uniques sur 39 vidéos YouTube ciblant les communautés susmentionnées. Les commentaires ont été méticuleusement analysés à l’aide de techniques de linguistique de corpus, permettant à l’équipe d’identifier les discours de haine manifestes et cachés, les contre-discours et les modèles de discours offensants.

Les résultats de l’étude ont fourni des informations précieuses sur les spécificités du discours de haine ciblant les communautés d’ascendance africaine, roms et LGBTQ+ au Portugal. En combinant des méthodes de recherche quantitatives et qualitatives, les chercheurs ont pu faire la lumière sur les stratégies linguistiques et rhétoriques employées pour exprimer la haine envers ces groupes marginalisés. De plus, cette recherche a conduit à la création du premier corpus finement annoté pour le portugais européen, qui servira de ressource cruciale pour étudier et détecter les discours de haine en ligne, en particulier concernant les communautés ciblées, sur les plateformes de médias sociaux.

Les résultats de cette étude devraient avoir un impact significatif sur la société à moyen et long terme. Les informations tirées de l’analyse des discours de haine en ligne éclaireront le développement de modèles de détection automatisés plus efficaces et adaptés au portugais. Cela contribuera à une meilleure compréhension de la dynamique du discours de haine en ligne au Portugal et contribuera à la lutte contre la discrimination et l’intolérance. De plus, le corpus CO-HATE servira d’outil important pour les chercheurs et les développeurs intéressés par la détection des discours de haine manifestes et cachés et des phénomènes connexes, tels que le contre-discours et le discours offensant, en portugais.

En ce qui concerne les étapes futures, les chercheurs s’appuient sur les connaissances acquises grâce à cette étude pour approfondir leurs recherches dans le cadre du projet KNOwhate. dans lequel Cláudia Silva dirige un certain nombre d’activités de recherche liées à la lutte contre le discours de haine au Portugal par le biais de la production médiatique (podcasts et campagne en ligne).

Plusieurs auteurs de cette étude explorent également la relation entre le discours de haine, les théories du complot et les médias sociaux dans un autre projet appelé MAICT. Dans l’ensemble, cette recherche marque une étape importante vers la compréhension et la lutte contre le discours de haine en ligne. Les conclusions et les ressources de l’étude contribueront à l’élaboration de stratégies efficaces pour lutter contre le discours de haine, protéger les communautés marginalisées et favoriser un environnement numérique plus inclusif et tolérant.

Plus d’information:
Paula Carvalho et al, L’expression d’un discours de haine contre les communautés afro-descendantes, roms et LGBTQ+ dans les commentaires YouTube, Journal de l’agression et du conflit linguistiques (2023). DOI : 10.1075/jlac.00085.car

Fourni par l’Institut des technologies interactives

ph-tech