Zapraszamy na kolejne wydziałowe seminarium naukowe, które odbędzie się w poniedziałek 9 grudnia o godzinie 10:00 w sali 4, budynek D. Wystąpienie wygłoszą dr Mariusz Baranowski i dr Piotr Cichocki.

 

Algorytmy w służbie socjologii – maszynowa analiza i klasyfikacja treści na przykładzie polskiego dyskursu o transformacji energetycznej
 
Analiza treści w naukach społecznych tradycyjnie podlegała ograniczeniom skali, które sprawiały, że badania przekazów pozostawały przeważnie jakościowe. Dynamiczny postęp technologii przetwarzania języka naturalnego (NLP) w ciągu ostatnich dwóch dekad sprawił, że skala przestała być ograniczeniem w modelu badania – odpowiednio przyuczone maszyny potrafią szybko „przeczytać” korpusy o wcześniej niewyobrażalnych rozmiarach. Jednym z popularnych zastosowań algorytmicznej analizy treści stało się modelowanie tematów wykorzystujące Latentną Alokację Dirichleta (LDA). W związku z kolejną rewolucją w NLP, zapoczątkowaną przez sieci neuronowe w architekturze Transformer i oparte na nich modele języka, technologia LDA stała się jednak znienacka przestarzała o całą epokę.
 
Odpowiedzią na ten skokowy postęp jest paradygmat BERTopic. Jest to opublikowane w 2022 roku rozwiązanie, które dodaje nową reprezentację tekstu osadzonego w gęstej przestrzeni wektorowej do sprawdzonych technik ekstrakcji słów kluczowych ze starszych metod NLP. Nasza prezentacja pokaże moc tej nowej technologii na przykładzie polskiego dyskursu prasowego o transformacji energetycznej w latach 2015 - 2023.