Dowcipy vs AI. Sarkazm pod lupą

Oscar Wilde powiedział kiedyś, że sarkazm to najniższa forma dowcipu, ale najwyższa forma inteligencji. Czy osiągnie ją SI?

Sarkazm jest niezwykle trudny do przekazania w tekście – można go łatwo błędnie zinterpretować. Subtelne zmiany tonu wyrażające sarkazm często mylą również algorytmy komputerowe, ograniczając wirtualnych asystentów i narzędzia do analizy treści.

Xiyuan Gao, Shekhar Nayak i Matt Coler z Speech Technology Lab na Uniwersytecie w Groningen w kampusie Fryslân opracowali wielomodalny algorytm usprawniający wykrywanie sarkazmu, który bada wiele aspektów nagrań dźwiękowych w celu zwiększenia dokładności. Gao zaprezentował swoją pracę w czwartek, 16 maja, w ramach wspólnego spotkania Acoustical Society of America i Canadian Acoustical Association, które trwało dniach 13-17 maja w Shaw Center w centrum Ottawy, Ontario, Kanada.

Tradycyjne algorytmy wykrywania sarkazmu często opierają się na jednym parametrze, aby uzyskać wyniki, i jest to główny powód, dla którego często zawodzą. Zamiast tego Gao, Nayak i Coler zastosowali dwa uzupełniające się podejścia – analizę nastrojów za pomocą tekstu i rozpoznawanie emocji za pomocą dźwięku – aby uzyskać pełniejszy obraz.

– Wyodrębniliśmy z mowy parametry akustyczne, takie jak wysokość tonu, tempo mówienia i energia, a następnie wykorzystaliśmy funkcję automatycznego rozpoznawania mowy do transkrypcji mowy na tekst w celu analizy nastrojów – powiedział Gao. – Następnie przypisaliśmy emotikony do każdego segmentu mowy, odzwierciedlając jego zawartość emocjonalną. Integrując te multimodalne wskazówki z algorytmem uczenia maszynowego, nasze podejście wykorzystuje połączone mocne strony informacji dźwiękowych i tekstowych wraz z emotikonami do kompleksowej analizy.

Zespół optymistycznie ocenia wydajność swojego algorytmu, ale już szuka sposobów na jego dalsze ulepszenie.

– Istnieje wiele wyrażeń i gestów, których ludzie używają, aby podkreślić sarkastyczne elementy w mowie – powiedział Gao. – Należy je lepiej zintegrować z naszym projektem. Ponadto chcielibyśmy uwzględnić więcej języków i zastosować rozwijające się techniki rozpoznawania sarkazmu.

Podejście to można wykorzystać nie tylko do identyfikacji suchego dowcipu. Naukowcy podkreślają, że technika ta może mieć szerokie zastosowanie w wielu dziedzinach.

– Rozwój technologii rozpoznawania sarkazmu może przynieść korzyści innym dziedzinom badawczym wykorzystującym analizę sentymentów i rozpoznawanie emocji – stwierdził Gao. -Tradycyjnie analiza nastrojów koncentruje się głównie na tekście i jest opracowywana do zastosowań takich jak wykrywanie mowy nienawiści w Internecie i eksploracja opinii klientów. Rozpoznawanie emocji na podstawie mowy można zastosować w opiece zdrowotnej wspomaganej przez sztuczną inteligencję. Technologia rozpoznawania sarkazmu wykorzystująca podejście multimodalne jest wnikliwa do tych dziedzin badawczych.


Źródło: materiały Acoustical Society of America, zdjęcie zajawka: Nicole Pankalla/Pixabay (Statua Oscara Wilde’a w Dublinie, Irlandia)

Udostępnij:

Powiązane posty

Zostaw komentarz