Sarkazm jest niezwykle trudny do przekazania w tekście – można go łatwo błędnie zinterpretować. Subtelne zmiany tonu wyrażające sarkazm często mylą również algorytmy komputerowe, ograniczając wirtualnych asystentów i narzędzia do analizy treści.
Xiyuan Gao, Shekhar Nayak i Matt Coler z Speech Technology Lab na Uniwersytecie w Groningen w kampusie Fryslân opracowali wielomodalny algorytm usprawniający wykrywanie sarkazmu, który bada wiele aspektów nagrań dźwiękowych w celu zwiększenia dokładności. Gao zaprezentował swoją pracę w czwartek, 16 maja, w ramach wspólnego spotkania Acoustical Society of America i Canadian Acoustical Association, które trwało dniach 13-17 maja w Shaw Center w centrum Ottawy, Ontario, Kanada.
Tradycyjne algorytmy wykrywania sarkazmu często opierają się na jednym parametrze, aby uzyskać wyniki, i jest to główny powód, dla którego często zawodzą. Zamiast tego Gao, Nayak i Coler zastosowali dwa uzupełniające się podejścia – analizę nastrojów za pomocą tekstu i rozpoznawanie emocji za pomocą dźwięku – aby uzyskać pełniejszy obraz.
– Wyodrębniliśmy z mowy parametry akustyczne, takie jak wysokość tonu, tempo mówienia i energia, a następnie wykorzystaliśmy funkcję automatycznego rozpoznawania mowy do transkrypcji mowy na tekst w celu analizy nastrojów – powiedział Gao. – Następnie przypisaliśmy emotikony do każdego segmentu mowy, odzwierciedlając jego zawartość emocjonalną. Integrując te multimodalne wskazówki z algorytmem uczenia maszynowego, nasze podejście wykorzystuje połączone mocne strony informacji dźwiękowych i tekstowych wraz z emotikonami do kompleksowej analizy.
Zespół optymistycznie ocenia wydajność swojego algorytmu, ale już szuka sposobów na jego dalsze ulepszenie.
– Istnieje wiele wyrażeń i gestów, których ludzie używają, aby podkreślić sarkastyczne elementy w mowie – powiedział Gao. – Należy je lepiej zintegrować z naszym projektem. Ponadto chcielibyśmy uwzględnić więcej języków i zastosować rozwijające się techniki rozpoznawania sarkazmu.
Podejście to można wykorzystać nie tylko do identyfikacji suchego dowcipu. Naukowcy podkreślają, że technika ta może mieć szerokie zastosowanie w wielu dziedzinach.
– Rozwój technologii rozpoznawania sarkazmu może przynieść korzyści innym dziedzinom badawczym wykorzystującym analizę sentymentów i rozpoznawanie emocji – stwierdził Gao. -Tradycyjnie analiza nastrojów koncentruje się głównie na tekście i jest opracowywana do zastosowań takich jak wykrywanie mowy nienawiści w Internecie i eksploracja opinii klientów. Rozpoznawanie emocji na podstawie mowy można zastosować w opiece zdrowotnej wspomaganej przez sztuczną inteligencję. Technologia rozpoznawania sarkazmu wykorzystująca podejście multimodalne jest wnikliwa do tych dziedzin badawczych.
Źródło: materiały Acoustical Society of America, zdjęcie zajawka: Nicole Pankalla/Pixabay (Statua Oscara Wilde’a w Dublinie, Irlandia)
Zostaw komentarz
You must be logged in to post a comment.