2024-04-17 10:33:08 JPM redakcja1 K

Dlaczego ,,zmiękczanie’’ akcentów przez oprogramowanie AI jest problematyczne

,,Dlaczego nie jest to wspaniałe?’’ - zdziwiony Sharath Keshava Narayana zapytał swoje urządzenie AI maskujące akcenty.

Akcenty są jedną z cenionych cech różnorodności kulturowej. Zdjęcie: Bbernard/Shutterstock.

Najnowsza technologia, wyprodukowana przez jego firmę Sanas, ma na celu ,,złagodzenie’’ akcentu pracowników call center w czasie rzeczywistym, aby rzekomo chronić ich przed uprzedzeniami i dyskryminacją. Od chwili premiery we wrześniu 2022 r. cieszy się ona szerokim zainteresowaniem zarówno w świecie anglojęzycznym, jak i francuskojęzycznym.

 Jednak nie wszyscy są przekonani o antyrasistowskich właściwościach tego oprogramowania. Krytycy twierdzą raczej, że pogrąża nas to we współczesnej dystopii, w której technologia służy do wymazywania różnic między jednostkami, cech tożsamości i kultur.

 Aby je zrozumieć, moglibyśmy zrobić coś gorszego niż w pierwszej kolejności sprawdzanie, co stanowi akcent. Jak można je stłumić? I w jaki sposób ich ,,prasowanie’’ zagina się znacznie bardziej niż fale dźwiękowe?

 Jak sztuczna inteligencja może wyciszyć akcent

 ,,Akcenty’’ można zdefiniować m.in. jako zespół wskazówek ustnych (samogłosek, spółgłosek, intonacji itp.), które przyczyniają się do mniej lub bardziej świadomego formułowania hipotez na temat tożsamości jednostek (np. geograficznej czy społecznej). Według różnych narracji akcent można określić jako regionalny lub obcy.

 Ponieważ technologie start-upowe zwykle przypominają czarne skrzynki, mamy niewiele informacji na temat narzędzi wdrożonych przez Sanas w celu ujednolicenia naszego sposobu mówienia. Wiemy jednak, że większość metod ma na celu przynajmniej częściowe przekształcenie struktury fali dźwiękowej, aby przybliżyć pewne sygnały akustyczne do kryteriów percepcyjnych. Technologia poprawia samogłoski, spółgłoski wraz z takimi parametrami jak rytm, intonacja czy akcentowanie. Jednocześnie technologia będzie dążyć do zabezpieczenia jak największej liczby wskazówek głosowych, aby umożliwić rozpoznanie głosu oryginalnego mówiącego, na przykład poprzez klonowanie głosu, co może skutkować fałszywymi oszustwami wokalnymi. Technologie te umożliwiają oddzielenie tego, co jest związane z mową, od tego, co jest związane z głosem.

 Automatyczne przetwarzanie mowy w czasie rzeczywistym stwarza trudności technologiczne, z których najważniejszym jest jakość przetwarzanego sygnału dźwiękowego. Twórcom oprogramowania udało się je przezwyciężyć, opierając się na głębokim uczeniu, sieciach neuronowych, a także dużych bazach danych plików dźwiękowych mowy, które pozwalają lepiej zarządzać niepewnościami sygnału.

 W przypadku języków obcych Sylvain Detey, Lionel Fontan i Thomas Pellegrini identyfikują niektóre problemy nieodłącznie związane z rozwojem tych technologii, w tym kwestię tego, jakiego standardu należy użyć do porównania lub roli, jaką pliki audio z mową mogą odgrywać w ich określaniu.

 Mit neutralnego akcentu

 Natomiast identyfikacja akcentu nie ogranicza się wyłącznie do akustyki. Donald L. Rubin pokazał, że słuchacze mogą odtworzyć wrażenie postrzeganego akcentu, po prostu skojarzając z mową twarze rzekomo różnego pochodzenia. W rzeczywistości, przy braku wskazówek, osoby mówiące nie są tak dobre w rozpoznawaniu akcentów, których nie słyszą regularnie lub które mogą sobie wyobrażać stereotypowo, np. niemiecki, który wielu kojarzy się z ,,agresywnymi’’ spółgłoskami.

 Życzeniowe pragnienie wyeliminowania akcentów w celu zwalczania uprzedzeń rodzi pytanie, czym jest ,,neutralny’’ akcent. Rosina Lippi-Green zwraca uwagę, że ideologia języka standardowego - idea, że ​​istnieje sposób wyrażania siebie, który nie jest naznaczony - panuje nad większą częścią społeczeństwa, ale nie ma podstaw w faktach. Vijay Ramjattan dodatkowo łączy niedawne kolosalne wysiłki na rzecz opracowania narzędzi do ,,redukcji’’ i ,,tłumienia’’ akcentu z modelem neoliberalnym, w ramach którego ludziom przypisuje się umiejętności i atrybuty, od których są zależni. Współczesny kapitalizm postrzega język jako umiejętność i dlatego mówi się, że ,,niewłaściwy akcent’’ prowadzi do ograniczenia możliwości.

 ,,Jeśli chodzi o krytykę ,,redukcji akcentu’’, ustalenie, czy rzeczywiście możliwa jest redukcja akcentu, jest mniej ważne niż zrozumienie, dlaczego osoby zmarginalizowane są w ogóle zmuszone do redukowania akcentu’’.

 Według Janin Roessel zrozumiałość staje się zatem pretekstem do obwiniania jednostki za brak umiejętności w zadaniach wymagających komunikacji ustnej. Zamiast zmuszać osoby posiadające ,,akcent do jego zmniejszania’’, badacze tacy jak Munro i Derwing pokazali, że możliwe jest wyszkolenie osób w zakresie dostosowywania swoich zdolności słuchowych do zmienności fonologicznej. Co więcej, to nie jednostki mają się zmienić, ale polityka publiczna lepiej chroni tych, którzy są dyskryminowani ze względu na ich akcent.

 Usunąć czy zachować, kurę czy jajko?

 Na polu socjologii Wayne Brekhus wzywa, abyśmy zwrócili szczególną uwagę na to, co niewidzialne, wyważając to, co nie jest tak bardzo zaznaczone - czym jest ,,brak akcentu’’, zarówno jak jego odwrotność. To prowadzi nas do ponownego rozważenia relacji władzy istniejącej między jednostkami i sposobu, w jaki ujednolicamy nacechowanego: tego, który ma (według innych) akcent.

 Dochodzimy zatem do pytania Catherine Pascal o to, w jaki sposób powstające technologie mogą udoskonalić naszą rolę ,,obywateli’’, a nie ,,maszyn’’. ,,Usunąć akcent’’ oznacza docenić dominujący typ ,,akcentu’’, zaniedbując fakt, że inne czynniki będą uczestniczyć w postrzeganiu tego akcentu, a także w pojawieniu się dyskryminacji. ,,Pozbycie się akcentu’’ nie usuwa dyskryminacji. Wręcz przeciwnie, akcent nadaje głos tożsamości, uczestnicząc w ten sposób w zjawiskach humanizacji, przynależności do grupy, a nawet empatii: akcent jest kanałem inności.

 Jeśli technologie takie jak sztuczna inteligencja i głębokie uczenie oferują nam niewykorzystane możliwości, mogą również prowadzić do dystopii, w której dehumanizacja przyćmiewa takie priorytety, jak dobro wspólne czy różnorodność, jak określono w Powszechnej Deklaracji UNESCO w sprawie różnorodności kulturowej. Zamiast je ukrywać, konieczne wydaje się uświadomienie rekruterom, w jaki sposób akcenty mogą wpływać na zadowolenie klientów i zajęcie się tą kwestią przez polityków.

 Projekty badawcze, takie jak PROSOPHON na Uniwersytecie w Lotaryngii (Francja), w których biorą udział naukowcy zajmujący się lingwistyką stosowaną i psychologią pracy, mają na celu zwiększenie świadomości rekruterów w ich obowiązkach w zakresie powiadomienia o stronniczości, lecz także wzmacnianie pozycji osób posiadających ,,akcent’’ i ubiegających się o pracę. Zadając pytanie ,,Dlaczego nie jest to wspaniałe’’ firmy takie jak SANAS przypominają nam, dlaczego technologie oparte na zinternalizowanym ucisku nie uszczęśliwiają ludzi na ich stanowiskach.

Dział: Technologia

Autor:
Grégory Miras | Tłumaczenie: Julia Mezibrocka

Żródło:
https://theconversation.com/why-ai-software-softening-accents-is-problematic-197751

Udostępnij
Nie ma jeszcze żadnych komentarzy.
Treść wiadomości jest wymagana.


INNE WIADOMOŚCI


NAJCZĘŚCIEJ CZYTANE