„Amatorskie i niebezpieczne”: o filmach stworzonych przez AI
Wyobraź sobie, że budzisz się w Rzymie 2000 lat temu, nad Nilem w starożytnym Egipcie lub na ulicach Londynu podczas epidemii Czarnej Śmierci w XIII wieku – włączając w to realistyczne widoki, dźwięki oraz codzienne zmagania. W ostatnich tygodniach na TikToku popularne stały się filmy generowane przez sztuczną inteligencję, przedstawiające wrażenia ludzi budzących się w różnych okresach historycznych. Dan i Hogne są twórcami dwóch kont – POV Lab i Time Traveller POV.

Wygenerowane przez sztuczną inteligencję filmy przedstawiające Czarną Zarazę i erupcję Wezuwiusza cieszą się ogromną popularnością na TikToku. Zdjęcie: timetravellerpov
Mieszkający w Wielkiej Brytanii Dan mówi BBC, że tworzy te filmy, ponieważ „pomysł zobaczenia przeszłości z perspektywy pierwszej osoby wydał mu się wyjątkowym sposobem na ożywienie historii”. Hogne, 27-latek z Norwegii, dodaje że jego filmy uczą ludzi „o ciekawych fragmentach historii i pomagają im nauczyć się czegoś nowego”. Mimo że filmy oferują milionom widzów wgląd w historię, wielu historyków wyraziło obawy co do dokładności treści i tego, czy sztuczna inteligencja może naprawdę „wskrzesić przeszłość”. A może oglądamy po prostu dopracowaną, unowocześnioną wersję historii zaprojektowaną z myślą o przykuwaniu uwagi?
Mroczne i zamglone ulice, kaszlący mieszkańcy miasta i odległe bicie dzwonu lekarza w ptasiej masce* – to wszystko widać w najczęściej oglądanym filmie Hogne’a. Dzieło zyskało 53 miliony wyświetleń. Wywołało to fascynację wielu osób, lecz historyczka dr Amy Boyington opisuje to wideo o tematyce średniowiecznej jako „amatorskie” oraz „sugestywne i pełne wrażeń”, a nie zgodne z faktami historycznymi.
„Wygląda jak coś z gry wideo, ponieważ pokazuje świat, który ma wyglądać realnie, ale w rzeczywistości taki nie jest”. Amy zwraca uwagę na nieścisłości, takie jak domy z dużymi przeszklonymi oknami i tory kolejowe biegnące przez miasto, które nie istniałyby w XIV wieku. Historyk i archeolog dr Hannah Platts również zauważyła istotne nieścisłości w filmie przedstawiającym erupcję Wezuwiusza w Pompejach.
„Z relacji naocznego świadka erupcji, Pliniusza Młodszego, wiemy że nie zaczęła się ona od wylania wszędzie lawy. Niewykorzystanie tak bogatego źródła informacji historycznych wydaje się być nieprofesjonalne”.
Historyczka zauważa też mniejsze błędy – nie istniały kieliszki do wina na nóżce i młynki do pieprzu, a ludzie podczas jedzenia przyjmowali pozycje półleżącą, a nie siedzącą na krzesłach w jadalni.
„Bułka pokazana na filmie to współczesny bochenek, a biorąc pod uwagę, że od tego czasu mieliśmy bochenki karbonizowane, to wielka szkoda że osoba kręcąca film nie przeprowadziła pewnych badań i nie uwzględniła ich”. Dan, który stworzył film przedstawiający Pompeje, twierdzi że wiele szczegółów w jego filmach jest nieścisłych z historycznego punktu widzenia.
„Treści generowane przez sztuczną inteligencję nie są doskonałe i chociaż dążę do dokładności, te filmy mają raczej na celu wywołanie poczucia epoki, a nie stuprocentowe odtworzenie jej realiów. Przypominają bardziej artystyczne interpretacje niż dokładne filmy dokumentalne”.
„Manipulowanie historią”
Jednak dr Boyington martwi się tym, jak te artystyczne interpretacje mogą wpłynąć na wierne odwzorowanie historii.
„To może być dość niebezpieczne, ponieważ ludzie mogą manipulować historią – na przykład ktoś może stworzyć wygenerowany przez sztuczną inteligencję film zaprzeczający istnieniu holokaustu”. Choć większość osób będzie wiedzieć, że treść filmu nie jest prawdziwa, obawa dotyczy „młodych ludzi, którzy dzięki tym filmom po raz pierwszy poznają dany okres historyczny”. Dan odrzuca te twierdzenia i twierdzi, że jego filmów „nie należy traktować jako rzeczywistego faktu historycznego”.
„Jeśli widzowie są zainteresowani, zachęcam ich do samodzielnego zgłębiania historii. Uważam, że te filmy mają raczej na celu wzbudzenie ciekawości na temat przeszłości niż zastąpienie prawdziwej edukacji historycznej”. Hogne twierdzi, że czuje się „odpowiedzialny” za tworzenie tych filmów i skupia się na tym, aby były jak najbardziej dokładne, „zwłaszcza teraz, gdy ogląda je tak wiele milionów ludzi”. Dr Platts martwi się niekontrolowanym rozprzestrzenianiem się dezinformacji, zauważając że niektórzy widzowie w komentarzach wydawali się nieświadomi, iż filmy generowane przez sztuczną inteligencję nie były oparte na faktach historycznych.
„Widzimy, że wielu uczniów korzysta obecnie ze sztucznej inteligencji, ale problematyczne jest to, że widzą coś takiego, a potem jest to powtarzane tak jakby był to fakt”. Dan twierdzi, że dba o to, aby wszystkie jego filmy były oznaczone jako stworzone przez sztuczną inteligencję, podczas gdy Hogne twierdzi, że dezinformacja istniała na długo przed sztuczną inteligencją i „ludzie muszą krytycznie myśleć o wszystkim, co oglądają”.
„Może to przynieść ogromne korzyści”
Wszyscy historycy, z którymi rozmawiało BBC, zgodzili się że filmy Dana i Hogne’a mają zalety. Doktor Boyington twierdzi, że mogą one stanowić „wstęp do historii i mogą zainspirować kogoś do przeprowadzenia własnych badań”. Natomiast profesor egiptologii, Elizabeth Frood, twierdzi że „jeśli zostanie to wykonane dokładnie i profesjonalnie, przyniesie to ogromne korzyści społeczeństwu, ponieważ zwiększa zainteresowanie historią oraz pozwala na bycie bardziej świadomym przeszłych zdarzeń”.
Barbara Keys, profesor historii Stanów Zjednoczonych na Uniwersytecie w Durham, obejrzała wygenerowany przez sztuczną inteligencję film. Przedstawiał on osobę pracującą w elektrowni jądrowej w Czarnobylu. Było to w dniu eksplozji reaktora. Chociaż widzi potencjalne zalety tych filmów, nazywa klip „czarną skrzynką”, ponieważ nie ma informacji o źródle ani jasności co do tego, jakie informacje zostały przekazane programowi sztucznej inteligencji. Mówi, że niepokojąca nieścisłość w filmie dotyczy tego, że reaktor powstał na podstawie zdjęć sprzed katastrofy, a nie po niej.
„Z powodu tego ludzie myślą, że radziecka technologia była naprawdę kiepskiej jakości, podczas gdy w rzeczywistości była bardzo zaawansowana”. Barbara uważa, że duża popularność tych filmów nie wynika z ich treści historycznych, a raczej z fascynacji opinii publicznej samą sztuczną inteligencją.
„Na filmie nie ma nic szczególnie interesującego i nie zawiera on żadnych informacji na temat wypadku ani tego, co wydarzyło się później, więc zainteresowanie musi skupiać się na tym, co może zrobić sztuczna inteligencja”.
Prof. Frood obawia się, że filmy nie zostały stworzone w sposób dokładny i wiarygodny, i podkreśla że rekonstrukcje historyczne powinny opierać się na szeroko zakrojonych badaniach i weryfikowalnych źródłach.
„Musimy krytycznie podejść do tego filmu, ponieważ nie wiemy nic o źródle z którego pochodzi ani o tym, jakie informacje zostały przekazane sztucznej inteligencji, aby ten film powstał”.
Odnosi się konkretnie do filmu z 1250 roku p.n.e. o byciu dzieckiem w Egipcie.
Pierwszą rzeczą, która ją uderzyła, było to że filmy te „homogenizują złożone oraz starożytne światy”.
„Egipt obejmuje tysiące lat i ludzie mogą nie zdawać sobie sprawy, że to tylko jeden wycinek” – wyjaśnia. Ogólnie rzecz biorąc, twierdzi, że research do filmu nie był najlepiej zrobiony i wskazała przypadek, w którym nauczyciel podczas sceny w szkole czyta hieroglify od tyłu, podczas gdy należy je odczytywać od prawej do lewej. Hogne, który stworzył wideo, twierdzi że zdaje sobie sprawę z nieścisłości historycznych w jego filmach, a to dlatego że „sztuczna inteligencja może popełnić wiele błędów, ale w przyszłości narzędzia będą lepsze”.
„Staram się je dostrzegać, gdzie tylko mogę, ale nie jestem znawcą historii, więc nie zawsze dostrzegam błąd, zwłaszcza gdy jest to coś drobnego” – dodaje.
Zapytany o brak przejrzystości materiałów źródłowych, Hogne mówi że w przyszłości mógłby rozważyć dodanie linków do źródeł, z których czerpał informacje.
„Byłoby fajnie, gdyby wszystko było w pełni dokładne, korzystając z odpowiednich źródeł, ale te filmy nagrywam sam, a utworzenie każdego z nich zajmuje osiem godzin”.
Jak tworzysz te filmy?
Hogne polega na Chacie GPT w celu uzyskania informacji na temat okresu historycznego i prosi go o informacje na temat tego, jak wyglądaliby ludzie i miejsca. Następnie generuje początkowy obraz osoby patrzącej na krajobraz i od tego momentu „potrzeba dużo prób, aby zrobić to dobrze”. Dan twierdzi, że nakręcenie każdego filmu zajmuje mu cztery godziny, a on używa „różnych narzędzi sztucznej inteligencji do generowania wysokiej jakości obrazów, animowania ich i tworzenia realistycznego dźwięku”. Ogląda filmy i czyta dokumenty, aby zdobyć wiedzę na temat okresu przed nakręceniem filmu i spróbować nadać mu „pewną historyczną dokładność”.
„Musisz przekazać sztucznej inteligencji każdy szczegół, od „tradycyjnych włoskich szat”, aż po „brukowane podłogi”. W przeciwnym razie AI samo wygeneruje przypadkowe rzeczy, których nie chcesz”.
* Lekarz, który zajmował się zarażonymi oraz ofiarami podczas epidemii dżumy, niekiedy również rejestracją zgonów. Nosił charakterystyczną maskę w kształcie głowy ptaka.
Dział: Technologia
Autor:
Yasmin Rufo | Tłumaczenie: Andrzej Wachnicki - praktykant fundacji: https://fundacjaglosmlodych.org/praktyki/