22.02.2023 JPM Redakcja

Generatywne narzędzia sztucznej inteligencji, takie jak ChatGPT i Dall-E są wszędzie

Rewolucję wygeneruje sztuczna inteligencja. Najprawdopodobniej.

Systemy generatywne wykorzystują sztuczną inteligencję do tworzenia wszystkiego, od obrazów po projekty budynków. | Źródło: Domena publiczna

Ponad siedem lat temu CNET zaprosił czytelników do pomocy w napisaniu noweli science fiction . Wysiłki crowdsourcingowe trwały kilka miesięcy i obejmowały wkład dziesiątek pisarzy-wolontariuszy, i redaktorów z całego świata. Dzisiaj moglibyśmy wygenerować spójną historię o porównywalnej długości w zaledwie kilka godzin — a może tylko kilka minut z odpowiednimi podpowiedziami — przy użyciu generatywnych narzędzi sztucznej inteligencji, takich jak ChatGPT , które szturmem podbiły świat w ostatnich miesiącach.

Jeszcze bardziej szalone: ilustracje stworzone przez artystów z CNET i inne osoby do naszej noweli z crowdsourcingu można było dziś wykonać za pomocą narzędzi sztucznej inteligencji, takich jak Dall-E 2, w ciągu kilku minut, a niewielu zauważyłoby różnicę (sztuczka polega na tym, aby nie patrzeć na palce — o tym później).

ChatGPT stał się już jednym z najszybciej wdrażanych nowych produktów technologicznych w historii. Prawdopodobnie słyszałeś o tym, że jest używany do redagowania wszystkiego, od e-maili i listów motywacyjnych po zadania szkolne. Tymczasem podobne modele mogą generować nie tylko obrazy w niezliczonych stylach, ale także wideo, a nawet muzykę .

Trudno przypomnieć sobie coś, co wywołało większy szum, od czasu Siri lub iPhone'a. Jeszcze trudniej jest nadążyć za tym wszystkim, więc oto kilka szybkich odpowiedzi na wszystkie najbardziej palące pytania dotyczące generatywnej sztucznej inteligencji.

Co to jest?

Pomimo tego, co mogą powiedzieć niektórzy inżynierowie Google , chatboty, takie jak ChatGPT OpenAI czy nowy bot Bing Microsoftu , który najwyraźniej nazywa się Sydney, nie są świadome. To, co doprowadziło nas do tego punktu, nie jest magią ani złym spiskiem mającym na celu zniewolenie nas wszystkich. Jest to raczej produkt skomplikowanej matematyki, kodu, danych o wartości bibliotek i dużej mocy obliczeniowej.

Platformy są oparte na tak zwanych dużych modelach językowych (LLM) lub czasami generatywnych modelach językowych lub modelach językowych transformatorów — GPT w ChatGPT oznacza „generatywny wstępnie wyszkolony transformator”. Są to systemy uczenia maszynowego, które przetwarzają dane o wartości terabajtów, często po prostu zeskrobane bezpośrednio z Internetu, odnotowując wzorce i powiązania w zbiorze danych, który nazywa się danymi treningowymi.

W przypadku ChatGPT wystarczą zestawy danych tekstowych. Generatory obrazów, takie jak Dall-E, Stable Diffusion i Midjourney, są szkolone, patrząc na bogactwo obrazów i ucząc się, czym one są, czytając towarzyszące im podpisy, więc modele nadal polegają na języku.

**Ten obraz jest wynikiem poproszenia Dall-E 2 o „namaluj mi obraz Dall-E malującego obraz Dall-E malującego obraz”.** | Źródło: Eric Mack/CNET/Dall-E 2

Sieć neuronowa to rodzaj systemu uczenia maszynowego, który można trenować na tonach danych, a następnie wyciągać wnioski z wzorców. Taka sieć neuronowa nie jest niczym nowym. To, co dzieje się z publicznie dostępnymi systemami generatywnymi, które zadebiutowały w zeszłym roku, polega na tym, że wzorce te nie tylko się uczą, ale są również łączone z drugą siecią neuronową, która dokonuje inżynierii wstecznej procesu tworzenia treści i porównuje ją z pierwszą siecią neuronową aby upewnić się, że pasuje do monitu podanego do systemu.

W istocie dajesz ChatGPT lub Dall-E monit, a oni formułują odpowiedź, przewidując, jakie powinno być następne słowo (lub piksel w przypadku obrazu) na podstawie wszystkich wzorców i skojarzeń zebranych z danych szkoleniowych.

Co jeszcze mogą zrobić LLM?

Oprócz generowania tekstu i obrazów inne systemy sztucznej inteligencji, takie jak Gen1 firmy Runway i Make-a-Video firmy Meta , generują efekty wideo, filtry i całe sceny w podobny sposób.

Niedawno dział badawczy Google wydał wczesną wersję MusicLM , która może pobierać podpowiedzi tekstowe i przekształcać je w próbki muzyki. Wyniki są imponujące.

Systemy generatywne są również wykorzystywane do tworzenia kodu i projektów 3D dla wszelkiego rodzaju obiektów, od ubrań po budynki. Teoretycznie, jeśli istnieje forma lub nośnik treści, a nawet tylko zbiór danych wystarczający do szkolenia sztucznej inteligencji, to sztuczna inteligencja powinna być w stanie samodzielnie generować tego rodzaju treści.

IBM wykorzystuje systemy generatywne do opracowywania nowych półprzewodników i cząsteczek, które mogą pomóc w walce z rakiem lub infekcją bakteryjną. Może nie być ograniczeń co do tego, co można wygenerować, co jest jednocześnie ekscytujące i trochę przerażające.

Jak mogę użyć tych rzeczy?

Istnieje prawdopodobnie szybko rosnąca bańka sztucznej inteligencji, a startupy nagle twierdzą, że używają sztucznej inteligencji do generowania wszystkiego, od większej liczby e-maili ze spamem dla potencjalnych klientów po całe filmy marketingowe. Ludzie z pewnością dobrze bawią się z chatbotami i generatorami obrazów, a niektórzy twórcy uważają te narzędzia za pomocne podczas pracy nad koncepcjami lub wczesnymi szkicami nowych prac.

Sąsiadujące formy sztucznej inteligencji po cichu zrewolucjonizowały takie rzeczy, jak prognozowanie pogody i analiza obrazowania medycznego .

Rzadko wspominaną zaletą obecnego stanu sztucznej inteligencji jest to, że jest niezwykle dobra w rzeczach, których ukończenie zajęłoby ludziom lata, takich jak przetwarzanie całego kanonu określonego ruchu literackiego lub artystycznego lub grokowanie struktury tonalnej określonego gatunku muzycznego. Jednocześnie niektóre słabe punkty sztucznej inteligencji — rozumienie złożonych kontekstów, działanie w nieprzewidywalny lub innowacyjny sposób oraz ocena emocji lub bodźców sensorycznych — to rzeczy, w których ludzie przodują przy niewielkim lub żadnym wysiłku.

Wiele zastosowań tej technologii może polegać na nowych sposobach współpracy ze sztuczną inteligencją w celu podkreślenia tego, co biologiczna i sztuczna inteligencja potrafią najlepiej.

Skąd możesz mieć pewność, że nie jest świadomy?

Proste, naprawdę: informacja nie jest wiedzą. LLM to coś w rodzaju posiadania bibliotekarza referencyjnego, który może wykraczać poza zwykłe wskazanie właściwej sekcji biblioteki — może zacytować dowolny wiersz z dowolnej książki w bibliotece, ponieważ przeczytała i zapamiętała je wszystkie. Ale jest problem. Ta pozornie idealna bibliotekarka nigdy nie robiła nic innego, tylko czytała wszystko w bibliotece.

Jej brak doświadczenia życiowego utrudnia jej prawidłową interpretację kontekstów, podtekstów, intencji i innych mniej niż dosłownych niuansów kryjących się za każdym połkniętym słowem. Co gorsza: To samo dotyczy jej umiejętności prawidłowego rozumienia pytań i podpowiedzi, które otrzymuje od czytelników biblioteki. Dlatego często się myli.

To tak, jakby całość słowa pisanego została zapamiętana przez jedną osobę gotową odpowiedzieć na nasze pytania o wszystko. Jedynym haczykiem jest to, że osoba ta jest również kosmitą.

Wielu użytkowników ChatGPT zauważyło częste błędy merytoryczne i niespójności w odpowiedziach udzielanych przez system. Dzieje się tak dlatego, że jest wyszkolony na bogactwie danych, które nie zostały zweryfikowane pod kątem faktów, i sam nie sprawdza faktów, po prostu przewiduje, jakie słowo powinno być następne na podstawie wszystkiego, co przeczyta. To dosłownie nie ma zdrowego rozsądku. Może to prowadzić do błędów, których sam CNET doświadczył podczas korzystania z generatywnego modelu AI.

Dziwne rzeczy dzieją się również z generatorami obrazów, które mają między innymi trudności z liczeniem. Figury z niewłaściwą liczbą palców są komicznie powszechne.

Nie patrz zbyt blisko na ręce lub twarz. Obraz jest wynikiem próby wydobycia autoportretu z Dall-E 2 z monitem „dziennikarz Eric Mack pisze o generatywnej sztucznej inteligencji za pomocą swojego laptopa w kawiarni”. | Źródło: Eric Mack/CNET/Dall-E 2

Więc są problemy, prawda?

Istnieje ryzyko, że każda nowa technologia i narzędzie będzie wykorzystywane do złych celów , a w przypadku sztucznej inteligencji wciąż jest wiele niewiadomych, co czyni ją nieco bardziej przerażającą. Prawdopodobnie słyszałeś już obawy nauczycieli, którzy widzieli, jak uczniowie przesyłają zadania generowane przez sztuczną inteligencję, lub pisarzy i innych twórców zaniepokojonych zastąpieniem przez sztuczną inteligencję, która działa taniej i szybciej niż ludzie.

Wszystkie te obawy są uzasadnione i być może wskazują na nową rzeczywistość, w której musimy zapoznać się z niektórymi informacjami, że treść została wygenerowana przez sztuczną

Dział: Nauka Nauki Ścisłe Technologia

Autor:
Eryk Mack | tłumaczenie Joanna Gańska

Źródło:
https://www.cnet.com/science/generative-ai-tools-like-chatgpt-and-dall-e-are-everywhere-what-you-need-to-know/