19.02.2024 JPM Redakcja

Od teraz OpenAI umożliwi tworzenie filmów za pomocą słownych instrukcji

(CNN) - Lider wśród organizacji zajmujących się sztuczną inteligencją, OpenAI, przedstawił nowy model sztucznej inteligencji o nazwie Sora, który ma umożliwić tworzenie realistycznych 60-sekundowych filmów przy pomocy krótkich zapytań tekstowych.

Powyższy wygenerowany przez sztuczną inteligencję obraz z filmu OpenAI Sora przedstawia futrzaste mamuty stąpające po śniegu.

W środę firma zamieściła post w którym poinformowała, że model Sora jest w stanie generować filmy o długości do 60-ciu sekund przy pomocy zapytań tekstowych. Sora może wygenerować filmy z wieloma postaciami naraz, określonym rodzajem ruchu, a także szczegółowymi detalami tła.

,,Model rozumie nie tylko to, o co prosi użytkownik w swoich instrukcjach, ale również jak te rzeczy wyglądają w prawdziwym świecie,” informuje wpis.

Organizacja OpenAI oświadczyła, że zamierza nauczyć modelu AI ,,pomagać ludziom rozwiązywać problemy wymagające interakcji w świecie rzeczywistym.”

Sora jest najnowszym dziełem organizacji odpowiedzialnej za popularny chatbot ChatGPT i pozwala sztucznej inteligencji na dalszy rozwój. Jak wiadomo, “modele multimodalne” nie są już tak nowe, a modele konwersji tekstu do wideo już istnieją. Jednak według Reece’a Haydena, starszego analityka w firmie ABI Research zajmującej się badaniem rynku, ten model wyróżnia długość i dokładność tworzonych filmów, co według OpenAI ma w sobie Sora.

Jak informuje Hayden, tego typu modele AI mogą mieć duży wpływ na rynek rozrywki cyfrowej dzięki nowej, spersonalizowanej treści pojawiającej się na róznych kanałach.

,,Jedno z bardziej oczywistych zastosowań to telewizja; tworzenie krótkich scen mających na celu nadanie głębi narracji,” poinformował Hayden. ,,Ten model jest nadal ograniczony, ale pokazuje w jakim kierunku zmierza rynek.”

Jednocześnie organizacja OpenAI zaznaczyła, że Sora jest nadal w procesie tworzenia i ma znaczącą ,,wadę”, szczególnie jeśli chodzi o detale przestrzenne w instrukcjach - myli stronę prawą i lewą - a także przyczynę i skutek. Jako przykład takiego problemu organizacja podała tworzenie filmu osoby, która je ciastko, ale nie pozostaje na nim ślad ugryzienia.

OpenAI aktualnie skupia się na bezpieczeństwie. Organizacja zapewniła, że planuje pracować z grupą ekspertów aby przetestować najnowszy model i przyjrzeć się różnym obszarom, takim jak dezinformacja, nienawistne treści, czy uprzedzenia. Organizacja tworzy również narzędzia mające na celu wykrycie informacji, które mogą wprowadzić w błąd.

Model Sora zostanie udostępniony najpierw specjalistom do spraw cyberbespieczeństwa nazywanych ,,red teamers,” którzy będą mogli wykryć wszelkie ryzyka i szkody związane z używaniem modelu. Dostęp otrzymają również artyści wizualni, projektanci i twórcy filmowy w celu dowiedzenia się, jak profesjonalni twórcy mogą korzystać z tego narzędzia.

Ostatnia aktualizacja dotyczy rozwijania narzędzia ChatGPT przez OpenAI.

W tym tygodniu organizacja poinformowała, że testuje nową funkcję, dzięki której użytkownicy będą mogli kontrolować pamięć narzędzia ChatGPT i prosić je o zapamiętanie odbytej rozmowy, co pozwoli na bardziej spersonalizowane konwersacje w przyszłości, lub zapomnienie jej.

Dział: Technologia

Autor:
Samantha Murphy Kelly | Tłumaczenie: Paulina Nowak

Źródło:
https://edition.cnn.com/2024/02/15/tech/openai-text-to-video-sora/index.html