Sora mampu menciptakan “adegan kompleks dengan banyak karakter, jenis gerakan tertentu, dan detail subjek dan latar belakang yang akurat,” menurut postingan blog pengantar OpenAI.
Perusahaan juga mencatat bahwa model tersebut dapat memahami bagaimana objek “ada di dunia fisik”, serta “menafsirkan properti secara akurat dan menghasilkan karakter menarik yang mengekspresikan emosi yang hidup.”
Baca juga: ChatGPT dilengkapi memori digital untuk mengingat riwayat percakapan
Baca juga: OpenAI luncurkan GPT Store, pasar aplikasi AI yang dipersonalisasi
Model ini juga dapat menghasilkan video berdasarkan gambar diam, serta mengisi frame yang hilang pada video yang ada atau memperluasnya.
Beberapa tahun yang lalu, generator teks-ke-gambar seperti Midjourney berada di garis depan dalam kemampuan model untuk mengubah kata menjadi gambar.
Namun, perusahaan seperti Runway dan Pika telah menunjukkan model teks-ke-gambar mereka yang mengesankan, dan Lumiere Google juga menjadi salah satu pesaing utama OpenAI di bidang ini.
Mirip dengan Sora, Lumiere memberi pengguna alat teks-ke-video dan juga memungkinkan mereka membuat video dari gambar diam.
OpenAI juga menawarkan akses kepada beberapa seniman visual, desainer, dan pembuat film untuk mendapatkan umpan balik.
Perusahaan mencatat bahwa model yang ada mungkin tidak akurat dalam mensimulasikan fisika adegan yang kompleks dan mungkin tidak memahami dengan benar beberapa kasus sebab-akibat.
Awal bulan ini, OpenAI mengumumkan bahwa mereka menambahkan tanda air (watermark) ke alat teks-ke-gambar mereka, DALL-E 3, tetapi mencatat bahwa tanda air tersebut "dapat dengan mudah dihapus".
Baca juga: OpenAI tunda peluncuran toko GPT kustom hingga awal 2024
Baca juga: OpenAI dilaporkan sedang kumpulkan pendanaan Rp1,5 kuadriliun
Penerjemah: Fathur Rochman
Editor: Zita Meirina
Copyright © ANTARA 2024