Khatulistiwahits—OpenAI merilis model GPT-4o Mini yang diklaim lebih ringan dan lebih murah bagi para pengembang untuk mengutak-atiknya. Harganya jauh lebih murah daripada model berukuran penuh dan dikatakan lebih mampu daripada GPT-3.5.
Membangun aplikasi menggunakan model OpenAI dapat menghabiskan biaya yang sangat besar. Pengembang yang tidak memiliki kemampuan untuk mengutak-atiknya bisa jadi tidak tertarik untuk membelinya dan memilih model yang lebih murah seperti Gemini 1.5 Flash dari Google atau Claude 3 Haiku dari Anthropic. Sekarang, OpenAI memasuki permainan model ringan.
Mengutip The Verge, Olivier Godement mengatakan “Saya rasa GPT-4o Mini benar-benar sesuai dengan misi OpenAI untuk membuat AI dapat diakses secara luas oleh masyarakat. Jika kita ingin AI bermanfaat bagi setiap sudut dunia, setiap industri, setiap aplikasi, kita harus membuat AI jauh lebih terjangkau,” ujar pemimpin produk platform API tersebut.
Mulai hari ini, pengguna ChatGPT dengan paket Free, Plus, dan Team dapat menggunakan GPT-4o Mini daripada GPT-3.5 Turbo, dan pengguna Enterprise akan mendapatkan aksesnya minggu depan. Itu berarti GPT-3.5 tidak akan lagi menjadi pilihan bagi pengguna ChatGPT, tetapi akan tetap tersedia bagi pengembang melalui API jika mereka memilih untuk tidak beralih ke GPT-4o Mini. Godement mengatakan bahwa GPT-3.5 akan dihentikan dari API pada suatu saat nanti – mereka tidak tahu kapan.
Model baru yang ringan ini juga akan mendukung teks dan penglihatan dalam API, dan perusahaan mengatakan bahwa ia akan segera menangani semua input dan output multimodal seperti video dan audio. Dengan semua kemampuan ini, ini bisa terlihat seperti asisten virtual yang lebih mumpuni yang dapat memahami rencana perjalanan Anda dan membuat saran. Namun, model ini dimaksudkan untuk tugas-tugas sederhana, jadi tidak ada yang benar-benar membuat Siri dengan harga murah.
Baca juga: Machine Learning Bisa Buat Analisis Risiko Bisnis
Model baru ini meraih skor 82 persen pada Measuring Massive Multitask Language Understanding (MMLU), sebuah ujian tolok ukur yang terdiri dari sekitar 16.000 pertanyaan pilihan ganda di 57 mata pelajaran akademis. Ketika MMLU pertama kali diperkenalkan pada tahun 2020, sebagian besar model sangat buruk dalam hal ini, yang merupakan tujuan dari ujian ini karena model-model tersebut sudah terlalu canggih untuk ujian tolok ukur sebelumnya. GPT-3.5 mendapat skor 70 persen pada tolok ukur ini, GPT-4o mendapat skor 88,7 persen, dan Google mengklaim Gemini Ultra memiliki skor tertinggi yang pernah ada, yaitu 90 persen. Sebagai perbandingan, model pesaingnya, Claude 3 Haiku dan Gemini 1.5 Flash, masing-masing mendapat skor 75,2 persen dan 78,9 persen.
Diketahui bahwa para peneliti mewaspadai tes tolok ukur seperti MMLU, karena cara pelaksanaannya sedikit berbeda dari satu perusahaan ke perusahaan lainnya. Hal ini membuat skor model yang berbeda sulit untuk dibandingkan, seperti yang dilaporkan oleh The New York Times. Ada juga masalah AI yang berpotensi memiliki jawaban-jawaban ini di dalam kumpulan datanya, yang pada dasarnya memungkinkannya untuk menipu, dan biasanya tidak ada evaluator pihak ketiga yang terlibat dalam prosesnya.
OpenAI Sebut Aplikasi AI Yang Ringan Dan Murah Buat Para Pengembang
Bagi para pengembang yang ingin membangun aplikasi AI dengan harga murah, peluncuran GPT-4o Mini memberi mereka alat lain untuk ditambahkan ke inventaris mereka. OpenAI mengizinkan startup teknologi finansial Ramp menguji model ini, menggunakan GPT-4o Mini untuk membuat alat yang mengekstrak data pengeluaran pada tanda terima. Jadi, alih-alih mengetik di kotak teks, pengguna bisa mengunggah gambar tanda terima mereka dan model ini akan menyortir semuanya untuk mereka. Superhuman, sebuah klien email, juga menguji GPT-4o Mini dan menggunakannya untuk membuat fitur saran otomatis untuk tanggapan email.
Baca Juga: Nvidia dan AMD Siap Luncurkan Laptop Gaming dengan Fitur AI Copilot Plus
Tujuannya adalah untuk menyediakan sesuatu yang ringan dan murah bagi para pengembang untuk membuat semua aplikasi dan alat yang tidak dapat mereka buat dengan model yang lebih besar dan lebih mahal seperti GPT-4. Banyak pengembang akan beralih ke Claude 3 Haiku atau Gemini 1.5 Flash sebelum membayar biaya komputasi yang diperlukan untuk menjalankan salah satu model yang paling kuat.
Jadi, apa yang membuat OpenAI membutuhkan waktu begitu lama? Godement mengatakan bahwa hal ini merupakan “prioritas murni” karena perusahaan berfokus untuk menciptakan model yang lebih besar dan lebih baik seperti GPT-4, yang membutuhkan banyak “sumber daya manusia dan upaya komputasi.” Seiring berjalannya waktu, OpenAI melihat tren pengembang yang ingin menggunakan model yang lebih kecil, sehingga perusahaan memutuskan bahwa sekaranglah waktunya untuk menginvestasikan sumber dayanya untuk membangun GPT-4o Mini.(**)