OpenAI baru saja mengumumkan o3 dan o3 mini, model penalaran generasi berikutnya.
Dalam siaran langsung tersebut, SVP Riset Mark Chen menunjukkan kinerja o3 pada tolok ukur tertentu, dibandingkan dengan o1, seperti kompetisi matematika (96,7 persen) dan sains tingkat PhD (87,7 persen). OpenAI dan kompetisi ARC Prize juga berbagi bagaimana o3 memperoleh skor 76 persen pada benchmark ARC-AGI, yang mencakup kumpulan data baru yang belum dipublikasikan. Tolok ukur ARC-AGI dirancang untuk menguji kemampuan mempelajari keterampilan baru dan berbeda dengan cepat pada setiap tugas baru.
Tweet mungkin telah dihapus
Pengumuman ini mengakhiri maraton 12 Hari OpenAI, yang memulai debut sesuatu yang baru setiap hari. Selama 12 hari kerja terakhir, OpenAI telah meluncurkan generator video AI Sora, visi dengan Mode Suara Tingkat Lanjut, selain sejumlah produk dan fitur yang dirancang untuk menjadikan ChatGPT lebih lancar untuk digunakan dalam pekerjaan dan kehidupan sehari-hari.
Kecepatan Cahaya yang Dapat Dihancurkan
OpenAI sekarang memungkinkan Anda menelepon ChatGPT di ponsel Anda
Model mini o3 dirancang untuk menjadi model hemat biaya yang menyeimbangkan kinerja. Ini memiliki tiga tingkat upaya yang berbeda dan membatasi jumlah waktu penalaran berdasarkan tingkat kesulitan masalah. “Peningkatan biaya terhadap kinerja yang luar biasa,” kata CEO Sam Altman.
Jadi, o3 dan o3 mini telah mencapai terobosan kecerdasan yang luar biasa menurut OpenAI. Namun belum siap untuk dirilis ke publik. Namun OpenAI memberikan akses awal ke o3 dan o3 mini untuk pengujian keamanan mulai hari ini. Permohonan untuk bergabung dengan program pengujian model diterima secara bergilir dan ditutup pada 10 Januari.