Kemampuan baru Meta AI didukung oleh versi terbaru Llama, model bahasa pemrograman besar utama Meta. Model gratis yang diumumkan hari ini mungkin juga memiliki dampak yang luas, mengingat seberapa luas keluarga Llama telah diadopsi oleh para pengembang dan perusahaan rintisan.
Berbeda dengan model OpenAI, Llama dapat diunduh dan dijalankan secara lokal tanpa biaya—meskipun ada beberapa pembatasan pada penggunaan komersial skala besar. Llama juga dapat lebih mudah disempurnakan, atau dimodifikasi dengan pelatihan tambahan, untuk tugas-tugas tertentu.
Patrick Wendell, salah satu pendiri dan VP teknik di Databricks, sebuah perusahaan yang menjadi tuan rumah model AI termasuk Llama, mengatakan banyak perusahaan tertarik pada model terbuka karena memungkinkan mereka melindungi datanya sendiri dengan lebih baik.
Model bahasa yang besar semakin menjadi “multimodal,” yang berarti mereka dilatih untuk menangani audio dan gambar sebagai input serta teks. Hal ini memperluas kemampuan model dan memungkinkan pengembang untuk membangun berbagai jenis aplikasi AI baru di atasnya, termasuk apa yang disebut agen AI yang mampu melaksanakan tugas-tugas yang berguna di komputer atas nama mereka. Llama 3.2 seharusnya memudahkan pengembang untuk membangun agen AI yang dapat, misalnya, menjelajahi web, mungkin mencari penawaran untuk jenis produk tertentu ketika diberi deskripsi singkat.
“Model multimoda merupakan hal yang penting karena data yang digunakan orang dan bisnis bukan hanya teks, tetapi dapat hadir dalam berbagai format, termasuk gambar dan audio atau format yang lebih khusus seperti urutan protein atau buku besar keuangan,” kata Phillip Isola, seorang profesor di MIT. “Dalam beberapa tahun terakhir, kita telah beralih dari model bahasa yang kuat menjadi model yang juga berfungsi dengan baik pada gambar dan suara. Setiap tahun, kita melihat semakin banyak modalitas data yang dapat diakses oleh sistem ini.”
“Dengan Llama 3.1, Meta menunjukkan bahwa model terbuka akhirnya dapat menutup kesenjangan dengan model milik mereka,” kata Nathan Benaich, pendiri dan mitra umum Air Street Capital, dan penulis laporan tahunan yang berpengaruh tentang AI. Benaich menambahkan bahwa model multimoda cenderung mengungguli model teks saja yang lebih besar. “Saya bersemangat untuk melihat bagaimana 3.2 terbentuk,” katanya.
Sebelumnya hari ini, Allen Institute for AI (Ai2), sebuah lembaga penelitian di Seattle, merilis model multimoda sumber terbuka canggih yang disebut Molmo. Molmo dirilis dengan lisensi yang tidak terlalu ketat dibandingkan Llama, dan Ai2 juga merilis detail data pelatihannya, yang dapat membantu para peneliti dan pengembang bereksperimen dan memodifikasi model tersebut.
Meta mengatakan hari ini bahwa mereka akan merilis beberapa ukuran Llama 3.2 dengan kemampuan yang sesuai. Selain dua instansiasi yang lebih canggih dengan 11 miliar dan 90 miliar parameter—ukuran kompleksitas model serta ukurannya—Meta merilis versi 1 miliar dan 3 miliar parameter yang kurang canggih yang dirancang untuk bekerja dengan baik pada perangkat portabel. Meta mengatakan versi ini telah dioptimalkan untuk chip seluler berbasis ARM dari Qualcomm dan MediaTek.
Perombakan AI Meta hadir di saat yang tepat, dengan para raksasa teknologi berlomba-lomba menawarkan AI tercanggih. Keputusan perusahaan untuk merilis model-model terbaiknya secara gratis dapat memberikan keunggulan dalam menyediakan fondasi bagi banyak alat dan layanan AI—terutama saat perusahaan mulai mengeksplorasi potensi agen AI.