Meta Llama di Amazon Bedrock

Bangun masa depan AI dengan Llama

Memperkenalkan Llama 4

Model Llama 4 menandai awal era baru bagi ekosistem Llama, dengan menghadirkan generasi Llama yang paling dapat diskalakan. Dengan multimodalitas native, arsitektur mixture-of-experts, jendela konteks yang diperluas, peningkatan kinerja yang signifikan, dan efisiensi komputasi yang dioptimalkan, Llama 4 direkayasa untuk memenuhi beragam persyaratan aplikasi. Model Llama 4 hadir dalam ukuran yang mudah di-deploy, sehingga dapat diadaptasikan untuk berbagai kasus penggunaan.

Llama 4 Maverick 17B

Llama 4 Maverick adalah model multimodal native untuk pemahaman gambar dan teks menggunakan kecerdasan lanjutan dan respons cepat dengan biaya rendah.

Llama 4 Scout 17B

Llama 4 Scout adalah model multimodal native yang mengintegrasikan kecerdasan teks dan visual lanjutan dengan kemampuan pemrosesan yang efisien. Model ini memungkinkan analisis multidokumen yang komprehensif, penalaran basis kode yang kuat, dan pemrosesan data yang canggih melalui penanganan konteksnya yang luas.

Manfaat

Llama 3.2 menawarkan pengalaman AI yang lebih dipersonalisasi dan pemrosesan di perangkat. Model Llama 3.2 dirancang agar lebih efisien, dengan pengurangan latensi dan peningkatan kinerja, sehingga cocok untuk berbagai penerapan.
Panjang konteks 128 Ribu memungkinkan Llama menangkap hubungan yang lebih bervariasi dalam data.
Model Llama dilatih pada lebih dari 15 triliunan token dari sumber data publik online untuk lebih memahami seluk-beluk bahasa.
Llama 3.2 tersedia dalam berbagai bahasa dan mendukung delapan bahasa, termasuk Bahasa Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thailand.
API terkelola milik Amazon Bedrock membuat penggunaan model Llama lebih mudah dari sebelumnya. Organisasi dari semua ukuran dapat mengakses keunggulan Llama tanpa khawatir tentang infrastruktur yang mendasarinya. Karena Amazon Bedrock bersifat nirserver, Anda tidak perlu mengelola infrastruktur apa pun, dan Anda dapat mengintegrasikan serta melakukan deployment kemampuan AI generatif Llama dengan aman ke dalam aplikasi Anda menggunakan layanan AWS yang sudah Anda ketahui. Artinya, Anda dapat fokus pada keahlian terbaik Anda—membangun aplikasi AI Anda.

Temui Llama

Selama lebih dari satu dekade terakhir, Meta telah berfokus untuk menyediakan alat bagi developer dan membina kolaborasi serta kemajuan di antara para developer, peneliti, dan organisasi. Model Llama tersedia dalam berbagai ukuran parameter, yang memungkinkan developer untuk memilih model yang paling sesuai dengan kebutuhan dan anggaran inferensi mereka. Model Llama di Amazon Bedrock membuka banyak sekali kemungkinan karena developer tidak perlu khawatir mengenai skalabilitas atau pengelolaan infrastruktur. Amazon Bedrock adalah cara turnkey yang sangat sederhana bagi developer untuk mulai menggunakan Llama.

Kasus penggunaan

Model Llama unggul dalam pemahaman gambar dan penalaran visual, nuansa bahasa, pemahaman kontekstual, dan tugas kompleks, seperti analisis data visual, pembuatan keterangan gambar, pembuatan dialog, dan penerjemahan, serta dapat menangani tugas multilangkah dengan mudah. Kasus penggunaan tambahan model Llama sangat cocok untuk tugas-tugas tertentu, seperti penalaran dan pemahaman visual yang canggih, pengambilan teks dari gambar, landasan visual, jawaban pertanyaan visual dokumen, peringkasan dan akurasi teks, klasifikasi teks, analisis sentimen dan penalaran nuansa, pemodelan bahasa, sistem dialog, pembuatan kode, dan mengikuti instruksi.

Versi model

Llama 4 Maverick 17B

Model tujuan umum yang memiliki 128 ahli dan total 400 miliar parameter. Model ini unggul dalam pemahaman teks dalam 12 bahasa dan pemahaman gambar dalam bahasa Inggris, yang membuatnya cocok untuk aplikasi asisten dan obrolan serbaguna.

Maks. token: 1 juta

Bahasa: Inggris, Prancis, Jerman, Hindi, Italia, Portugis, Spanyol, Thai, Arab, Indonesia, Tagalog, dan Vietnam; [image] hanya bahasa Inggris

Dukungan penyempurnaan: Tidak

Kasus penggunaan yang didukung: Aplikasi asisten dan obrolan multibahasa berkualitas tinggi dengan pemahaman gambar, bantuan pengodean, dan pemahaman dokumen untuk ekstraksi data yang terstruktur, dukungan pelanggan dengan kemampuan analisis gambar, pembuatan konten kreatif dalam berbagai bahasa, serta aplikasi penelitian yang membutuhkan analisis teks dan integrasi data multimodal

Baca blog

Llama 4 Scout 17B

Model multimodal tujuan umum yang memiliki 16 ahli, 17 miliar parameter aktif, dan total 109 miliar parameter. Jendela konteksnya yang berjumlah jutaan memungkinkan analisis multidokumen yang komprehensif, sehingga membuat model ini sangat kuat dan efisien di kelasnya.

Maks. token: 3,5 juta (10 juta segera hadir)

Bahasa: Inggris, Prancis, Jerman, Hindi, Italia, Portugis, Spanyol, Thai, Arab, Indonesia, Tagalog, dan Vietnam; [image] hanya bahasa Inggris

Dukungan penyempurnaan: Tidak

Kasus penggunaan yang didukung: Aplikasi obrolan yang membutuhkan respons berkualitas tinggi dan pemahaman gambar dalam konteks multibahasa, bantuan pengodean dan kecerdasan dokumen untuk mengekstraksi data yang terstruktur, dukungan pelanggan dengan kemampuan analisis gambar, pembuatan konten kreatif dalam berbagai bahasa,serta aplikasi penelitian yang membutuhkan integrasi data multimodal

Baca blog

Llama 3.3 70B

Model 70B khusus teks yang disesuaikan berdasarkan instruksi yang memberikan performa yang ditingkatkan dibandingkan Llama 3.1 70B, dan Llama 3.2 90B saat digunakan untuk aplikasi khusus teks. Llama 3.3 70B memberikan performa yang serupa dengan Llama 3.1 405B, tetapi hanya membutuhkan sebagian kecil sumber daya komputasi.

Token maks.: 128.000

Bahasa: Inggris, Jerman, Prancis, Italia, Portugis, Spanyol, dan Thai

Dukungan penyempurnaan: Tidak

Kasus penggunaan yang didukung: AI percakapan yang didesain untuk pembuatan konten, aplikasi korporasi, dan penelitian, yang menawarkan kemampuan pemahaman bahasa tingkat lanjut, termasuk peringkasan teks, klasifikasi, analisis sentimen, dan pembuatan kode. Model tersebut juga mendukung kemampuan untuk memanfaatkan output model agar dapat meningkatkan model lain, termasuk pembuatan data sintetis dan distilasi

Baca blog

Llama 3.2 90B

Model multimodal yang mengambil input dan output teks serta gambar. Ideal untuk aplikasi yang membutuhkan kecerdasan visual canggih, seperti analisis gambar, pemrosesan dokumen, chatbot multimodal, dan sistem otonom.

Token maks.: 128.000

Bahasa: Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thai

Dukungan penyempurnaan: Ya

Kasus penggunaan yang didukung: Pemahaman gambar, penalaran visual, dan interaksi multimodal, yang memungkinkan aplikasi tingkat lanjut, seperti pembuatan takarir gambar, pengambilan gambar-teks, landasan visual, jawaban pertanyaan visual, dan jawaban pertanyaan visual dokumen, dengan kemampuan unik untuk bernalar serta menarik kesimpulan dari input visual dan tekstual

Baca blog

Llama 3.2 11B

Model multimodal yang mengambil input dan output teks serta gambar. Ideal untuk aplikasi yang membutuhkan kecerdasan visual canggih, seperti analisis gambar, pemrosesan dokumen, dan chatbot multimodal.

Token maksimum: 128 ribu

Bahasa: Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thailand.

Dukungan penyempurnaan: Ya

Kasus penggunaan yang didukung: Pemahaman gambar, penalaran visual, dan interaksi multimodal, yang memungkinkan aplikasi tingkat lanjut, seperti pembuatan takarir gambar, pengambilan gambar-teks, landasan visual, jawaban pertanyaan visual, dan jawaban pertanyaan visual dokumen

Baca blog

Llama 3.2 3B

Model ringan khusus teks yang dibuat untuk memberikan hasil yang sangat akurat dan relevan. Dirancang untuk aplikasi yang membutuhkan inferensi latensi rendah dan sumber daya komputasi terbatas. Ideal untuk kueri dan penulisan ulang prompt, asisten penulisan bertenaga AI seluler, dan aplikasi layanan pelanggan, terutama pada perangkat edge di mana efisiensi dan latensi rendahnya memungkinkan integrasi tanpa kendala ke dalam berbagai aplikasi, termasuk asisten penulisan bertenaga AI seluler dan chatbot layanan pelanggan.

Token maks.: 128.000

Bahasa: Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thai

Dukungan penyempurnaan: Ya

Kasus penggunaan yang didukung: Pembuatan teks tingkat lanjut, peringkasan, analisis sentimen, kecerdasan emosional, pemahaman kontekstual, dan penalaran akal sehat

Baca blog

Llama 3.2 1B

Model ringan khusus teks yang dibuat untuk memberikan respons yang cepat dan akurat. Ideal untuk perangkat edge dan aplikasi seluler. Model ini mengaktifkan kemampuan AI di perangkat sambil menjaga privasi pengguna dan meminimalkan latensi.

Token maks.: 128.000

Bahasa: Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thai

Dukungan penyempurnaan: Ya

Kasus penggunaan yang didukung: Kasus penggunaan dialog multibahasa, seperti manajemen informasi pribadi, pengambilan pengetahuan multibahasa, dan tugas penulisan ulang

Baca blog

Llama 3.1 405B

Ideal untuk aplikasi tingkat korporasi, penelitian dan pengembangan, pembuatan data sintetis, serta distilasi model. Dengan kemampuan inferensi yang dioptimalkan untuk latensi yang tersedia dalam pratinjau publik, model ini memberikan performa dan skalabilitas yang luar biasa, sehingga memungkinkan organisasi mempercepat inisiatif AI mereka sekaligus mempertahankan output berkualitas tinggi di berbagai kasus penggunaan.

Token maks.
: 128.000

Bahasa: Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thai

Dukungan penyempurnaan: Tidak

Kasus penggunaan yang didukung: Pengetahuan umum, pembuatan teks bentuk panjang, penerjemahan mesin, pemahaman kontekstual yang ditingkatkan, penalaran dan pengambilan keputusan tingkat lanjut, penanganan ambiguitas dan ketidakpastian yang lebih baik, peningkatan kreativitas dan keragaman, kemampuan pengendalian, matematika, penggunaan alat bantu, penerjemahan multibahasa, serta pengodean

Baca blog

Lama 3.1 70B

Ideal untuk pembuatan konten, AI percakapan, pemahaman bahasa, pengembangan penelitian, dan aplikasi korporasi. Dengan kemampuan inferensi latensi yang dioptimalkan baru yang tersedia di pratinjau publik, model ini menetapkan tolok ukur performa baru untuk solusi AI yang memproses input teks ekstensif, sehingga memungkinkan aplikasi merespons lebih cepat dan menangani kueri yang lebih lama dengan lebih efisien.

Token maks.: 128.000

Bahasa: Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thai

Dukungan penyempurnaan: Ya

Kasus penggunaan yang didukung: Peringkasan teks, klasifikasi teks, analisis sentimen, dan penerjemahan bahasa

Baca blog

Lama 3.1 8B

Ideal untuk daya dan sumber daya komputasi yang terbatas, waktu pelatihan yang lebih cepat, dan perangkat edge.

Token maks.: 128.000

Bahasa: Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thai

Dukungan penyempurnaan: Ya

Kasus penggunaan yang didukung: Peringkasan teks, klasifikasi teks, analisis sentimen, dan penerjemahan bahasa

Baca blog

Llama 3 70B

Ideal untuk pembuatan konten, AI percakapan, pemahaman bahasa, pengembangan penelitian, dan aplikasi perusahaan. 

Token maksimum: 8K

Bahasa: Inggris

Dukungan penyempurnaan: Tidak

Kasus penggunaan yang didukung: Peringkasan dan akurasi teks, klasifikasi dan nuansa teks, analisis sentimen dan penalaran nuansa, pemodelan bahasa, sistem dialog, pembuatan kode, serta mengikuti instruksi

Baca blog

Llama 3 8B

Ideal untuk daya komputasi dan sumber daya terbatas, waktu pelatihan yang lebih cepat, dan perangkat edge.

Token maksimum: 8K

Bahasa: Inggris

Penyempurnaan didukung: Tidak

Kasus penggunaan yang didukung: Ringkasan teks, klasifikasi teks, analisis sentimen, dan terjemahan bahasa

Baca blog

Lama 2 70B

Model yang disempurnakan dalam ukuran parameter 70B. Cocok untuk tugas skala besar, seperti pemodelan bahasa, pembuatan teks, dan sistem dialog.

Token maksimum: 4 ribu

Bahasa: Inggris

Penyempurnaan didukung: Ya

Kasus penggunaan yang didukung: Obrolan seperti asisten

Baca blog

Llama 2 13B

Model yang disempurnakan dalam ukuran parameter 13B. Cocok untuk tugas skala kecil, seperti klasifikasi teks, analisis sentimen, dan terjemahan bahasa.

Token maksimum: 4 ribu

Bahasa: Inggris

Penyempurnaan didukung: Ya

Kasus penggunaan yang didukung: Obrolan seperti asisten

Baca blog

Nomura menggunakan model Llama dari Meta di Amazon Bedrock untuk mendemokratisasikan AI generatif

 

Aniruddh Singh, Nomura's Executive Director dan Enterprise Architect, menguraikan perjalanan lembaga keuangan untuk mendemokratisasikan AI generatif di seluruh perusahaan menggunakan model Amazon Bedrock dan Llama dari Meta. Amazon Bedrock memberikan akses penting ke model fondasi terkemuka seperti Llama, yang memungkinkan integrasi tanpa kendala. Llama menawarkan manfaat utama bagi Nomura, yang meliputi inovasi yang lebih cepat, transparansi, pagar pembatas bias, dan performa yang tangguh di seluruh ringkasan teks, pembuatan kode, analisis log, dan pemrosesan dokumen. 

TaskUs merevolusi pengalaman pelanggan menggunakan model Llama dari Meta di Amazon Bedrock

TaskUs, yang merupakan penyedia layanan digital pengalihdayaan dan pengalaman pelanggan generasi berikutnya yang terkemuka untuk perusahaan paling inovatif di dunia, membantu kliennya merepresentasikan, melindungi, dan mengembangkan merek mereka. Platform TaskGPT inovatif milik TaskUs, yang ditenagai oleh model Amazon Bedrock dan Llama dari Meta, memberdayakan rekan satu tim untuk memberikan layanan yang luar biasa. TaskUs membangun alat di TaskGPT yang memanfaatkan Amazon Bedrock dan Llama untuk parafrasa yang hemat biaya, pembuatan konten, pemahaman, dan penanganan tugas yang kompleks.