🚨 Apple baru saja merilis FastVLM di Hugging Face - VLM real-time 0.5, 1.5 dan 7B dengan dukungan 🤯 WebGPU
> 85x lebih cepat dan 3,4x lebih kecil dari VLM berukuran sebanding
> TTFT 7,9x lebih cepat untuk model yang lebih besar
> dirancang untuk menghasilkan lebih sedikit token output dan mengurangi waktu pengkodean untuk gambar resolusi tinggi
Bonus: bekerja secara REALTIME langsung di browser Anda yang didukung oleh transformers.js dan WebGPU 🔥
Cobalah di demo di bawah ini 👇
🚨 Apple baru saja merilis FastVLM di Hugging Face - VLM real-time 0.5, 1.5 dan 7B dengan dukungan 🤯 WebGPU
> 85x lebih cepat dan 3,4x lebih kecil dari VLM berukuran sebanding
> TTFT 7,9x lebih cepat untuk model yang lebih besar
> dirancang untuk menghasilkan lebih sedikit token output dan mengurangi waktu pengkodean untuk gambar resolusi tinggi
Bonus: bekerja secara REALTIME langsung di browser Anda yang didukung oleh transformers.js dan WebGPU 🔥
Cobalah di demo di bawah ini 👇
BARU: Apple merilis FastVLM dan MobileCLIP2 di Hugging Face! 🤗
Modelnya hingga 85x lebih cepat dan 3,4x lebih kecil dari pekerjaan sebelumnya, memungkinkan aplikasi VLM waktu nyata! 🤯
Bahkan dapat melakukan teks video langsung 100% secara lokal di browser Anda (tanpa instalasi). Sangat besar untuk aksesibilitas!