Swarm Inference adalah pengubah permainan untuk industri AI. Untuk memahami alasannya, Anda perlu mulai dengan seperti apa pengembalian untuk pembuat pemasok inferensi reguler (GPU di pusat data). Kenakan topi investor Anda: -Anda melihat ledakan AI. Anda ingin terlibat. Membeli GPU, meletakkannya di suatu tempat, dan menyewakannya adalah inti dari model bisnis ini. - Anda mulai memodelkan, Anda membangun PnL. Pusat data, server, konektivitas, dll. Ini adalah CAPEX dan COGS Anda. Top-line hanya menonjol untuk GPU kelas atas. Daya mahal. Manajemen tidak sepele. - Anda sampai pada kesimpulan cepat: pengembalian adalah... kasar untuk sedikitnya. Jika Anda menjalankan latihan ini, ada TLDR sederhana: Berkontribusi pada ekonomi AI di tingkat infrastruktur hanya bekerja dengan skala, atau beberapa terhubung dengan daya/ruang. Infrastruktur inferensi dikomoditas dan hasil telah dikompresi. Saya terus mencoba menemukan cara untuk mengiris dan memotong ini, tetapi rasanya seperti tidak ada alfa yang dapat ditemukan di sini. Dari perspektif teknologi, ini semua adalah konsekuensi dari cara kerja Inferensi secara historis saat ini. Anda memerlukan kepadatan komputasi. Throughput bus tinggi, VRAM tinggi, dll. Swarm Inference adalah pengubah permainan karena kepadatan komputasi tidak lagi menjadi persyaratan. CAPEX dan COGS di atas adalah konsekuensi dari perlunya kepadatan komputasi. Tetapi jika Anda tidak memerlukan kepadatan komputasi, maka Anda tidak memerlukan pusat data. Dengan kata lain, penyedia infrastruktur individu tidak harus melewati rintangan penskalaan untuk berpartisipasi. Dan jika Anda tidak memerlukan skala minimum untuk berpartisipasi, maka bahkan mungkin rumah individu dapat berkontribusi pada AI dengan pengembalian yang benar-benar masuk akal. Itu sebabnya Swarm Inference adalah pengubah permainan. Ini adalah inovasi yang mengubah di mana alfa dapat ditemukan. Selamat kepada tim di Fortytwo karena telah melakukan perubahan paradigma.