DApp Store | Pusat Web3 untuk Event & Game

Topik trending

Salah satu pendiri @flappyairplanes menyebut paradigma RL saat ini untuk pelatihan model "lingkungan slop". Mereka menjelaskan: "Paradigma penguatan saat ini sangat tidak efisien. Anda tidak benar-benar mendapatkan banyak generalisasi lintas tugas, Anda mengajarkan model melalui satu jenis pembelajaran dan kemudian Anda mengajarkannya berikutnya. Ini seperti memukul lalat. Kami melihat ini dan berpikir itu agak gila. Paradigma AI berikutnya tidak akan menjadi lingkungan yang ceroboh." "Kecerdasan tingkat manusia bukanlah langit-langit, itu hanya lantai di atas apa yang mungkin. Jika Anda dapat melatih model dengan data yang jauh lebih sedikit dan mungkin lebih banyak komputasi dengan cara yang sangat berbeda, apa yang akan terjadi? Kami sebenarnya tidak tahu. Tapi saya pikir mereka akan berbeda dan aneh dan mereka akan memiliki kemampuan menarik yang akan kami temukan cara yang sangat berharga untuk digunakan."

Teratas

Peringkat

Favorit