Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Dawn Song
Profesor Ilmu Komputer di UC Berkeley, co-Director Berkeley RDI Center; Membangun AI yang aman, terjamin, dan terdesentralisasi; Pengusaha serial
Bergabunglah dengan kami di Agentic AI Summit 2025 — 2 Agustus di UC Berkeley, dengan ~2.000 peserta tatap muka dan pemikir terkemuka dalam AI.
Membangun momentum komunitas MOOC 25K+ Agen LLM, ini adalah acara terbesar dan paling mutakhir di #AgenticAI.
Saat tahun 2025 muncul sebagai Tahun Agen, KTT ini menawarkan kursi barisan depan untuk terobosan yang membentuk masa depan #AgenticAI. Jadilah bagian dari gerakan.
👀 Daftar untuk kehadiran secara langsung atau online:

13,62K
Grup & kolaborator saya telah mengembangkan banyak tolok ukur populer selama bertahun-tahun, misalnya, MMLU, MATH, APPS---sangat bersemangat dengan benchmark terbaru kami OMEGA Ω:
🔍Bisakah LLM benar-benar berpikir di luar kotak dalam matematika?
Tolok ukur baru yang menyelidiki 3 sumbu generalisasi:
1️⃣ Eksplorasi
2️⃣ Komposisi
3️⃣ Transformatif
menunjukkan keterbatasan AI perbatasan saat ini dan pelatihan RL dalam dimensi generalisasi ini.
Terinspirasi oleh tipologi kreativitas Boden, OMEGA maju melampaui tolok ukur sebelumnya dengan kumpulan data yang dihasilkan secara terprogram yang menggabungkan kontrol yang tepat dengan keragaman yang kaya. Mencakup berbagai domain matematika, ini secara eksplisit dirancang untuk mengevaluasi sumbu generalisasi dan penalaran kreatif yang berbeda.
Dengan mengisolasi dan mengukur mode kegagalan yang terperinci, OMEGA memberikan dasar untuk memajukan LLM menuju kreativitas matematika yang asli—di luar kemahiran mekanis.
Terima kasih banyak kepada postdoc saya @YiyouSun @UCBerkeley memimpin proyek ini, dan kolaborator luar biasa @nouhadziri @HannaHajishirzi @allen_ai dan rekan penulis lainnya!

Nouha Dziri25 Jun 2025
📢 Can LLMs really reason outside the box in math? Or are they just remixing familiar strategies?
Remember DeepSeek R1, o1 have impressed us on Olympiad-level math but also they were failing at simple arithmetic 😬
We built a benchmark to find out → OMEGA Ω 📐
💥 We found that although very powerful, RL struggles to compose skills and to innovate new strategies that were not seen during training. 👇
work w. @UCBerkeley @allen_ai
A thread on what we learned 🧵

20,58K
1/ 🔥 Agen AI mencapai momen terobosan dalam keamanan siber.
Dalam karya terbaru kami:
🔓 CyberGym: Agen AI menemukan 15 zero-day dalam proyek open-source besar
💰 BountyBench: Agen AI memecahkan tugas bug bounty dunia nyata senilai puluhan ribu dolar
🤖 Secara mandiri.
Pergeseran penting sedang berlangsung — agen AI sekarang dapat secara mandiri melakukan apa yang sebelumnya hanya bisa dilakukan oleh peretas manusia elit.

50,09K
Sangat bersemangat untuk membagikan karya terbaru kami di AgentSynth:
Paradigma baru untuk menghasilkan tugas dan tolok ukur penggunaan komputer yang realistis, terukur, dan jangka panjang!
Alur otomatis kami menghasilkan kumpulan data 6.000+ tugas dengan dua keunggulan yang mengubah permainan:
Penghematan 💰 Biaya Dramatis : AgentSynth menghasilkan tugas hanya dengan $0,60 per lintasan — urutan besarnya lebih murah daripada anotasi manusia tradisional.
Kompleksitas Fidelitas 🧗 Tinggi : Tugas-tugas ini mencerminkan tantangan jangka panjang dunia nyata, seringkali mengharuskan agen untuk berkoordinasi di beberapa aplikasi seperti Chrome, VS Code, dan LibreOffice agar berhasil.
6,18K
🔐 Frontier AI membentuk kembali keamanan siber, menimbulkan pertanyaan baru yang kritis:
🔍 Apa dampaknya saat ini?
⚖️ Siapa yang lebih diuntungkan—penyerang atau pembela?
🛡️ Bagaimana kita bisa mengurangi risiko?
Mengatasi tantangan ini membutuhkan upaya terkoordinasi di seluruh komunitas AI & keamanan.
Dalam makalah terbaru kami, kami mengeksplorasi lanskap yang berkembang, menganalisis dinamika antara penyerang dan pembela, dan menyerukan langkah-langkah proaktif untuk memastikan AI perbatasan mengarahkan keseimbangan ke arah pertahanan daripada serangan.
Kami memprediksi bahwa, dalam jangka pendek, penyerang cenderung mendapatkan keuntungan yang lebih langsung dari kemampuan AI daripada pembela. Namun, meramalkan dinamika ini rumit—dan perspektif Anda sangat penting untuk meningkatkan pemahaman dan respons kolektif kita.
Kami mengundang semua pakar dan praktisi AI dan keamanan siber untuk mengikuti survei singkat kami dan berbagi pandangan Anda—apakah Anda setuju atau tidak dengan prediksi kami. #AI #CyberSecurity 🧵👇

9,97K
🌟 Dengan senang hati mengumumkan panel juri kami yang terhormat untuk kompetisi #AgentX oleh @BerkeleyRDI @UCBerkeley. Terima kasih banyak kepada @xinyun_chen_ @Chi_Wang_ @GoogleDeepMind; @KaiyuYang4 @Meta; @jayrodge15 @ZhidingYu @nvidia; @Somil_Agg @schmidtsciences; Samuel Barry @MistralAI; @bhawna_tweets, Austin Arensberg @Okta; @ben_burtenshaw @huggingface; @chuanli11 @ThomasBord50495 @LambdaAPI; @ozenhati Ben Ankiel @GroqInc; @waseem_s @Get_Writer; @SaraIttelson @Accel; @kevinzhang @BainCapVC; @ReddyVijayB @Mayfield; @maddiehfaulkner @NEA; @whoisnnamdi @David_Schmaier @LightspeedVP; @NextBigTeng @bhavikvnagda @BessemerVP; @divy93t @Google; @ysu_nlp @OhioState; Pushkar Nandkar @SambaNovaAI; Alok Tongaonkar @Cisco bergabung dengan kami sebagai juri, dan banyak lagi yang akan diumumkan.
🚀 Hampir 1.000 tim telah bergabung dengan #AgentX—membangun masa depan Agentic AI di seluruh jalur Kewirausahaan & Riset!
💰 Kumpulan hadiah sekarang $150K+, dengan total hadiah/sumber daya melebihi $450K!
🤖 Bergabunglah SEKARANG untuk Kompetisi AgentX dan kirimkan proyek Anda sebelum 31/5. ⏰

9,82K
Bersemangat untuk berbicara di @RSAConference 2025! Bergabunglah dengan sesi saya "Keselamatan dan Keamanan Agen LLM: Tantangan dan Arah Masa Depan" pada 1 Mei (12:20-1:10 PT). Kami akan mengeksplorasi tantangan keselamatan dan keamanan agen LLM dan membahas praktik terbaik untuk penerapan LLM yang aman dan terjamin. #RSAC #AI #CyberSecurity

2,91K
Sangat rendah hati dan terhormat terpilih menjadi anggota American Academy of Arts and Sciences @americanacad! Bersemangat untuk berkontribusi pada misi Akademi dan memajukan kebaikan bersama!


American Academy of Arts & Sciences24 Apr 2025
New! Academy member announcement. Dedicated to honoring excellence and advancing the common good, from 1780 to today.
12,35K
Lihat poster kami tentang tanda air UNDETECTABLE pertama untuk model generatif di #ICLR2025
Kamis Apr 24
15:00 - 17:30
Aula 3 + Aula 2B, Poster #177

Xuandong Zhao22 Apr 2025
🤯 AI images getting too real? (Think GPT-4o, Imagen-3, etc!) Worried about trust in the GenAI era? We tackled this head-on at #ICLR2025!
Presenting the first UNDETECTABLE watermark for generative models! 🚀
A big step forward w/ @samgunn111 & @dawnsongtweets
🧵👇 (1/13)

3,39K
Teratas
Peringkat
Favorit
Trending onchain
Trending di X
Pendanaan teratas terbaru
Paling terkenal