トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Dawn Song
カリフォルニア大学バークレー校のコンピューターサイエンス教授、バークレーRDIセンターの共同所長。安全、安心、分散型 AI の構築。連続起業家
私のグループと共同研究者は、MMLU、MATH、APPSなど、長年にわたって多くの人気のあるベンチマークを開発してきました---最新のベンチマークであるOMEGA Ωに非常に興奮しています。
🔍LLMは本当に数学で既成概念にとらわれずに考えることができますか?
一般化の3つの軸を調査する新しいベンチマーク:
1️(2)探索的
2️(2)コンポジション
3️(2)トランスフォーマティブ
今日のフロンティアAIとRLトレーニングの限界を、これらの一般化の次元で示しています。
ボーデンの創造性の類型学に触発されたオメガは、正確な制御と豊かな多様性を兼ね備えたプログラムによって生成されたデータセットにより、以前のベンチマークを超えて進歩しています。幅広い数学的領域にまたがり、一般化と創造的推論の異なる軸を評価するように明示的に設計されています。
OMEGAは、きめ細かな故障モードを分離して定量化することで、LLMを機械的な熟練度を超えた真の数学的創造性へと前進させるための基盤を提供します。
プロジェクトを率いるポスドク@YiyouSun @UCBerkeley、素晴らしい協力者、@nouhadziri @HannaHajishirzi @allen_ai、その他の共著者に心から感謝します。

Nouha Dziri2025年6月25日
📢 Can LLMs really reason outside the box in math? Or are they just remixing familiar strategies?
Remember DeepSeek R1, o1 have impressed us on Olympiad-level math but also they were failing at simple arithmetic 😬
We built a benchmark to find out → OMEGA Ω 📐
💥 We found that although very powerful, RL struggles to compose skills and to innovate new strategies that were not seen during training. 👇
work w. @UCBerkeley @allen_ai
A thread on what we learned 🧵

20.58K
AgentSynthに関する最新の作業を共有できることを非常に嬉しく思います。
現実的でスケーラブル、かつ長期的なコンピュータ使用タスクとベンチマークを生成するための新しいパラダイムです。
当社の自動パイプラインは、6,000+タスクのデータセットを生成し、2つのゲームチェンジャーの利点を備えています。
劇的なコスト削減 💰 : AgentSynth は、軌道あたりわずか 0.60 ドルでタスクを生成します。これは、従来の人間の注釈よりも桁違いに安価です。
忠実度の高い複雑さ🧗:これらのタスクは、現実世界の長期的な課題を反映しており、多くの場合、エージェントはChrome、VS Code、LibreOfficeなどの複数のアプリケーション間で調整する必要があります。
6.18K
🔐 Frontier AIはサイバーセキュリティを再構築しており、重要な新たな問題を提起しています。
🔍 現在、どのような影響がありますか?
⚖️ 攻撃者と防御者、どちらがより利益を得る立場にあるのでしょうか?
🛡️ どうすればリスクを軽減できるのか?
これらの課題に対処するには、AIとセキュリティのコミュニティ全体で協調した取り組みが必要です。
最近の論文では、進化する状況を探り、攻撃者と防御者の間のダイナミクスを分析し、フロンティアAIがバランスを攻撃ではなく防御に傾けるための積極的な対策を求めています。
短期的には、攻撃者は防御者よりもAI機能からより直接的な利益を得る可能性が高いと予測しています。しかし、これらのダイナミクスを予測することは複雑であり、私たちの集合的な理解と対応を向上させるためには、あなたの視点が不可欠です。
私たちは、すべてのAIとサイバーセキュリティの専門家と実践者に、私たちの予測に同意するか同意しないかにかかわらず、簡単な調査に回答し、あなたの意見を共有することを勧めます。🧵👇 #AI #CyberSecurity

9.98K
🌟 @BerkeleyRDI @UCBerkeleyによる #AgentX コンペティションの尊敬する審査員団を発表できることを嬉しく思います。@xinyun_chen_ @Chi_Wang_ @GoogleDeepMindさんに大いに感謝します。@KaiyuYang4 @Meta;@jayrodge15 @ZhidingYu @nvidia;@Somil_Agg @schmidtsciences;サミュエル・バリー・@MistralAI;@bhawna_tweets、オースティン・アレンスバーグ@Okta;@ben_burtenshaw @huggingface;@chuanli11 @ThomasBord50495 @LambdaAPI;@ozenhati ベン・アンキール・@GroqInc;@waseem_s @Get_Writer;@SaraIttelson @Accel;@kevinzhang @BainCapVC;@ReddyVijayB @Mayfield;@maddiehfaulkner @NEA;@whoisnnamdi @David_Schmaier @LightspeedVP;@NextBigTeng @bhavikvnagda @BessemerVP;@divy93t @Google;@ysu_nlp @OhioState;プシュカル・ナンドカル・@SambaNovaAI;Alok Tongaonkar @Cisco審査員として参加してくださり、さらに多くのことが発表されます。
🚀 すでに1,000近くのチームが #AgentX に参加しており、起業家精神と研究のトラック全体でエージェントAIの未来を築いています。
💰 賞金総額は$150K+になり、賞金/リソースの合計は$450Kを超えます!
🤖 今すぐAgentXコンペティションに参加し、5月31日までにプロジェクトを提出してください。⏰

9.82K
米国芸術科学アカデミーの@americanacadに選出されたことを深く謙虚に、そして光栄に思います!アカデミーの使命に貢献し、公益を推進することに興奮しています!


American Academy of Arts & Sciences2025年4月24日
New! Academy member announcement. Dedicated to honoring excellence and advancing the common good, from 1780 to today.
12.36K
#ICLR2025 でジェネレーティブモデルの最初の UNDETECTABLE ウォーターマークに関するポスターをご覧ください
4月24日(木)
15:00 - 17:30
ホール3 + ホール2B、ポスター#177

Xuandong Zhao2025年4月22日
🤯 AI images getting too real? (Think GPT-4o, Imagen-3, etc!) Worried about trust in the GenAI era? We tackled this head-on at #ICLR2025!
Presenting the first UNDETECTABLE watermark for generative models! 🚀
A big step forward w/ @samgunn111 & @dawnsongtweets
🧵👇 (1/13)

3.39K
トップ
ランキング
お気に入り
Trending onchain
Trending on X
Recent top fundings
Most notable