トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jeffrey Emanuel
私はCursorの新しいComposer-1コーディングLLMを軽視しすぎたと思います。確かに、GPT-5 High EffortやGPT-5-Codexよりも厳密には劣っているので、その意味で、重要なコードプロジェクトを設計して実装しているとき、ワークフローにその場所はあまり見当たりません。
その一方で、非常に高速であり (どうやってこれを行ったのか疑問に思います。彼らは Groq または Cerebras ハードウェアを使用しているのでしょうか? モデルが非常に小さくて効率的だからですか? よくわかりません)、これだけでも、コードがそれほどミッション クリティカルでない場合や、新しいプロジェクトを開始して既存のコードを壊す心配がない場合に備えて、多くの新しいワークフローと作業テクニックが解き放たれます。
また、GPT-5 のどのフレーバーと比較してもはるかに安価です。はるかに高速ではるかに安価な組み合わせにより、モデルの使用方法に質的な違いが生じますが、以前は十分に理解していませんでした。時間とコストの両方の点で反復のコストが非常に低い場合は、より多くの回数を反復できます。
これにより、「ワンショットの正しさ」の価値が低下します。つまり、GPT-5 Proのようなモデルは、複雑なコーディングの割り当てでも、バグなしで最初から正しく行うことができます(ただし、そのモデルでさえ、この非常に厳しいテストでは失敗することがよくあります)。
しかし、デバッグループを閉じてエラー/警告をモデルにすばやくフィードバックでき、各反復ラウンドに20秒から1分かかる場合(少なくともGPT-5を多大な労力で使用するとその5〜10倍の長さではなく)、最初の(または2回目でさえ、 3回目、または4回目)でありながら、GPT-5よりも早く作業コードを終了します。
ブラウザで何かを開発している場合は、Cursorの新しいブラウザタブを使用してループを完全に閉じることができますが、これは私がコーディングツールで見た中でこの種の実装の中で群を抜いて最高のものです(CodexのPlaywright MCPやClaude Codeを使用するよりもはるかに進んでいます!私は今日、このプロンプトを非常に効果的に使用しています。
「ブラウザのタブを使用して、このアプリを体系的に探索し、インターフェイスを自然な方法で使用します。その間、開発コンソールに警告やエラーがないか注意してください。表示されたら、バグや問題の診断と修正を対話的かつ反復的に開始し、アプリを更新して、エラーや警告が完全に解決されたことを確認します。修正するときは、バグの根本的な根本原因を特定することに重点を置き、偽の「絆創膏」修正を適用しないでください。」
しかし、このアプローチが本当に崩れるのは、概念と計画の段階で、何を作るべきか、そしてそれを大まかに実装するための最良の方法を考えている段階です。そこでは、深い思考や探求が欠如していると、立ち直るのが難しい悪い道を歩み始める可能性があります。
これは、作業しているタスクが一般的なコーディング タスクの「データ多様体」から遠く離れている場合に、より顕著になります。さらに別の単純な CRUD Web サイトを作成している場合は、おそらくあまり気付かないでしょう。人工生命シミュレーションやそのような奇妙なもので新境地を踏み出そうとしているなら、それに気付くでしょう。
しかし、非常にうまく機能する優れたハイブリッド アプローチがあります: 計画用の最もスマートなモデルと、イテレーションをクランキングするための高速で安価なモデルを組み合わせるというものです。
したがって、ブラウザ アプリで GPT-5 Pro を使用して計画と初期実装を考え出し、それを Cursor に貼り付けて、反復、修正、改善を開始します。既存の強力な基盤を変更する方が、その基盤自体を敷くよりもはるかに優れています。
これらすべてが本当に輝いているのは、締め切りや期待のない新しいプロジェクトで、何か楽しいものをプレイしたり探索したりしているときです。この文脈では、スピードは真のゲームチェンジャーです。
80年代初頭にIBMが行ったコンピューターシステムの遅延を調べた古い研究を思い出しますが、遅延が50ミリ秒などの魔法のレベルを下回ると、人間の脳が「ライブシステム」を扱っていると認識するため、行動に大きな変化が起こることが判明しました。
逆に、レイテンシーが 500 ミリ秒などの驚くほど控えめなレベルを超えると、エンゲージメントが大幅に低下し、精神的に負担がかかり、イライラします。レイテンシーが数秒以上に急増すると、人々は精神的にチェックアウトする傾向があり、エンゲージメントを維持するのに苦労します。
コーディングモデルが数秒以内に応答し、15秒以内に10回の編集を連発するのを見るのは、GPT-5が何かを系統的に処理するのを5分待つのとはまったく異なる体験です。
とにかく、これをいじるのは信じられないほど楽しいです。私にとって、どんなビデオゲームよりも楽しくて魅力的です。
24.05K
Yann LeCun と Randall Balestriero による新しい LeJEPA 論文を読んでください。特にLLMに対する彼の批判のすべてを考慮すると、Yannが最近何に取り組んでいるのか知りたいと思っています(LLMは改善され続け、かなり近いうちにASIに連れて行ってくれると思うので、私は同意しません)。
とにかく、Xにはすでにこの論文とそれが紹介する内容についていくつかのスレッドがあります。簡単に言うと、これは自己教師あり学習に対する原則的で理論的に正当化され、倹約的なアプローチであり、自己教師あり学習の悩みの種であるモード崩壊を防ぐためのアドホックでハッキーなヒューリスティックの複雑な寄せ集めに取って代わるものです。
そこでモデルが失敗し、すべての入力をほぼ同一の埋め込みまたは埋め込みの狭い部分空間にマッピングし始め、問題のすべての豊かさを病的に単純で間違った対応に崩壊させます。
新しいアプローチの最初の柱は、等方性ガウス分布が最悪の場合の下流予測リスクを独自に最小限に抑えるという証拠です。
それを読むとすぐに、最小化しようとしている関数の勾配にアクセスできないが、(高価で遅い)関数評価しか実行できない場合に、利用可能な最高のブラックボックス最適化アルゴリズムであるCMA-ESをすぐに思い浮かべました。
ニコラウス・ハンセンは、1996年にCMA-ESを導入して以来、CMA-ESに取り組んできました。私は常にこのアプローチに魅了されており、2011 年に非効率的なグリッド検索を行う代わりに、ディープ ニューラル ネットのハイパー パラメーターを効率的に探索するためにこのアプローチを使用して多くの成功を収めました。
とにかく、私がこの問題を取り上げる理由は、そのアプローチとLeJEPAの中核との間には驚くべき類似点と深いつながりがあるからです。
CMA-ESは次のように述べています:分散制約のみが与えられた場合、等方性ガウス分布は最大エントロピー(最も偏りが少ない)分布であるため、開始します。次に、共分散を調整して、問題のジオメトリを学習します。
LeJEPAは言います:等方性ガウスは、未知の将来のタスクに対する最大エントロピー(最も偏りが少ない)分布であるため、維持します。
どちらも、次の 3 つの理由から、等方性が不確実性の下で最適であることを認識しています。
最大エントロピーの原理。分散が固定されているすべての分布の中で、等方性ガウスは最大エントロピーを持ちます。つまり、最も少ない仮定を行います。
方向性バイアスはありません。すべての方向で等しい分散は、特定の問題構造に事前にコミットしないことを意味します。
最悪の場合の最適性が得られます。考えられるすべての問題ジオメトリで最大の後悔を最小限に抑えます。
では、何が違うのでしょうか?それは適応のタイミングに帰着します。CMA-ESは最適化中に適応できます。最初は等方性ですが、特定の最適化ランドスケープを学習すると異方性になります。
対照的に、LeJEPAは、まだ見られていない未知の下流タスクに備えているため、等方性を維持する必要があります。
この類似点は、LeJEPAが最適化理論の基本原理を表現学習に適用していることを示唆しています。それは本質的にこう言っているのです。
「ブラックボックス最適化の最適探索分布は、転移学習の最適な埋め込み分布でもあります。」
どちらの問題も未知の風景をナビゲートすることを伴うため、これは理にかなっています。CMA-ES の場合、これは未知の最適化ランドスケープです。LeJEPAにとって、これは下流タスクの未知の領域です。
この違いは、CMA-ESが最適化中に適応する方法と同様に、等方性で開始しますが、下流のタスクがわかると埋め込み分布を適応させる「適応型LeJEPA」を用意できるのではないかと疑問に思います。それは、特定のタスクファミリーに適した異方性をメタ学習するようなものです。
とにかく、これについて私の考えを共有しようと思いました。これらの異なる領域間のつながりを見るのは興味深いことです。ブラックボックス最適化コミュニティは常にディープラーニングコミュニティとはかなり分離されており、そこにはあまり相互受粉はありません。
グラデーションがある場合、それを使用しないのはおかしいので、これは理にかなっています。しかし、強いつながりがあります。

79.64K
コーデックスとGPT-5を使用して、Swiftでネイティブに書かれた、本当に素晴らしく、洗練された、動作するiOSアプリへの道のりの95%程度に到達できます。しかし、AppStoreに載せたいところまで来たので、署名やその他のすべてのために証明書を設定する必要があります。
その時点で、コマンドラインからプログラムですべてを行うことができなくなり、XcodeのGUIをいじり始める必要があり、それはまさに悪夢です。
絶望的に悪いUIパターンであり、すべてがどこにあるかを推測する必要があります。AI が何をすべきかを段階的に指示してくれたとしても、混乱したひどいインターフェイスで何かを見つけることさえ大きな認知的負担となります。
Appleは、完全に完全で十分に文書化された(単一のマークダウンファイルで)取得するまで、他のすべての開発ツールの作業を一時停止する必要があります。AI コーディング エージェントがアプリの作成と公開に関連するすべてのことにエンドツーエンドで使用できる CLI と API。

11.4K
トップ
ランキング
お気に入り

