微軟又做到了! 使用 AI 代理幾乎從來不會在第一次嘗試時成功。 你花了幾天時間調整提示,添加範例,希望能有所改善。這不是系統性的,只是猜測。 這正是微軟的 Agent Lightning 解決的問題。 這是一個開源框架,可以用強化學習訓練任何 AI 代理。可以與 LangChain、AutoGen、CrewAI、OpenAI SDK 或純 Python 一起使用。 它的工作原理如下: > 你的代理正常運行,無論你使用什麼框架。只需添加一個輕量級的 agl.emit() 助手,或讓追蹤器自動收集所有內容。 > Agent Lightning 捕獲每個提示、工具調用和獎勵。將它們存儲為結構化事件。 > 你選擇一個算法(RL、提示優化、微調)。它讀取事件,學習模式,並生成改進的提示或策略權重。 > 訓練器將更新推送回你的代理。你的代理在不需要你重寫任何內容的情況下變得更好。 最棒的是:你還可以在多代理系統中優化個別代理。 我已經在回覆中分享了 GitHub 倉庫的鏈接! 如果我應該在視頻演示中介紹這個,請告訴我!