المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
ضبط وكلاء LLM دون ضبط LLMs!
تخيل تحسين أداء وكيل الذكاء الاصطناعي الخاص بك من التجربة دون لمس أوزان النموذج.
إنه تماما مثل الطريقة التي يتذكر بها البشر الحلقات الماضية ويتعلمون منها.
هذا بالضبط ما يفعله Memento.
المفهوم الأساسي:
بدلا من تحديث أوزان LLM ، يتعلم Memento من التجارب باستخدام الذاكرة.
إنه يعيد صياغة التعلم المستمر على أنه تعلم معزز عبر الإنترنت قائم على الذاكرة عبر MDP المعزز بالذاكرة.
فكر في الأمر على أنه إعطاء وكيلك دفتر ملاحظات لتذكر ما نجح وما لم ينجح!
كيف يعمل؟
ينقسم النظام إلى مكونين رئيسيين:
1️⃣ التفكير القائم على الحالة (CBR) في العمل:
يحلل المهام المعقدة إلى مهام فرعية ويسترجع الخبرات السابقة ذات الصلة.
لا حاجة للتدرجات ، فقط استرجاع الذاكرة الذكية!
2️⃣ المنفذ
ينفذ كل مهمة فرعية باستخدام أدوات MCP ويسجل النتائج في الذاكرة للرجوع إليها في المستقبل.
من خلال MCP ، يمكن للمنفذ إنجاز معظم المهام الواقعية ولديه إمكانية الوصول إلى الأدوات التالية:
🔍 أبحاث الويب
📄 معالجة المستندات
🐍 تنفيذ Python الآمن
📊 تحليل البيانات
🎥 معالجة الوسائط
لقد وجدت أن هذا طريق جيد حقا نحو بناء وكلاء يشبهون البشر.
👉 إليك ، ما هي أفكارك؟
لقد شاركت الروابط ذات الصلة في التغريدة التالية!
_____
شارك هذا مع شبكتك إذا وجدت هذا ثاقب ♻️
ابحث عن → @akshay_pachaar لمزيد من الأفكار والبرامج التعليمية حول الذكاء الاصطناعي والتعلم الآلي!

49.14K
الأفضل
المُتصدِّرة
التطبيقات المفضلة