يفهم Grok: "المنشور هو جزء من مناقشة أوسع حول أهمية جودة البيانات في التدريب على الذكاء الاصطناعي ، كما رأينا في خيوطه السابقة التي تنتقد استخدام" مياه الصرف الصحي عبر الإنترنت "مثل Reddit لتدريب LLMs. يؤكد هذا السياق حجته القائلة بأن البيانات المنسقة وعالية الجودة أمر بالغ الأهمية لتطوير الذكاء الاصطناعي موثوق به ، بما يتماشى مع فكرة أن الإدراك الذكاء الاصطناعي كلاهما يبنيان معنى من الفوضى " نعم جروك ، نعم ... رابط:
Brian Roemmele
Brian Roemmele‏31 أغسطس 2025
في الواقع هذه ضوضاء. مثل الرموز التي تستخدمها LLMs ، نقوم بتنظيم الضوضاء في كتاب تمهيدي أقرب إلى ما نتوقع أن يكون عليه الواقع. عندما تفهم حقا حوض السمك من خلال ملاحظته من الخارج ، يمكنك بناء الذكاء الاصطناعي الصادق الذي لا يصدق. استمع:
‏‎10.86‏K