
ساخت خط لوله داده برای عاملهای کدنویس با مجموعه Fable 5 در کولب
این راهنما روشی بهینه برای تحلیل، بازرسی و آموزش بر روی مجموعه داده Fable 5 Traces در محیط گوگل کولب ارائه میدهد. هدف این گردشکار، تبدیل تلهمتری خام عاملها به دادههای…
دستهبندی
تحلیلهای عمیق مدلها، مقالات و بنچمارکها — پیشچاپها، ارزیابیها، مدلهای زبانی پیشرو و پژوهش همراستاسازی.
۱٬۶۲۸ مقاله منتشر شده

این راهنما روشی بهینه برای تحلیل، بازرسی و آموزش بر روی مجموعه داده Fable 5 Traces در محیط گوگل کولب ارائه میدهد. هدف این گردشکار، تبدیل تلهمتری خام عاملها به دادههای…

مانگوس راس نشان میدهد که اتکای کورکورانه به روشهای استاندارد بهینهسازی در طراحی پروتئینها منجر به نتایج ناکارآمد میشود. او با جایگزینی فاصله اقلیدسی با Diverge KL، سرعت…

یک بنچمارک جدید نشان میدهد که انتخاب چارچوب مدیریت عاملها تأثیر بیشتری نسبت به خودِ مدل دارد. استفاده از قابلیت فراخوانی ابزار بومی در سختافزارهای محلی، نرخ موفقیت در اجرای…

پژوهش جدید دانشگاه UIUC نشان میدهد که تلاش عاملهای هوش مصنوعی برای خلاصهسازی یا پاکسازی حافظه بلندمدت، منجر به کاهش شدید دقت آنها میشود. بازنویسی مداوم سوابق، سوگیری انتخابی…

شرکت Liquid AI مدل LFM2.5-230M را با تمرکز بر اجرای محلی و استخراج دادههای ساختاریافته عرضه کرد. این مدل علیرغم اندازه کوچک، در بنچمارکهای پیروی از دستورات، عملکرد مدلهای…

ابزار Wayfinder-Router با تحلیل ساختاری پرامپتها بهجای تحلیل معنایی، ترافیک را بین مدلهای محلی و ابری توزیع میکند. این رویکرد با حذف نیاز به مدلهای «داور»، تأخیر و هزینههای…

یک پژوهشگر ناشناس با استفاده از هوش مصنوعی زاینده، ۲۰ آسیبپذیری جدی (Zero-Day) را در ۲۳ پروژه متنباز از جمله داکر و فایرفاکس شناسایی و بدون اطلاع سازندگان منتشر کرد. این اقدام…

یک چالش امنیتی گسترده با بیش از ۶ هزار تلاش برای نفوذ، نتوانست لایههای حفاظتی مدل Claude Opus 4.6 را بشکند. این نتایج پیشرفت چشمگیر در دفاع مدلهای پیشرو را نشان میدهد، هرچند…

یک راهنمای فنی جدید نشان میدهد چگونه اتصال دو پردازنده AMD Strix Halo با استفاده از RoCE v2، تأخیر همگامسازی را از ۷۰ میکروثانیه به ۵ میکروثانیه کاهش میدهد. این پیکربندی با دور…

پژوهش جدید CoffeeBench شکافی خطرناک میان برنامهریزی و اجرا در عاملهای هوش مصنوعی شناسایی کرد. این «رانش بیهدف» باعث میشود مدلها بهجای اقدام، صرفاً گزارش دقیقی از دلیل شکست…

یک سری آموزشی جامع، مسیر تبدیل یک نمونه اولیه به سامانه تولیدی RAG را با استفاده از pgvector و پروتکل MCP شرح میدهد. این معماری با ادغام حافظه و ابزارها، جایگزینی برای…

تیمهای عملیاتی SRE در حال گذار به پاسخهای خودکار از طریق یک عامل ناظر هستند که ابزارهای تخصصی را مدیریت میکند. این معماری فرآیند تحلیل لاگها تا تدوین گزارشهای پس از حادثه را…