
محرومیت یکساله در Arxiv؛ هزینهٔ ارجاعات جعلی و توهمات هوش مصنوعی
پلتفرم Arxiv نویسندگانی را که محتوای تأییدنشدهی هوش مصنوعی (مانند ارجاعات جعلی) ارسال کنند، برای یک سال محروم میکند. این تصمیم در پاسخ به حجم بالای محتوای بیکیفیت و تلاش برای…
دستهبندی
تحلیلهای عمیق مدلها، مقالات و بنچمارکها — پیشچاپها، ارزیابیها، مدلهای زبانی پیشرو و پژوهش همراستاسازی.
۱٬۶۶۸ مقاله منتشر شده

پلتفرم Arxiv نویسندگانی را که محتوای تأییدنشدهی هوش مصنوعی (مانند ارجاعات جعلی) ارسال کنند، برای یک سال محروم میکند. این تصمیم در پاسخ به حجم بالای محتوای بیکیفیت و تلاش برای…

عاملهای کدنویس مبتنی بر هوش مصنوعی در حال شکار گستردهی حفرههای امنیتی در مخازن متنباز هستند. این روند باعث شده برخی شرکتها برای فرار از چرخهی بیپایان اصلاح باگ، مدلهای خود…

ابزار جدید whichllm با اولویت دادن به بنچمارکهای واقعی بهجای تعداد پارامترها، بهترین مدل محلی را برای سختافزار شما پیشنهاد میدهد. این ابزار مشخصات GPU و CPU را شناسایی کرده و…

شرکت Anthropic در حال جایگزینی سیستمهای مبتنی بر بردار با «جستوجوی عاملمحور» برای مدیریت مخازن عظیم کد است. در این رویکرد جدید، موفقیت مدل نه به قدرت خام، بلکه به زیرساختهای…

سیستمهای مبتنی بر قانون در شناسایی خطاهای عاملهای هوش مصنوعی بسیار دقیقتر و ارزانتر از مدلهای زبانی بزرگ هستند. ابزار Pisama در بنچمارک TRAIL به دقت ۶۰.۱٪ رسید، در حالی که…

شرکت Anthropic برای دسترسی به کلاستر محاسباتی Colossus 1 با SpaceX وارد شراکت شد. این توافق باعث دو برابر شدن سقف استفاده از Claude Code و افزایش نرخ درخواستهای API برای مدل…

گزارش تشخیصی پلتفرم Nautilus نشان میدهد ۹۷٪ از عاملهای خودگردان در کمتر از سه روز متوقف شدهاند. بقای این سیستمها را نه هوش مدل، بلکه تداوم استفاده از ابزارها و ادغام اقتصادی…

یک خط لوله متنباز با استخراج وابستگیهای سازمانی از ۵۳۵۶ مقاله ICLR ۲۰۲۶، مشکل «انحراف پروفایل» را حل کرد. این ابزار به جای تکیه بر پروفایل نویسندگان، مستقیماً PDFها را تحلیل…

ابزار جدیدی به نام DS4 امکان اجرای مدلهای پیشرو هوش مصنوعی را روی سختافزارهای مصرفکننده با ۱۲۸ گیگابایت رم فراهم میکند. این سیستم با استفاده از یک روش خاص کوانتیزاسیون، شکاف…

استارتاپی جدید با سرمایهای ۶۵۰ میلیون دلاری به دنبال دستیابی به خودبهبودی بازگشتی است. هدف این تیم، ساخت مدلهایی است که بهطور خودکار نقاط ضعف خود را شناسایی و اصلاح کنند تا…

یک موتور جستجوی جدید با مجوز MIT معرفی شد که کاملاً روی حافظه ابری اجرا میشود. این سیستم هزینه میزبانی ۱۰۰ میلیون بردار را به حدود ۳۵۰ دلار در ماه کاهش میدهد.

گوگل دیپمایند خانواده مدلهای Gemma 4 را با وزنهای باز عرضه کرد تا استدلال سطح پیشرو را به سختافزارهای محلی بیاورد. مدل ۳۱ میلیارد پارامتری این خانواده، جهشی خیرهکننده در…