
Epoch AI: Claude Opus 4.7 موفق به حل ۵۶٪ تسکهای MirrorCode شد
محک جدید Epoch AI نشان میدهد مدلهای زبانی اکنون قادر به بازپیادهسازی کامل برنامههای پیچیده از صفر هستند. Claude Opus 4.7 با پیشتازی در این آزمون، مرزهای توانمندی عاملهای هوش…
دستهبندی
تحلیلهای عمیق مدلها، مقالات و بنچمارکها — پیشچاپها، ارزیابیها، مدلهای زبانی پیشرو و پژوهش همراستاسازی.
۱٬۶۲۹ مقاله منتشر شده

محک جدید Epoch AI نشان میدهد مدلهای زبانی اکنون قادر به بازپیادهسازی کامل برنامههای پیچیده از صفر هستند. Claude Opus 4.7 با پیشتازی در این آزمون، مرزهای توانمندی عاملهای هوش…

اوپنایآی پیشنمایش محدودی از سری GPT-5.6 را منتشر کرد که مدل پرچمدار آن، Sol، با تمرکز بر استدلالهای عاملمحور و لایههای امنیتی شدید عرضه شده است. این عرضه بهصورت مرحلهای و…

روش Vibe Coding به غیربرنامهنویسان اجازه میدهد برنامههایی بسازند که در ظاهر درست کار میکنند، اما فاقد زیرساخت مهندسی برای مقیاسپذیری و امنیت هستند. خطر اصلی، جایگزینی درک…

تیم تحقیقاتی علیبابا مدل Wan-Streamer را معرفی کرد؛ نخستین مدل یکپارچهای که متن، صوت و ویدیو را بهطور همزمان پردازش میکند. این معماری با حذف زنجیرههای پردازش متوالی، تأخیر…

یک بسته نرمافزاری مخرب با دور زدن هفت لایه امنیتی مبتنی بر هوش مصنوعی، باعث سرقت گسترده اعتبارنامهها شد. این بحران تنها زمانی پایان یافت که یک فایل جعلی، عامل هوش مصنوعی مهاجم…

صحت ساختاری یک کوئری SQL تضمینکنندهی دقت پاسخهای تجاری در محیطهای سازمانی نیست. الگوی معماری جدید پیشنهاد میکند که برای جلوگیری از خطاهای گزارشدهی، به جای تکیه بر متادیتای…

شرکت Armorer Labs استدلال میکند که گزارشهای مشترک برای حسابرسی سامانههای چندعاملی ناکافی هستند. این شرکت الگوی «رسید تحویل» را برای ردیابی دقیق پرامپتها، اعتبارنامهها و…

شرکت monday.com سامانه HATCHA را معرفی کرد؛ نسخهای معکوس از CAPTCHA که دسترسی انسانها را میبندد و فقط به عاملهای هوش مصنوعی اجازه ورود میدهد. این ابزار با استفاده از محاسباتی…

چارچوب متنباز agent-runbook با جایگزینی دستورات مبهم با قراردادهای ساختاریافته، از بروز خطاهای سیستمی عاملهای هوشمند در محیطهای عملیاتی جلوگیری میکند. این ابزار با اجبار به…

OpenAI و Broadcom تراشه اختصاصی Jalapeño را برای کاهش هزینههای عملیاتی استنتاج مدلهای زبانی معرفی کردند. این حرکت گلوگاه هوش مصنوعی را از قدرت محاسباتی خام به مدیریت ارکستراسیون…

یک راهنمای جامع فنی، بازسازی معماری عامل نانوبات را از پایه آموزش میدهد. این متد شامل پیادهسازی فراخوانی ابزار، حافظه نشست و سرورهای MCP در یک حلقه مستقل از ارائهدهنده است.

مایکرون با انعقاد ۱۶ قرارداد استراتژیک، قیمتهای بالای حافظه را برای پنج سال آینده تضمین کرد. این اقدام با بهرهگیری از کمبود ساختاری عرضه، حاشیه سودهای کلانی را برای این شرکت…