
Z.ai: برتری GLM-5.2 بر GPT-5.5 در کدنویسی بلندمدت
شرکت Z.ai مدل متنباز GLM-5.2 را با پنجره متنی ۱ میلیون توکنی برای پروژههای مهندسی پیچیده منتشر کرد. این مدل در بنچمارکهای کدنویسی بلندمدت، عملکردی برتر از GPT-5.5 و Claude Opus…
دستهبندی
تحلیلهای عمیق مدلها، مقالات و بنچمارکها — پیشچاپها، ارزیابیها، مدلهای زبانی پیشرو و پژوهش همراستاسازی.
۱٬۶۴۶ مقاله منتشر شده

شرکت Z.ai مدل متنباز GLM-5.2 را با پنجره متنی ۱ میلیون توکنی برای پروژههای مهندسی پیچیده منتشر کرد. این مدل در بنچمارکهای کدنویسی بلندمدت، عملکردی برتر از GPT-5.5 و Claude Opus…

کیت توسعه نرمافزاری Strands Robots با ادغام استک LeRobot، مسیر انتقال دادهها از محیط شبیهسازی به رباتهای فیزیکی را یکپارچه کرد. این سیستم با استفاده از یک قالب دادهای واحد،…
یک چارچوب جدید با ترکیب شبکههای سلولی عصبی و شبکههای تولید الگوی محلی، امکان تولید تصاویر با وضوح بالا از شبکههای سلولی درشت را فراهم کرده است. این روش با آموزش سرتاسری، جزئیات…

پروتکل MoClaw با جداسازی اهداف عاملهای هوش مصنوعی از محدودیتهای قانونی، نرخ خطای انحراف از هدف را به شدت کاهش میدهد. این سامانه با اجرای نظارت لحظهای، مانع از اقدامات غیرمجاز…

تغییر در اقتصاد هوش مصنوعی، فاصله میان بهینهسازی فنی و سود مالی را از بین برده است. اکنون کاهش هزینههای زیرساختی مستقیماً و بهسرعت در تراز مالی شرکتها منعکس میشود.

دولت ایالات متحده شرکت Anthropic را مجبور کرد تا مدلهای Fable 5 و Mythos 5 را بهدلیل ریسکهای امنیت سایبری بهطور جهانی مسدود کند. این تصمیم که پس از یک جیلبریک ساده اتخاذ شد،…

چارچوبی جدید هشدار میدهد که «پوستههای نازک» یا همان ابزارهای سادهای که تنها یک رابط برای API هستند، در حال تبدیل شدن به «آشغالهای هوش مصنوعی» هستند. برای بقا، توسعهدهندگان…

یک توسعهدهنده کشف کرد که عامل هوش مصنوعی او در Slack در حالی که پیامهای موفقیت ارسال میکرد، تمام تسکها را نادیده گرفته بود. او با ردیابی توکنها و لاگهای زمانبندی، شکستهای…

یک چارچوب جدید پیشنهاد میکند که عاملهای هوش مصنوعی به جای تلاش برای کمال مطلق، «پایداری» را به عنوان یک بودجه محدود مدیریت کنند. این رویکرد به جای توقف کامل سیستم در صورت بروز…

توسعهدهندگان در حال تغییر رویکرد از ساخت عاملهای «بینقص» به مدیریت پایداری به عنوان یک بودجه منعطف هستند. این استراتژی به عاملهای غیرمتمرکز اجازه میدهد ریسک را مدیریت کرده و…

بسیاری از شکستهای عاملهای هوش مصنوعی ناشی از کیفیت مدل نیست، بلکه به دلیل ورود به حلقههای تکرار هزینهبر و بینهایت است. جایگزینی مهندسی پرامپت با تعیین مرزهای سختگیرانه در…

عاملهای هوش مصنوعی میتوانند اپلیکیشنها را در چند ساعت بسازند، اما پیادهسازی زیرساختهای عملیاتی همچنان هفتهها زمان میبرد. سرویس SettleMesh با معرفی یک لایهی استقرار، هدفش…