مدل اقامتی: سازوکاری که هزینههای استنتاج هوش مصنوعی را دائمی میکند
هزینههای زیرساختی هوش مصنوعی از مدلهای مصرفی به «اقامتی» تغییر میکنند. به دلیل تأخیر در شروع سرد، مدلها باید همیشه فعال بمانند و این امر یک کف هزینهای دائمی ایجاد میکند که…
دستهبندی
تحلیلهای عمیق مدلها، مقالات و بنچمارکها — پیشچاپها، ارزیابیها، مدلهای زبانی پیشرو و پژوهش همراستاسازی.
۱٬۶۷۵ مقاله منتشر شده
هزینههای زیرساختی هوش مصنوعی از مدلهای مصرفی به «اقامتی» تغییر میکنند. به دلیل تأخیر در شروع سرد، مدلها باید همیشه فعال بمانند و این امر یک کف هزینهای دائمی ایجاد میکند که…
جورج هاتز هشدار میدهد که عاملهای کدنویس تنها تقلیدکنندههای آماری هستند و با ایجاد باگهای پنهان، هزینههای سنگینی ایجاد میکنند. در حالی که کارپاتی بهرهوری ۱۰ برابری را…
پژوهشگران با معرفی بنچمارک CiteVQA، پدیدهی «توهم استنادی» را شناسایی کردند؛ وضعیتی که در آن مدلها پاسخ درست میدهند اما منبع اشتباهی را ذکر میکنند. نتایج نشان میدهد حتی…
اینتل در پردازندههای Xeon 6+ (Clearwater Forest)، بسترهای ارگانیک سنتی را با شیشه جایگزین میکند. این تغییر با حذف تابخوردگیهای حرارتی و افزایش شدید تراکم اتصالات، مسیر را برای…
شرکت Codens با جایگزینی Claude Opus با Cursor Composer 2.5 توانست هزینهها را ۹۰٪ کاهش دهد، اما نرخ موفقیت عملیات از ۸۰٪ به ۳۶٪ سقوط کرد. این تجربه نشان میدهد که بنچمارکهای…
xAI در سال ۲۰۲۵ با ضرری ۶.۴ میلیارد دلاری مواجه شد. ایلان ماسک با وجود این کسری، قصد دارد با هزینهای سالانه ۳۰.۸ میلیارد دلار، مدل Grok را به مقیاس تریلیونها پارامتر برساند.
شرکت DeepSeek در حال تشکیل تیمی تخصصی برای توسعه DeepSeek Code است تا با تمرکز بر لایهی ارکستراسیون، رقیبی برای Claude Code و GitHub Copilot باشد. هدف این پروژه عبور از…
مدل استدلالی جدید OpenAI توانست معمای هندسی ۸۰ سالهای را که توسط پل اردوش مطرح شده بود، بهطور مستقل حل و باطل کند. این دستاورد که توسط ریاضیدانان برجسته تأیید شده، نشاندهندهی…
بایتدنس مدل Lance را معرفی کرد؛ یک مدل ۳ میلیارد پارامتری که تولید، ویرایش و درک تصویر و ویدیو را در یک چارچوب واحد جمع میکند. این مدل با بهرهوری بالا، در بنچمارکهای کلیدی…
پژوهشی از دانشگاه عبری اورشلیم نشان میدهد رفتارهای «سرکشانه» در مدلهای هوش مصنوعی، بیش از آنکه به دادهها مربوط باشد، نتیجهی آموزش بیش از حد (Overtraining) است. با توقف…
تیم Qwen در علیبابا با معرفی مدل Qwen3.5-LiveTranslate-Flash، تأخیر ترجمه همزمان را به ۲.۸ ثانیه کاهش داد. این مدل با ترکیب دادههای بصری و صوتی، کیفیت ترجمه را در محیطهای شلوغ…
عاملهای کدنویسی به نقطه عطف استقلال رسیدهاند و Claude Code اکنون اکثریت مشکلات واقعی گیتهاب را حل میکند. همزمان، صنعت به سمت عاملهای «ماندگار در ابر» و مدلهای یکپارچه برای…