
چرا پیروزیهای کلود در بیوانفورماتیک هنوز «شکننده» هستند؟
بنچمارک جدید Anthropic نشان میدهد مدلهای Claude میتوانند معماهای بیولوژیکی را حل کنند که حتی متخصصان انسانی از پس آنها برنمیآیند. با این حال، «شکاف قابلیت» در تکرارپذیری…
موضوع
Chain-of-thought, reasoning models (o-series, R-series), test-time compute
۶۰۰ مقاله منتشر شده

بنچمارک جدید Anthropic نشان میدهد مدلهای Claude میتوانند معماهای بیولوژیکی را حل کنند که حتی متخصصان انسانی از پس آنها برنمیآیند. با این حال، «شکاف قابلیت» در تکرارپذیری…

دیپسیک با معرفی مدلهای V4-Pro و V4-Flash، معماری جدیدی را برای کاهش چشمگیر هزینههای استنتاج ارائه کرد. این مدلها با پنجره بافتی ۱ میلیون توکنی، مسیر را برای ظهور عاملهای…

مدل AlphaMaze ثابت کرد که برای درک فضای سهبعدی و حل هزارتوها، نیازی به پردازش تصویر نیست. این مدل ۱.۵ میلیارد پارامتری با استفاده از توکنهای متنی، نقشهای ذهنی از محیط میسازد و…

مدل جدید OpenAI در حالی که صدرنشین شاخصهای هوش مصنوعی شده، نرخ توهمات تکاندهندهای را ثبت کرده است. این تضاد نشان میدهد که قدرت محاسباتی لزوماً به معنای قابلیت اعتماد در دنیای…

مایکروسافت با معرفی Phi-4-mini-instruct، مدلی با ۳.۸ میلیارد پارامتر عرضه کرد که در ریاضیات و استدلال، رقبای دو برابر بزرگتر خود را شکست میدهد. این مدل با پنجره بافت ۱۲۸ هزار…

مدل جدید علیبابا با ۲۷ میلیارد پارامتر، مدل غولپیکر ۳۹۷ میلیاردی предшеل خود را در بنچمارکهای کدنویسی شکست داد. این دستاورد ثابت میکند که بهینهسازی معماری بر حجم عظیم دادهها…

پلتفرم PageIndex با حذف کامل بردارهای معنایی و جایگزینی آنها با ساختار درختی و استدلال مدلهای زبانی، بازیابی دادهها را دگرگون کرده است. این روش ادعا میکند در تحلیل اسناد…

تیم Unsloth با ارائه نسخههای بهینهشدهی DeepSeek-R1، مدل ۶۷۱ میلیارد پارامتری را برای سختافزارهای مصرفکننده در دسترس قرار داد. این دستاورد به لطف تکنیک کوانتایزیشن ۱.۵۸ بیتی،…

مایکروسافت با معرفی Phi-4-multimodal-instruct، مدلهای غولآسای صوتی را به چالش کشید. این مدل ۵.۶ میلیارد پارامتری با ترکیب متن، تصویر و صوت در یک شبکه واحد، رکورد جدیدی در دقت…

برای اولین بار، یک هوش مصنوعی مسیر حرکت یک کاوشگر مریخی را طراحی کرد. این اقدام باعث کاهش ۵۰ درصدی حجم کاری مهندسان ناسا شده و مسیر را برای ماموریتهای خودگردان آینده هموار میکند.

نسخه جدید Jaeger با بازطراحی کامل بر پایه OpenTelemetry، امکان ردیابی دقیق فراخوانهای مدلهای زبانی و زنجیرههای استدلالی را فراهم کرده است. این ابزار اکنون به مهندسان اجازه…

شرکت OpenAI در راهنمای جدید خود اعلام کرد که توسعهدهندگان باید پرامپتهای قدیمی را کنار بگذارند. در GPT-5.5، دستورات مفصل و فرآیندمحور باعث کاهش کیفیت پاسخها میشوند و رویکرد…