موضوع

استدلال

Chain-of-thought, reasoning models (o-series, R-series), test-time compute

۶۰۰ مقاله منتشر شده

چرا پیروزی‌های کلود در بیوانفورماتیک هنوز «شکننده» هستند؟

بنچمارک جدید Anthropic نشان می‌دهد مدل‌های Claude می‌توانند معماهای بیولوژیکی را حل کنند که حتی متخصصان انسانی از پس آن‌ها برنمی‌آیند. با این حال، «شکاف قابلیت» در تکرارپذیری…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

رمزگشایی از DeepSeek V4: وقتی حافظه استنتاج ۹۰ درصد سبک‌تر می‌شود

دیپ‌سیک با معرفی مدل‌های V4-Pro و V4-Flash، معماری جدیدی را برای کاهش چشمگیر هزینه‌های استنتاج ارائه کرد. این مدل‌ها با پنجره بافتی ۱ میلیون توکنی، مسیر را برای ظهور عامل‌های…

۲ دقیقه خواندن

اخبار کوتاه روزانه۲ ماه پیش

رمزگشایی از AlphaMaze: استدلال بصری بدون نیاز به تصویر

مدل AlphaMaze ثابت کرد که برای درک فضای سه‌بعدی و حل هزارتوها، نیازی به پردازش تصویر نیست. این مدل ۱.۵ میلیارد پارامتری با استفاده از توکن‌های متنی، نقشه‌ای ذهنی از محیط می‌سازد و…

۳ دقیقه خواندن

اخبار کوتاه روزانه۲ ماه پیش

تله‌ی بنچمارک‌ها: چرا GPT-5.5 با وجود رکوردشکنی، ۸۶ درصد توهم می‌زند؟

مدل جدید OpenAI در حالی که صدرنشین شاخص‌های هوش مصنوعی شده، نرخ توهمات تکان‌دهنده‌ای را ثبت کرده است. این تضاد نشان می‌دهد که قدرت محاسباتی لزوماً به معنای قابلیت اعتماد در دنیای…

۳ دقیقه خواندن

$پایان عصر مدل‌های حجیم؟ Phi-4-mini قواعد بازی را تغییر می‌دهد$

اخبار کوتاه روزانه۲ ماه پیش

پایان عصر مدل‌های حجیم؟ Phi-4-mini قواعد بازی را تغییر می‌دهد

مایکروسافت با معرفی Phi-4-mini-instruct، مدلی با ۳.۸ میلیارد پارامتر عرضه کرد که در ریاضیات و استدلال، رقبای دو برابر بزرگ‌تر خود را شکست می‌دهد. این مدل با پنجره بافت ۱۲۸ هزار…

۲ دقیقه خواندن

اخبار کوتاه روزانه۲ ماه پیش

پایان عصر مدل‌های حجیم؛ Qwen3.6-27B قواعد کدنویسی را تغییر داد

مدل جدید علی‌بابا با ۲۷ میلیارد پارامتر، مدل غول‌پیکر ۳۹۷ میلیاردی предшеل خود را در بنچمارک‌های کدنویسی شکست داد. این دستاورد ثابت می‌کند که بهینه‌سازی معماری بر حجم عظیم داده‌ها…

۲ دقیقه خواندن

اخبار کوتاه روزانه۲ ماه پیش

پایان عصر بردارهای معنایی؛ آیا استدلال جایگزین جستجوی شباهت می‌شود؟

پلتفرم PageIndex با حذف کامل بردارهای معنایی و جایگزینی آن‌ها با ساختار درختی و استدلال مدل‌های زبانی، بازیابی داده‌ها را دگرگون کرده است. این روش ادعا می‌کند در تحلیل اسناد…

۳ دقیقه خواندن

اخبار کوتاه روزانه۲ ماه پیش

پایان عصر سرورهای گران‌قیمت: DeepSeek-R1 روی سخت‌افزار خانگی می‌نشیند

تیم Unsloth با ارائه نسخه‌های بهینه‌شده‌ی DeepSeek-R1، مدل ۶۷۱ میلیارد پارامتری را برای سخت‌افزارهای مصرف‌کننده در دسترس قرار داد. این دستاورد به لطف تکنیک کوانتایزیشن ۱.۵۸ بیتی،…

۳ دقیقه خواندن

اخبار کوتاه روزانه۲ ماه پیش

ضربه‌ی Phi-4 به Whisper؛ انقلاب مدل‌های چندوجهی کوچک

مایکروسافت با معرفی Phi-4-multimodal-instruct، مدل‌های غول‌آسای صوتی را به چالش کشید. این مدل ۵.۶ میلیارد پارامتری با ترکیب متن، تصویر و صوت در یک شبکه واحد، رکورد جدیدی در دقت…

۳ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

پایان عصر برنامه‌ریزی دستی؛ هوش مصنوعی فرمان رانندگی در مریخ را گرفت

برای اولین بار، یک هوش مصنوعی مسیر حرکت یک کاوشگر مریخی را طراحی کرد. این اقدام باعث کاهش ۵۰ درصدی حجم کاری مهندسان ناسا شده و مسیر را برای ماموریت‌های خودگردان آینده هموار می‌کند.

۳ دقیقه خواندن

اخبار کوتاه روزانه۲ ماه پیش

پایان عصر جعبه سیاه: Jaeger v2 و انقلاب در ردیابی عامل‌های هوش مصنوعی

نسخه جدید Jaeger با بازطراحی کامل بر پایه OpenTelemetry، امکان ردیابی دقیق فراخوان‌های مدل‌های زبانی و زنجیره‌های استدلالی را فراهم کرده است. این ابزار اکنون به مهندسان اجازه…

۳ دقیقه خواندن

اخبار کوتاه روزانه۲ ماه پیش

پایان عصر پرامپت‌های مفصل؛ چرا GPT-5.5 دستورات قدیمی را رد می‌کند؟

شرکت OpenAI در راهنمای جدید خود اعلام کرد که توسعه‌دهندگان باید پرامپت‌های قدیمی را کنار بگذارند. در GPT-5.5، دستورات مفصل و فرآیندمحور باعث کاهش کیفیت پاسخ‌ها می‌شوند و رویکرد…

۲ دقیقه خواندن