موضوع

استدلال

Chain-of-thought, reasoning models (o-series, R-series), test-time compute

۶۰۳ مقاله منتشر شده

فشرده‌سازی ۶ برابری تفکر: مایکروسافت چگونه هزینه استنتاج را کاهش داد؟

مایکروسافت با معرفی OpenMementos، روشی برای جایگزینی استدلال‌های طولانی با خلاصه‌های فشرده ارائه کرد. این متد مصرف توکن‌ها را تا ۶ برابر کاهش می‌دهد بدون آنکه دقت مدل در مسائل…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

گروک در برابر سکوت: چگونه xAI تأخیر استدلال صوتی را حذف کرد؟

مدل جدید xAI با نام grok-voice-think-fast-1.0 با حذف تأخیرهای مکالمه‌ای، رقبای خود یعنی Gemini و GPT را در بنچمارک‌های صوتی شکست داد. این سیستم هم‌اکنون در پشتیبانی مشتریان…

۳ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

TinyR1-32B: وقتی استراتژی داده بر حجم پارامترها پیروز می‌شود

مدل TinyR1-32B-Preview با وجود اندازه کوچک‌تر، رقیب ۷۰ میلیاردی خود را در بنچ‌مارک‌های استدلالی شکست داد. این دستاورد از طریق ترکیب متخصص‌های دامنه‌ای و استفاده از ابزار Mergekit…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

۱۳.۵ هزار تسک مصنوعی: ClawGym چگونه مرزهای عامل‌های شخصی را جابه‌جا کرد

پژوهشگران با معرفی ClawGym، راهکاری برای آموزش عامل‌های هوش مصنوعی قادر به اجرای گردش‌کارهای پیچیده محلی ارائه دادند. این سیستم با تولید ۱۳.۵ هزار تسک مصنوعی و یک بنچ‌مارک…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

پایان توهمات کدنویسی: سازوکاری که AI را مجبور به نظم می‌کند

یک چارچوب پژوهشی جدید، متد TDD را به عنوان یک لایه‌ی حاکمیتی سخت‌گیرانه برای تولید کد توسط عامل‌های AI معرفی کرده است. این سیستم با جداسازی پیشنهادهای مدل از مرجع تصمیم‌گیرنده،…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

رمزگشایی از AGEL-Comp: پایان توهمات استدلالی در عامل‌های هوش مصنوعی

پژوهشگران چارچوب جدیدی به نام AGEL-Comp را معرفی کردند که با ترکیب منطق نمادین و شبکه‌های عصبی، ضعف مدل‌های زبانی در حل تکالیف پیچیده را برطرف می‌کند. این سیستم با جایگزینی…

۲ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

تله‌ی «کدنویسی حسی»: چرا ابزارهای AI شما را کندتر می‌کنند؟

هوش مصنوعی اغلب در ۳۰ درصد پایانی کارهای پیچیده شکست می‌خورد و باعث کاهش بهره‌وری می‌شود. راهکار خروج از این بن‌بست، جایگزینی پرامپت‌های ساده با یک گردش‌کار ساختاریافته و مبتنی بر…

۳ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

تکنیکی برای نجات عامل‌های هوش مصنوعی از سقوط‌های مرگبار

پژوهشگران چارچوب SAS را معرفی کردند که به عامل‌های یادگیری تقویت‌شده اجازه می‌دهد بدون نیاز به بازآموزی، خود را با محیط‌های جدید تطبیق دهند. این سیستم با استفاده از «تخیل…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

درون معماری Naamah: وقتی مدل‌های استدلالی جایگزین انسان می‌شوند

پژوهشگران با خلق مجموعه‌داده Naamah، بیش از ۱۰۰ هزار جمله مصنوعی برای زبان سانسکریت تولید کردند تا مشکل کمبود داده در شناسایی موجودات نام‌گذاری شده را حل کنند. این پروژه ثابت…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

پایان سلطه‌ی مدل‌های حجیم: چگونه Granite 4.1 قواعد بازی را تغییر داد

IBM با معرفی خانواده‌ی Granite 4.1 ثابت کرد که مدل‌های کوچک‌تر با داده‌های باکیفیت می‌توانند مدل‌های غول‌پیکر را شکست دهند. نسخه‌ی ۸ میلیاردی این مدل در بنچمارک‌های کلیدی، عملکرد…

۳ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

CheXthought: ۶ میلیون نقطه توجه بصری برای پایان دادن به توهمات پزشکی

پژوهشگران مجموعه‌داده عظیم و چندوجهی CheXthought را معرفی کردند که مسیر تفکر و نقاط تمرکز رادیولوژیست‌ها را ثبت کرده است. این ابزار با آموزش مدل‌ها برای «دیدن» مانند انسان، توهمات…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

رمزگشایی از DIRECT: پایان سلطه‌ی جعبه‌های سیاه در مدل‌سازی علّی

محققان روشی به نام DIRECT ابداع کرده‌اند که به مدل‌های عصبی اجازه می‌دهد بدون نیاز به پس‌انتشار (Backpropagation)، جهت علت و معلول را یاد بگیرند. این دستاورد، مسیر را برای ساخت…

۲ دقیقه خواندن