پرش به محتوای اصلی

موضوع

استدلال

Chain-of-thought, reasoning models (o-series, R-series), test-time compute

۶۰۳ مقاله منتشر شده

فشرده‌سازی ۶ برابری تفکر: مایکروسافت چگونه هزینه استنتاج را کاهش داد؟
آموزش کاربردی

فشرده‌سازی ۶ برابری تفکر: مایکروسافت چگونه هزینه استنتاج را کاهش داد؟

مایکروسافت با معرفی OpenMementos، روشی برای جایگزینی استدلال‌های طولانی با خلاصه‌های فشرده ارائه کرد. این متد مصرف توکن‌ها را تا ۶ برابر کاهش می‌دهد بدون آنکه دقت مدل در مسائل…

۲ دقیقه خواندن
۱۳.۵ هزار تسک مصنوعی: ClawGym چگونه مرزهای عامل‌های شخصی را جابه‌جا کرد

۱۳.۵ هزار تسک مصنوعی: ClawGym چگونه مرزهای عامل‌های شخصی را جابه‌جا کرد

پژوهشگران با معرفی ClawGym، راهکاری برای آموزش عامل‌های هوش مصنوعی قادر به اجرای گردش‌کارهای پیچیده محلی ارائه دادند. این سیستم با تولید ۱۳.۵ هزار تسک مصنوعی و یک بنچ‌مارک…

۲ دقیقه خواندن
پایان توهمات کدنویسی: سازوکاری که AI را مجبور به نظم می‌کند

پایان توهمات کدنویسی: سازوکاری که AI را مجبور به نظم می‌کند

یک چارچوب پژوهشی جدید، متد TDD را به عنوان یک لایه‌ی حاکمیتی سخت‌گیرانه برای تولید کد توسط عامل‌های AI معرفی کرده است. این سیستم با جداسازی پیشنهادهای مدل از مرجع تصمیم‌گیرنده،…

۲ دقیقه خواندن
رمزگشایی از AGEL-Comp: پایان توهمات استدلالی در عامل‌های هوش مصنوعی

رمزگشایی از AGEL-Comp: پایان توهمات استدلالی در عامل‌های هوش مصنوعی

پژوهشگران چارچوب جدیدی به نام AGEL-Comp را معرفی کردند که با ترکیب منطق نمادین و شبکه‌های عصبی، ضعف مدل‌های زبانی در حل تکالیف پیچیده را برطرف می‌کند. این سیستم با جایگزینی…

۲ دقیقه خواندن
تله‌ی «کدنویسی حسی»: چرا ابزارهای AI شما را کندتر می‌کنند؟
آموزش کاربردی

تله‌ی «کدنویسی حسی»: چرا ابزارهای AI شما را کندتر می‌کنند؟

هوش مصنوعی اغلب در ۳۰ درصد پایانی کارهای پیچیده شکست می‌خورد و باعث کاهش بهره‌وری می‌شود. راهکار خروج از این بن‌بست، جایگزینی پرامپت‌های ساده با یک گردش‌کار ساختاریافته و مبتنی بر…

۳ دقیقه خواندن
درون معماری Naamah: وقتی مدل‌های استدلالی جایگزین انسان می‌شوند

درون معماری Naamah: وقتی مدل‌های استدلالی جایگزین انسان می‌شوند

پژوهشگران با خلق مجموعه‌داده Naamah، بیش از ۱۰۰ هزار جمله مصنوعی برای زبان سانسکریت تولید کردند تا مشکل کمبود داده در شناسایی موجودات نام‌گذاری شده را حل کنند. این پروژه ثابت…

۲ دقیقه خواندن
پایان سلطه‌ی مدل‌های حجیم: چگونه Granite 4.1 قواعد بازی را تغییر داد

پایان سلطه‌ی مدل‌های حجیم: چگونه Granite 4.1 قواعد بازی را تغییر داد

IBM با معرفی خانواده‌ی Granite 4.1 ثابت کرد که مدل‌های کوچک‌تر با داده‌های باکیفیت می‌توانند مدل‌های غول‌پیکر را شکست دهند. نسخه‌ی ۸ میلیاردی این مدل در بنچمارک‌های کلیدی، عملکرد…

۳ دقیقه خواندن
CheXthought: ۶ میلیون نقطه توجه بصری برای پایان دادن به توهمات پزشکی

CheXthought: ۶ میلیون نقطه توجه بصری برای پایان دادن به توهمات پزشکی

پژوهشگران مجموعه‌داده عظیم و چندوجهی CheXthought را معرفی کردند که مسیر تفکر و نقاط تمرکز رادیولوژیست‌ها را ثبت کرده است. این ابزار با آموزش مدل‌ها برای «دیدن» مانند انسان، توهمات…

۲ دقیقه خواندن