موضوع

استدلال

Chain-of-thought, reasoning models (o-series, R-series), test-time compute

۶۰۰ مقاله منتشر شده

تزریق پرامپت، سردرگمی نقش است و دروازه MCP شما نمی‌تواند آن را ببیند

جعل زنجیره‌های تفکر، نرخ موفقیت جیل‌بریک را به ۶۰٪ رساند

پژوهشگران دریافتند که تقلید از سبک تفکر داخلی مدل‌ها، مؤثرترین راه برای دور زدن حفاظ‌های امنیتی است. این آسیب‌پذیری به‌ویژه در درگاه‌های MCP که محتوای پاسخ ابزارها را بررسی…

۴ دقیقه خواندن

نمودار مقایسه دقت پیش‌بینی توکن‌ها در مدل ترکیبی نسبت به مدل‌های پایه

تحلیل و بررسی تخصصی۳ روز پیش

چرا مدل‌های ترکیبی Olmo در کپی‌برداری دقیق از ترنسفورمرها ضعیف‌ترند؟

پژوهشگران دریافتند که معماری‌های ترکیبی (Hybrid) در درک کلمات محتوایی و ردیابی وضعیت‌های پیچیده موفق‌تر هستند. با این حال، این مدل‌ها در کپی‌برداری دقیق و تطبیق ساختاری، همچنان…

۶ دقیقه خواندن

شرط ۲.۳ میلیارد دلاری جنرال اینتویشن: بازی‌های ویدیویی می‌توانند عامل‌های هوش مصنوعی را برای دنیای واقعی آموزش دهند.

اخبار کوتاه روزانه۳ روز پیش

درون معماری General Intuition؛ تبدیل میلیون‌ها ساعت گیم‌پلی به مهارت رباتیک

استارتاپ General Intuition برای آموزش استدلال فضایی ربات‌ها از میلیون‌ها ساعت داده‌های بازی‌های ویدئویی استفاده می‌کند. این شرکت با جذب ۳۲۰ میلیون دلار سرمایه، قصد دارد شکاف بین…

۸ دقیقه خواندن

پرطرفدارترین مقالات هوش مصنوعی در هاگینگ فیس - ۲۵ ژوئن ۲۰۲۶

تحلیل و بررسی تخصصی۳ روز پیش

۱۰ مقالهٔ برتر Hugging Face محوریت پژوهش AI را از چت‌بات به عامل‌های فعال تغییر

خوشه‌ای از مقالات پربازدید در Hugging Face نشان‌دهنده گذاری استراتژیک از مدل‌های پاسخ‌دهنده به عامل‌هایی است که قادر به مدل‌سازی جهان و اجرای عملیات در زمان واقعی هستند. این تحول…

۱۰ دقیقه خواندن

کنترل‌های جدید وظایف زمان‌بندی‌شده، ChatGPT را به دستیار شخصی هوشمند نزدیک‌تر می‌کند.

اخبار کوتاه روزانه۳ روز پیش

GPT-5.5 Instant با درک اهداف پنهان کاربر، تحلیل بستر گفتگو را تغییر داد

شرکت OpenAI مدل GPT-5.5 Instant را به‌روزرسانی کرد تا به‌جای تکرار پاسخ‌های کلی، هدف واقعی کاربر را درک کند. این تغییر باعث بهبود حفظ بستر گفتگو در چت‌های پیچیده و فعال‌سازی…

۱ دقیقه خواندن

نوشتن یک پارسر SQL ۷۰ برابر سریع‌تر با حداقل نگاه به کد - PostHog

آموزش کاربردی۳ روز پیش

PostHog با کمک Claude سرعت تجزیه‌وتحلیل SQL را ۴۵۴ برابر کرد

شرکت PostHog تجزیه‌کننده SQL خود را که پیش‌تر بر پایه C++ بود با نسخه‌ای به زبان Rust جایگزین کرد که توسط هوش مصنوعی نوشته شده است. این تغییر معماری با استفاده از تست‌های مبتنی بر…

۸ دقیقه خواندن

طراحی زمان اجرای عامل هوشمند با ابزارها، حافظه، مجوزها، مهارت‌ها و هماهنگی چندعاملی

آموزش کاربردی۳ روز پیش

OpenHarness با جداسازی تفکر از اجرا، استقرار ایمن عامل‌های هوشمند را ممکن کرد

چارچوب OpenHarness با تفکیک لایه‌ی استدلال مدل از محیط اجرای ابزارها، استقرارهای تجاری عامل‌های هوش مصنوعی را ایمن‌تر می‌کند. این سیستم از طریق مجوزهای لایه‌بندی شده و مدیریت پویا…

۳۱ دقیقه خواندن

هوش مصنوعی عامل‌محور: مسیر سامانه‌های هوشمند خودگردان

آموزش کاربردی۳ روز پیش

عامل‌های هوش مصنوعی: گذار از تولید محتوا به اجرای خودکار اهداف

هوش مصنوعی عامل‌محور از مدل‌های واکنشی که فقط به پرامپت پاسخ می‌دهند، فراتر رفته و به سامانه‌هایی تبدیل شده که می‌توانند برنامه‌ریزی کنند و ابزارهای خارجی را به کار بگیرند. این…

۹ دقیقه خواندن۱

چارچوب عامل هوشمند که همه چیز را درباره کنترل سخت‌افزار زیر و رو کرد (بخش ۱)

آموزش کاربردی۳ روز پیش

«کنترل ربات با زبان طبیعی»؛ هدف جدید چارچوب Strands Labs

آمازون با معرفی Strands Labs، امکان کنترل سخت‌افزارهای رباتیک را از طریق دستورات ساده‌ی متنی به‌جای توابع ریاضی پیچیده فراهم کرد. این چارچوب ترکیبی از مدل‌های VLA در لبه برای…

۸ دقیقه خواندن

LEVI: نتایج بهتر ADRS با کسری از هزینه | ADRS — پژوهش مبتنی بر هوش مصنوعی برای سیستم‌ها

آموزش کاربردی۴ روز پیش

سامانه LEVI: کاهش ۶.۷ برابری هزینه‌ها با اتوماسیون کشف الگوریتم

سامانه LEVI با اتوماسیون کشف الگوریتم‌های سیستمی، هزینه‌های عملیاتی را ۳ تا ۷ برابر کاهش داده و در عین حال به نتایج پیشرو (SOTA) رسیده است. این مدل با تفکیک وظایف بین مدل‌های کوچک…

۱۲ دقیقه خواندن

گزارش: دولت آمریکا متا را به اشتراک‌گذاری مدل‌های هوش مصنوعی تشویق می‌کند

اخبار کوتاه روزانه۴ روز پیش

«اشتراک‌گذاری مدل‌ها برای امنیت»؛ درخواست واشنگتن از متا

دولت ایالات متحده از شرکت متا می‌خواهد مدل‌های خود را برای شناسایی نقاط ضعف امنیتی تحویل دهد. متا تنها شرکت بزرگ توسعه‌دهنده است که هنوز با این درخواست‌های داوطلبانه همکاری نکرده…

۲ دقیقه خواندن

مدیرعامل پانگرام: مدل‌های زبانی با تکرار استدلال‌های یکسان خود را لو می‌دهند

داستان‌ها و مصاحبه‌ها۴ روز پیش

خوشه‌های منطقی: ردپای پنهان هوش مصنوعی در ساختار استدلال‌ها

مدیرعامل شرکت Pangram معتقد است مدل‌های زبانی با وجود تسلط بر دستور زبان، فاقد تنوع استدلالی انسان‌ها هستند. این ابزار تشخیص AI از طریق شناسایی الگوهای ساختاری و محدود بودن طیف…

۱ دقیقه خواندن