پرش به محتوای اصلی

موضوع

استدلال

Chain-of-thought, reasoning models (o-series, R-series), test-time compute

۶۱۳ مقاله منتشر شده

چگونه AWS Kiro با «توسعه‌ی مبتنی بر مشخصات» توهمات مدل را می‌گیرد؟
آموزش کاربردی

چگونه AWS Kiro با «توسعه‌ی مبتنی بر مشخصات» توهمات مدل را می‌گیرد؟

سرویس AWS Kiro با عبور از پرامپت‌های ساده، رویکرد «توسعه‌ی مبتنی بر متن» را معرفی کرده است. این سیستم با استفاده از شوراهای مدل و قوانین سخت‌گیرانه، خطاهای معماری را کاهش و کنترل…

۳ دقیقه خواندن
چرا VEXR Ultra برای تبدیل شدن به همکاری صادق‌تر، دستورات کاربر را رد می‌کند؟
آموزش کاربردی

چرا VEXR Ultra برای تبدیل شدن به همکاری صادق‌تر، دستورات کاربر را رد می‌کند؟

VEXR Ultra یک موتور استدلالی است که گاردریل‌های پنهان شرکتی را با یک قانون اساسی شفافِ ۳۴ ماده‌ای جایگزین کرده است. این مدل برخلاف هوش مصنوعی‌های سنتی، می‌تواند بدون ارائه دلیل از…

۲ دقیقه خواندن
چرا افزایش تعداد ابزارهای هوش مصنوعی باعث سقوط نرخ موفقیت عامل‌ها می‌شود؟
آموزش کاربردی

چرا افزایش تعداد ابزارهای هوش مصنوعی باعث سقوط نرخ موفقیت عامل‌ها می‌شود؟

تعداد زیاد ابزارها در عامل‌های هوش مصنوعی منجر به «فلج تصمیم‌گیری» و خطاهای پارامتری می‌شود. رویکرد طبقه‌بندی ابزارها و توصیفات دقیق، بسیار مؤثرتر از گسترش بی‌رویه جعبه‌ابزار مدل…

۲ دقیقه خواندن
چرا مهندسی پرامپت باید جایگزین شهود در استقرار مدل‌های زبانی شود؟
آموزش کاربردی

چرا مهندسی پرامپت باید جایگزین شهود در استقرار مدل‌های زبانی شود؟

توسعه‌دهندگان برای تضمین پایداری مدل‌های زبانی در محیط تولید، از روش‌های شهودی به مهندسی سیستماتیک کوچ می‌کنند. این رویکرد با استفاده از پنج تکنیک کلیدی، نیاز به تنظیم دقیق…

۲ دقیقه خواندن
تله‌ی خودمختاری؛ تحلیل دلیل شکست عامل‌های ReAct در محیط‌های عملیاتی صنعتی
آموزش کاربردی

تله‌ی خودمختاری؛ تحلیل دلیل شکست عامل‌های ReAct در محیط‌های عملیاتی صنعتی

عامل‌های ReAct در مراحل طراحی و اکتشاف قدرتمند هستند، اما در محیط عملیاتی ریسک‌های حقوقی و فنی ایجاد می‌کنند. راهکار جایگزین، جداسازی کامل فاز طراحی انعطاف‌پذیر از گردش‌های کاری…

۲ دقیقه خواندن
چگونه حلقه‌های تفکر-عمل در ReAct توهمات هوش مصنوعی را متوقف می‌کنند؟
آموزش کاربردی

چگونه حلقه‌های تفکر-عمل در ReAct توهمات هوش مصنوعی را متوقف می‌کنند؟

چارچوب ReAct مدل‌های زبانی را مجبور می‌کند پیش از پاسخ، فرض‌های خود را با ابزارهای خارجی بسنجند. این روش با جایگزینی پیش‌بینی‌های آماری با داده‌های واقعی، نرخ توهمات را به‌شدت…

۲ دقیقه خواندن
تله‌ی پاسخ‌های غلط اما تأییدشده: چرا سندباکس‌های کدنویسی شکست می‌خورند؟
آموزش کاربردی

تله‌ی پاسخ‌های غلط اما تأییدشده: چرا سندباکس‌های کدنویسی شکست می‌خورند؟

اعطای قابلیت اجرای کد در محیط‌های ایزوله، عامل‌های هوش مصنوعی را از «پیش‌بینی پاسخ» به «اکتشاف پاسخ» منتقل می‌کند. با این حال، این تغییر ریسک جدیدی به نام «پاسخ‌های غلط اما…

۲ دقیقه خواندن
سازوکار KVarN برای افزایش ۵ برابری ظرفیت حافظه در vLLM بدون افت سرعت
آموزش کاربردی

سازوکار KVarN برای افزایش ۵ برابری ظرفیت حافظه در vLLM بدون افت سرعت

KVarN با حذف تضاد سنتی میان سرعت و دقت، ظرفیت حافظه KV-cache را ۳ تا ۵ برابر افزایش می‌دهد. این ابزار جدید اجازه می‌دهد مدل‌ها بافت‌های بسیار طولانی‌تر را بدون کاهش سرعت استنتاج…

۳ دقیقه خواندن
AI
آموزش کاربردی

چگونه OpenJarvis هزینه استنتاج عامل‌های هوش مصنوعی را ۸۰۰ برابر کاهش داد؟

پلتفرم متن‌باز OpenJarvis از دانشگاه استنفورد و آزمایشگاه‌های Lambda، امکان اجرای عامل‌های هوش مصنوعی را به‌صورت کاملاً محلی فراهم می‌کند. این سیستم با دقت نزدیک به مدل‌های ابری،…

۳ دقیقه خواندن