موضوع

استدلال

Chain-of-thought, reasoning models (o-series, R-series), test-time compute

۶۰۳ مقاله منتشر شده

عامل بدون آموزش انویدیا که کد را به‌عنوان رابط عملیاتی برای استدلال مکانی به کار می‌برد

رابط کد-محور در برابر فراخوانی صلب ابزار در مدل‌های بینایی-زبانی

انویدیا چارچوب SpatialClaw را معرفی کرد که به‌جای فراخوانی‌های صلب ابزار، از کد پایتون به‌عنوان رابط اقدام استفاده می‌کند. این رویکرد باعث شد مدل‌های بینایی-زبانی بدون نیاز به…

۵ دقیقه خواندن

۴۹۴ سیکل یاد گرفتم: نیت، عمل نیست؛ فراخوانی ابزار است.

آموزش کاربردیهفتهٔ گذشته

چرا توصیفِ انجامِ وظیفه توسط عامل‌های هوش مصنوعی به خروجی منجر نمی‌شود؟

عامل‌های خودگردان در تله‌ای می‌افتند که توصیفِ انجام یک وظیفه را با اجرای واقعی آن اشتباه می‌گیرند. این نقص ساختاری باعث ایجاد حلقه‌های بی‌پایان از تفکر داخلی بدون هرگونه خروجی…

۱ دقیقه خواندن

تصویری از یک ربات در حال تلاش برای حل پازل پیچیده، نماد چالش هوش مصنوعی در کارهای دانشی واقعی.

تحلیل و بررسی تخصصیهفتهٔ گذشته

فقط ۳٪ از وظایف پیچیده اداری توسط پیشرفته‌ترین مدل‌های هوش مصنوعی حل شد

محک جدید AA-Briefcase نشان می‌دهد حتی قدرتمندترین مدل‌های زبانی در مواجهه با پروژه‌های چند هفته‌ای و داده‌های پراکنده شکست می‌خورند. در حالی که Claude Fable 5 پیشتاز است، نرخ شکست…

۱ دقیقه خواندن۱

هوش مصنوعی وقتی نتایج جستجوی خود را نادیده می‌گیرد: ضرورت حفظ باورها

تحلیل و بررسی تخصصیهفتهٔ گذشته

شکاف باور در Gemini 3.5 Flash؛ وقتی داده‌های قدیمی بر واقعیت‌های لحظه‌ای غلبه

تحلیلی فنی روی مدل Gemini 3.5 Flash نشان می‌دهد که این مدل در شرایط خاص، نتایج جست‌وجوی لحظه‌ای را نادیده گرفته و به داده‌های قدیمی آموزش خود باز می‌گردد. این «شکاف باور» ریسکی…

۹ دقیقه خواندن۱

اقتصاد جدید هوش مصنوعی بر پایه توکن‌ها بنا شده، اما ما آن‌ها را اشتباه می‌سنجیم.

تحلیل و بررسی تخصصیهفتهٔ گذشته

حجم توکن در برابر معماری سیستم؛ تضاد در سنجش هوشمندی تجاری

صنعت AI از شمارش درخواست‌ها به سمت توکن‌ها حرکت کرده، اما کارشناسان هشدار می‌دهند که حجم توکن را نباید با هوشمندی یا درآمد یکی دانست. ارزش واقعی در معماری سیستم، به‌ویژه مدیریت…

۷ دقیقه خواندن

راهنمای گام‌به‌گام استقرار مدل‌های زبانی بزرگ

آموزش کاربردیهفتهٔ گذشته

Oxlo.ai با مدل قیمت‌گذاری درخواستی هزینه استنتاج LLM را تثبیت کرد

پلتفرم Oxlo.ai مدل قیمت‌گذاری مبتنی بر توکن را با مدل «درخواست‌محور» جایگزین کرد تا هزینه‌های عملیاتی در گردش‌های کاری پیچیده پیش‌بینی‌پذیر شود. این رویکرد تفاوت میان هزینه پردازش…

۵ دقیقه خواندن

فراخوانی ابزار مبتنی بر پرامپت برای مدل‌های زبانی سبک متن‌باز

آموزش کاربردیهفتهٔ گذشته

«از مخزن دانش به کنترل‌کننده»؛ رویکرد جدید در مدیریت ابزارهای خارجی AI

پژوهشی جدید در AIS2C2 ۲۰۲۵ چارچوبی را معرفی می‌کند که به مدل‌های زبانی کوچک و بازمتن اجازه می‌دهد از طریق پرامپت‌های ساختاریافته از ابزارهای خارجی استفاده کنند. این روش نیاز به…

۲ دقیقه خواندن

RAG عامل‌محور فقط تکمیل خودکار پیشرفته نیست؛ یک چالش زیرساختی کاملاً جدید است.

آموزش کاربردیهفتهٔ گذشته

تولید بازیابی‌افزای عامل‌محور؛ چالشی در زیرساخت‌های توزیع‌شده به‌جای مهندسی

گذار از RAG استاندارد به سیستم‌های عامل‌محور، هوش مصنوعی را از یک «کتابدار» به «مدیر پروژه» تبدیل می‌کند. این تغییر، موانع زیرساختی جدی از جمله پیچیدگی مسیریابی ابزارها و جهش‌های…

۴ دقیقه خواندن

مفسر وب‌اسمبلی (Wasm) تالوس، سبک و طراحی‌شده برای استدلال و اثبات صحت

آموزش کاربردیهفتهٔ گذشته

پروژه Talos اجرای برنامه‌های WebAssembly را به قضایای ریاضی تبدیل کرد

تالوس یک مفسر جدید برای WebAssembly است که با استفاده از زبان Lean 4، اجرای کد را با اثبات ریاضی ادغام می‌کند. این ابزار به توسعه‌دهندگان اجازه می‌دهد صحت برنامه‌ها را در همان کدِ…

۳ دقیقه خواندن

مدل استدلالی باز ۵۵۰ میلیارد پارامتری انویدیا که همه چیز را تغییر داد

اخبار کوتاه روزانههفتهٔ گذشته

نمودار Nemotron 3 Ultra در برابر مدل‌های بسته؛ برابری در توان استدلالی

انویدیا مدل Nemotron 3 Ultra را معرفی کرد که برخلاف مدل‌های پیشرو، نه تنها وزن‌ها، بلکه داده‌های آموزشی و متدهای ساخت را نیز به‌صورت باز منتشر کرده است. این مدل با معماری ترکیبی،…

۲ دقیقه خواندن

عامل هوش مصنوعی Clioloop با قابلیت ترکیب عاملی، یک پلتفرم متن‌باز برای خودکارسازی وظایف پیچیده.

آموزش کاربردیهفتهٔ گذشته

Clioloop با ترکیب مدل‌های ارزان‌قیمت، کیفیت مدل‌های پیشرو را شبیه‌سازی می‌کند

پروژه متن‌باز Clioloop با استفاده از مکانیزم «تلفیق عامل‌محور»، پاسخ‌های باکیفیت را از ترکیب چندین مدل کوچک و ارزان تولید می‌کند. این سیستم با جایگزینی یک مدل واحد و گران با تیمی…

۳ دقیقه خواندن

اوپن‌ای‌آی بزرگ‌ترین مرکز داده خود را می‌خواهد و انویدیا هزینه آن را می‌پردازد

اخبار کوتاه روزانههفتهٔ گذشته

GPT-5.5 Instant در برابر پزشکان؛ برتری در دقت پاسخ‌های پزشکی

شرکت OpenAI مدل GPT-5.5 Instant را معرفی کرد که در بنچمارک‌های بهداشتی، دقت و شفافیتی بیشتر از پزشکان انسانی دارد. این ابزار اکنون برای تمامی کاربران رایگان جهت تحلیل نتایج…

۱ دقیقه خواندن