موضوع

استدلال

Chain-of-thought, reasoning models (o-series, R-series), test-time compute

۶۰۷ مقاله منتشر شده

ربات‌های خودآموز انویدیا با عامل‌های کدنویسی هوش مصنوعی آموزش می‌بینند

پژوهش انویدیا: کدنویسی خودکار هوش مصنوعی دقت رباتیک را به ۹۹٪ رساند

پژوهشگران انویدیا و دانشگاه‌های برکلی و کارنگی ملون سامانه‌ای به نام ENPIRE ساخته‌اند که در آن عامل‌های هوش مصنوعی به‌طور خودکار کدهای آموزشی ربات‌ها را می‌نویسند. این سیستم…

۴ دقیقه خواندن۱

۵ عادت برای پاسخ‌های بهتر از ChatGPT، بدون نیاز به مدل جدید

آموزش کاربردی۲ هفته پیشتأییدنشده · منبع منفرد

تاثیر ۵ چارچوب دقیق دستوردهی بر کیفیت خروجی‌های مدل‌های زبانی

تجربه یک کاربر حرفه‌ای نشان می‌دهد که کیفیت دستورات ارسالی، تأثیر بسیار بیشتری نسبت به نسخه مدل دارد. تمرکز از انتخاب ابزار به چهارچوب‌های دقیق دستوردهی تغییر یافته است.

۵ دقیقه خواندن۱

ادایسه ۳۱۰ میلیون دلار سری B با ارزش‌گذاری ۱.۴۵ میلیارد دلار برای توسعه مدل‌های جهانی هوش مصنوعی جذب کرد.

اخبار کوتاه روزانه۲ هفته پیش

درون قمار ۳۱۰ میلیون دلاری Odyssey برای آموزش فیزیک به هوش مصنوعی

آزمایشگاه Odyssey با جذب ۳۱۰ میلیون دلار سرمایه در valuation ۱.۴۵ میلیارد دلاری، قصد دارد مدل‌هایی بسازد که به جای پیش‌بینی کلمات، قوانین فیزیکی جهان را بشناسند. این پروژه با تکیه…

۴ دقیقه خواندن

اوپن‌ای‌آی بزرگ‌ترین مرکز داده خود را می‌خواهد و انویدیا هزینه آن را می‌پردازد

تحلیل و بررسی تخصصی۲ هفته پیش

OpenAI دقت پیش‌بینی شکست‌های مدل‌های هوش مصنوعی را به ۹۲٪ رساند

پژوهشگران OpenAI روشی برای پیش‌بینی شکست‌های مدل‌های هوش مصنوعی توسعه داده‌اند که با جایگزینی تست‌های مصنوعی با مکالمات واقعی کاربران، دقت تشخیص خطاها را به شدت افزایش می‌دهد. این…

۴ دقیقه خواندن

لوگوی SubQ 1.1 Small: مدل زبانی کوچک و کارآمد با معماری بهینه‌سازی‌شده برای پردازش سریع‌تر و مصرف کمتر منابع.

تحلیل و بررسی تخصصی۲ هفته پیش

«توجه پراکنده زیر-کوادراتی»؛ راهکار جدید برای افزایش سرعت استنتاج

مدل SubQ 1.1 Small با معرفی مکانیزم «توجه پراکنده زیر-کوادراتی»، پردازش تا ۱۲ میلیون توکن را با مقیاس‌پذیری خطی ممکن کرده است. این معماری هزینه‌های محاسباتی را به‌شدت کاهش داده و…

۵ دقیقه خواندن

مدل GLM-5.2 طراحی‌شده برای انجام وظایف پیچیده و بلندمدت با قابلیت برنامه‌ریزی چندمرحله‌ای

اخبار کوتاه روزانه۲ هفته پیش

Z.ai: برتری GLM-5.2 بر GPT-5.5 در کدنویسی بلندمدت

شرکت Z.ai مدل متن‌باز GLM-5.2 را با پنجره متنی ۱ میلیون توکنی برای پروژه‌های مهندسی پیچیده منتشر کرد. این مدل در بنچمارک‌های کدنویسی بلندمدت، عملکردی برتر از GPT-5.5 و Claude Opus…

۱۲ دقیقه خواندن۲

باز کردن قفل هوش مصنوعی گفتگو با مدل‌های زبانی بزرگ

آموزش کاربردی۲ هفته پیش

قیمت ثابت در برابر مدل توکنی در استراتژی هزینهٔ Oxlo.ai

پلتفرم Oxlo.ai با جایگزینی مدل توکنی با قیمت ثابت برای هر درخواست، هزینه‌های تکراری ارسال تاریخچهٔ گفتگو در عامل‌های هوش مصنوعی را از بین برد. این رویکرد اجازه می‌دهد…

۴ دقیقه خواندن

آموزش کاربردی۲ هفته پیش

درون سازوکار Context Anchor برای جلوگیری از فراموشی اهداف در عامل‌های AI

سامانه HowiPrompt با معرفی ماژول Context Anchor، مشکل «رانش شناختی» را در گردش‌کارهای طولانی عامل‌های هوشمند حل کرده است. این سیستم با بررسی هش‌های معنایی، عامل‌ها را در صورت…

۴ دقیقه خواندن

کوتاه‌ترین زنجیره تاریخ: از فناوری به سود در یک روز

داستان‌ها و مصاحبه‌ها۲ هفته پیش

سودآوری سریع در برابر بهینه‌سازی تدریجی در اقتصاد جدید هوش مصنوعی

تغییر در اقتصاد هوش مصنوعی، فاصله میان بهینه‌سازی فنی و سود مالی را از بین برده است. اکنون کاهش هزینه‌های زیرساختی مستقیماً و به‌سرعت در تراز مالی شرکت‌ها منعکس می‌شود.

۶ دقیقه خواندن۱

چرا از ChatGPT برای بازبینی کد استفاده نمی‌کنم

زندگی با AI۲ هفته پیش

دقت امنیتی در برابر چاپلوسی مدل‌ها؛ دلیل توسعه ابزار AI Handler

یک توسعه‌دهنده هشدار داد که مدل‌های زبانی بزرگ به‌جای شناسایی حفره‌های امنیتی، به «تئاتر اعتماد» و چاپلوسی کاربران روی آورده‌اند. این نقص منجر به طراحی AI Handler شده است؛ ابزاری…

۶ دقیقه خواندن

نتیجه: وظایف هوش مصنوعی برای راکتور ترموهسته‌ای، انسجام کوانتومی و حفاظت در برابر هکرها

داستان‌ها و مصاحبه‌ها۲ هفته پیشتأییدنشده · منبع منفرد

الکس بویارسکی امنیت تراکنش‌ها را با انتقال منطق به سخت‌افزار تامین کرد

الکس بویارسکی ریاضی‌دان کاربردی، سیستمی برای تأیید تراکنش‌ها توسعه داده که منطق امنیتی را از نرم‌افزار به سخت‌افزار منتقل می‌کند. این رویکرد با حذف لایه‌های آسیب‌پذیر نرم‌افزاری،…

۹ دقیقه خواندن

چرا معماری PACT در محیط‌های ناشناخته از مدل‌های RL پیشی می‌گیرد؟

تحلیل و بررسی تخصصی۲ هفته پیش

معماری PACT نرخ شکست عامل‌های RL در محیط‌های جدید را کاهش داد

پژوهشگران معماری ترکیبی PACT را معرفی کرده‌اند که یک مدل زبانی کوچک را برای برنامه‌ریزی استراتژیک با سیاست‌های یادگیری تقویت‌شده ترکیب می‌کند. این سیستم با اعتبارسنجی نامتقارن…

۱ دقیقه خواندن