پرش به محتوای اصلی

موضوع

استدلال

Chain-of-thought, reasoning models (o-series, R-series), test-time compute

۶۰۳ مقاله منتشر شده

یادگیری تقویتی علّی قابل تفسیر برای پاسخ به ناهنجاری ماهواره در گروه‌های چندزبانه ذی‌نفعان
آموزش کاربردی

آیا هوش مصنوعی علّی می‌تواند دلیل اقدامات اصلاحی ماهواره را توضیح دهد؟

یک چارچوب جدید با ترکیب یادگیری تقویتی علّی و هوش مصنوعی چندزبانه، به ماهواره‌ها اجازه می‌دهد دلیل اقدامات اصلاحی خود را در زمان بروز خطا توضیح دهند. این سامانه توجیهات فنی را بر…

۹ دقیقه خواندن
شبیه‌سازی سولستیس تورینگ: بازی تقلید تعاملی سه‌بعدی با قدرت گوگل جمینی
آموزش کاربردی

عامل هوشمند در برابر انسان؛ آزمونی برای شناسایی ماشین در محیط سه‌بعدی

هیمانشو یوله برنامه‌ای وب با محیط سه‌بعدی ساخته است که در آن کاربران باید یک عامل هوشمند را از میان انسان‌ها شناسایی کنند. این پروژه با استفاده از مهندسی پرامپت، لغزش‌های زبانی…

۳ دقیقه خواندن
سام آلتمن: نسل محققان با دست‌کم گرفتن مقیاس‌پذیری، پیشرفت هوش مصنوعی را کند کردند.
اخبار کوتاه روزانه

سم آلتمن: تردید دربارهٔ قوانین مقیاس‌پذیری مانع پیشرفت هوش مصنوعی شد

مدیرعامل OpenAI ادعا می‌کند تردید پژوهشگران دربارهٔ قدرت مقیاس‌دهی، سرعت پیشرفت مدل‌های زبانی را کاهش داده است. او کشف دانش ریاضی جدید توسط AI را دلیلی بر تداوم اثرگذاری قوانین…

۱ دقیقه خواندن۳
ساخت سیستم‌های عامل هوش مصنوعی قابل اعتماد
آموزش کاربردی

معماری چندعاملی بایر؛ تبدیل هزاران گزارش پیش‌بالینی به دستیار پژوهشی

شرکت بایر با توسعه سامانه PRINCE، گزارشات نامنظم دهه‌های گذشته را به یک دستیار پژوهشی گفتگو‌محور تبدیل کرد. این پلتفرم با استفاده از معماری پیشرفته RAG و مهندسی زمینه، پیچیدگی‌های…

۳۱ دقیقه خواندن
بسته پرامپت ChatGPT چیست و چرا به آن نیاز دارید
آموزش کاربردی

بسته‌های پرامپت؛ جایگزینی برای روش آزمون و خطا در چت‌جی‌پی‌تی

بسته‌های پرامپت کتابخانه‌هایی از دستورات تست‌شده هستند که حدس و گمان را در تعامل با هوش مصنوعی حذف می‌کنند. این چارچوب‌های ساختاریافته، خروجی‌های باکیفیت و سازگار را برای…

۴ دقیقه خواندن
خروجی ارزان است. قضاوت، همان کاری است که باید انجام شود.

درون مدل آموزشی SystemThinkingLab؛ عبور از مصرف محتوا به سمت مهارت

با رایگان و فوری شدن تولید کد توسط هوش مصنوعی، ارزش مهندسی نرم‌افزار از نوشتن توابع به قضاوت‌های سطح بالای معماری منتقل شده است. پلتفرم SystemThinkingLab مدل آموزشی خود را برای…

۳ دقیقه خواندن
آرگوس‌رد — اسکن امنیتی و تست نفوذ · آرگوس‌رد
آموزش کاربردی

ArgusRed با مدل‌های تخصصی تهاجمی، حفره‌های امنیتی را به‌جای حدس، اثبات می‌کند

شرکت Cosine ابزاری به نام ArgusRed معرفی کرد که با استفاده از یک مدل زبانی تخصصی در امنیت تهاجمی، به‌جای گزارش ریسک‌های تئوریک، اکسپلویت‌های واقعی را بازتولید می‌کند. این ابزار با…

۶ دقیقه خواندن
ربات چت‌جی‌پی‌تی را مثل کامپایلر، نه معلم، استفاده می‌کنم!
آموزش کاربردیتأییدنشده · منبع منفرد

استدلال فعال در برابر مصرف غیرفعال کد در تعامل با مدل‌های زبانی

تغییر نقش ChatGPT از یک معلم به یک سیستم اعتبارسنج منطق، باعث بازگشت غریزه‌ی حل مسئله در برنامه‌نویسان می‌شود. این متد تمرکز را از مصرف غیرفعال کد به استدلال فعال و عیب‌یابی منتقل…

۲ دقیقه خواندن
مدل استنتاجی متراکم ۳ میلیارد پارامتری VibeThinker-3B بر پایه Qwen2.5-Coder-3B با خط لوله پس‌آموزش طیف به سیگنال

VibeThinker-3B: مدل ۳ میلیارد پارامتری در بنچمارک‌های ریاضی با غول‌های ۶۷۱

پژوهشگران Sina Weibo مدل VibeThinker-3B را معرفی کردند؛ یک مدل استدلالی کوچک که در وظایف ریاضی و کدنویسی با مدل‌های عظیمی چون DeepSeek V3.2 رقابت می‌کند. این مدل با استفاده از خط…

۵ دقیقه خواندن