موضوع

استدلال

Chain-of-thought, reasoning models (o-series, R-series), test-time compute

۶۰۰ مقاله منتشر شده

معرفی GPT-5.6 Sol، عصر عامل‌های هوش مصنوعی Vercel و اجرای قابل تأیید Dapr 1.18

OpenAI: GPT-5.6 Sol پایداری عملیات در مقیاس تجاری را افزایش داد

شرکت OpenAI مدل GPT-5.6 Sol را برای افزایش پایداری و کارایی در محیط‌های تجاری معرفی کرد. هم‌زمان، Vercel با چارچوب Eve و Diagrid با نسخه‌ی Dapr 1.18، زیرساخت‌های مدیریت و امنیت…

۴ دقیقه خواندن

تست ۱۰ مدل هوش مصنوعی در وظایف واقعی کدنویسی: کدام برنده شد؟

آموزش کاربردیدیروز

مدل Qwen3-Coder-30B در تعادل کیفیت و هزینه بر DeepSeek پیشی گرفت

تست‌های عملی روی ۱۰ مدل کدنویسی نشان می‌دهد که Qwen3-Coder-30B بهترین کیفیت را در برابر قیمت ارائه می‌دهد، در حالی که DeepSeek V4 Flash اقتصادی‌ترین گزینه است. این یافته‌ها نیاز…

۷ دقیقه خواندن

پیش‌نمایش GPT-5.6 با سه مدل Sol، Terra و Luna: مدل‌های سطح‌بندی‌شده، استدلال جدید، دسترسی محدود

اخبار کوتاه روزانهدیروز

مدل Sol در بنچمارک Terminal-Bench 2.1 به امتیاز ۹۱.۹۱٪ رسید

اوپن‌ای‌آی از خانواده مدل‌های لایه‌بندی‌شده GPT-5.6 شامل Sol، Terra و Luna رونمایی کرد. مدل پرچم‌دار Sol با معرفی قابلیت‌های هماهنگی زیر-عاملی و استدلال حداکثری، استانداردهای…

۴ دقیقه خواندن

پرچم‌دار جدید هوش مصنوعی OpenAI در رقابت با رقیب Anthropic تحت مقررات دولتی ناپایدار راه‌اندازی شد

اخبار کوتاه روزانهدیروز

GPT-5.6 Sol با امتیاز ۹۱.۹٪ برتری OpenAI در کدنویسی عامل‌محور را تثبیت کرد

OpenAI مدل جدید GPT-5.6 Sol را برای شکست دادن Claude Mythos در حوزه‌های کدنویسی و امنیت سایبری عرضه کرد. دسترسی به این مدل به دلیل قوانین سخت‌گیرانه دولت آمریکا فعلاً محدود به…

۳ دقیقه خواندن

مدل هوش مصنوعی ۱۹ روز بدون توقف روی یک وظیفه MirrorCode برنامه‌نویسی کرد؛ هزینه اجرا: ۲۶۰۰ دلار

تحلیل و بررسی تخصصیپریروز

Epoch AI: Claude Opus 4.7 موفق به حل ۵۶٪ تسک‌های MirrorCode شد

محک جدید Epoch AI نشان می‌دهد مدل‌های زبانی اکنون قادر به بازپیاده‌سازی کامل برنامه‌های پیچیده از صفر هستند. Claude Opus 4.7 با پیشتازی در این آزمون، مرزهای توانمندی عامل‌های هوش…

۳ دقیقه خواندن

پیش‌نمایش مدل نسل بعدی GPT-5.6 Sol: هوش مصنوعی پیشرفته با قابلیت‌های نوآورانه

اخبار کوتاه روزانهپریروز

مدل Sol در برابر Mythos؛ برتری در استدلال‌های عامل‌محور و امنیت

اوپن‌ای‌آی پیش‌نمایش محدودی از سری GPT-5.6 را منتشر کرد که مدل پرچمدار آن، Sol، با تمرکز بر استدلال‌های عامل‌محور و لایه‌های امنیتی شدید عرضه شده است. این عرضه به‌صورت مرحله‌ای و…

۸ دقیقه خواندن

آیا ماشین‌ها بیدارند؟ زنده در برابر محرک — و آن چیز واحدی که هوش مصنوعی فاقد آن است

داستان‌ها و مصاحبه‌هاپریروز

سرمایه‌گذاری میلیارد دلاری ین لکون برای جایگزینی پیش‌بینی توکن با مدل‌های جهان

ین لکون با هدف عبور از محدودیت‌های مدل‌های زبانی، بیش از یک میلیارد دلار برای توسعه «مدل‌های جهان» هزینه می‌کند. منتقدان معتقدند بدون داشتن تکانه‌ی زیستی برای بقا، این سامانه‌ها…

۶ دقیقه خواندن

داور هوش مصنوعی ۲۳ از ۲۵ گرفت، اما نکته اصلی را از دست داد

آموزش کاربردیپریروز

«از بازرس به ویراستار»؛ اثر معکوس کردن تحلیل و امتیازدهی

یک توسعه‌دهنده کشف کرد که مدل‌های ارزیاب هوش مصنوعی وقتی پیش از تحلیل، به متن امتیاز می‌دهند، بازخوردهایی «صرفاً درست» اما سطحی ارائه می‌کنند. با معکوس کردن این ترتیب و اولویت…

۶ دقیقه خواندن

مسیر اتصال نامشخص: چالش تبدیل متن به SQL در پایگاه‌های داده پیچیده

آموزش کاربردیپریروز

شکاف بین کد صحیح و پاسخ درست؛ دلیل شکست Text-to-SQL در سازمان‌ها

صحت ساختاری یک کوئری SQL تضمین‌کننده‌ی دقت پاسخ‌های تجاری در محیط‌های سازمانی نیست. الگوی معماری جدید پیشنهاد می‌کند که برای جلوگیری از خطاهای گزارش‌دهی، به جای تکیه بر متادیتای…

۴ دقیقه خواندن

ساخت عامل هوش مصنوعی نانوبات در گوگل کولب با ابزارها، حافظه، مهارت‌ها و سرورهای MCP

آموزش کاربردیپریروز

۳ گام فنی برای بازسازی معماری نانوبات در حلقه‌های مستقل

یک راهنمای جامع فنی، بازسازی معماری عامل نانوبات را از پایه آموزش می‌دهد. این متد شامل پیاده‌سازی فراخوانی ابزار، حافظه نشست و سرورهای MCP در یک حلقه مستقل از ارائه‌دهنده است.

۱۸ دقیقه خواندن

۵ تکنیک مهندسی پرامپت برای بهره‌برداری بهتر از پروژه قدیمی

آموزش کاربردیپریروز

۵ تکنیک مهندسی پرامپت برای بازسازی و رمزگشایی کدهای میراثی

یک راهنمای جامع پنج استراتژی مهندسی پرامپت را برای درک و عیب‌یابی پروژه‌های قدیمی و بدون مستندات معرفی کرده است. این روش‌ها با استفاده از محدودیت‌های ساختاری و فیلترهای نقش-محور،…

۵ دقیقه خواندن

DeepReinforce مدل کدنویسی متن‌باز Ornith-1.0 را منتشر کرد: خانواده‌ای از مدل‌هایی که داربست‌های یادگیری تقویتی خود را می‌آموز

تحلیل و بررسی تخصصی۳ روز پیش

مدل Ornith-1.0 استقرار عامل‌های کدنویسی را از مهندسی دستی به یادگیری خودکار برد

DeepReinforce خانواده مدل‌های بازمتن Ornith-1.0 را معرفی کرد که قادرند ساختارهای اجرایی (Scaffolds) خود را طی یادگیری تقویتی بهینه کنند. مدل پرچم‌دار ۳۹۷ میلیارد پارامتری این…

۴ دقیقه خواندن