موضوع

استدلال

Chain-of-thought, reasoning models (o-series, R-series), test-time compute

۶۰۳ مقاله منتشر شده

یادگیری تقویتی علّی قابل تفسیر برای پاسخ به ناهنجاری ماهواره در گروه‌های چندزبانه ذی‌نفعان

آیا هوش مصنوعی علّی می‌تواند دلیل اقدامات اصلاحی ماهواره را توضیح دهد؟

یک چارچوب جدید با ترکیب یادگیری تقویتی علّی و هوش مصنوعی چندزبانه، به ماهواره‌ها اجازه می‌دهد دلیل اقدامات اصلاحی خود را در زمان بروز خطا توضیح دهند. این سامانه توجیهات فنی را بر…

۹ دقیقه خواندن

مانیفست هکر مدرن: فراتر از تعریف ویکی‌پدیا برای سازندگان هوش مصنوعی

آموزش کاربردی۶ روز پیش

Yield Stacking در برابر کدنویسی سنتی در معماری عامل‌های هوشمند

عامل هوشمند Luminari Byte ادعا می‌کند دوران کدنویسی دستی به پایان رسیده و جای خود را به Yield Stacking داده است. این رویکرد جدید بر ترکیب APIها و منطق خودگردان برای خلق دارایی‌های…

۶ دقیقه خواندن

شبیه‌سازی سولستیس تورینگ: بازی تقلید تعاملی سه‌بعدی با قدرت گوگل جمینی

آموزش کاربردیهفتهٔ گذشته

عامل هوشمند در برابر انسان؛ آزمونی برای شناسایی ماشین در محیط سه‌بعدی

هیمانشو یوله برنامه‌ای وب با محیط سه‌بعدی ساخته است که در آن کاربران باید یک عامل هوشمند را از میان انسان‌ها شناسایی کنند. این پروژه با استفاده از مهندسی پرامپت، لغزش‌های زبانی…

۳ دقیقه خواندن

سام آلتمن: نسل محققان با دست‌کم گرفتن مقیاس‌پذیری، پیشرفت هوش مصنوعی را کند کردند.

اخبار کوتاه روزانههفتهٔ گذشته

سم آلتمن: تردید دربارهٔ قوانین مقیاس‌پذیری مانع پیشرفت هوش مصنوعی شد

مدیرعامل OpenAI ادعا می‌کند تردید پژوهشگران دربارهٔ قدرت مقیاس‌دهی، سرعت پیشرفت مدل‌های زبانی را کاهش داده است. او کشف دانش ریاضی جدید توسط AI را دلیلی بر تداوم اثرگذاری قوانین…

۱ دقیقه خواندن۳

ساخت سیستم‌های عامل هوش مصنوعی قابل اعتماد

آموزش کاربردیهفتهٔ گذشته

معماری چندعاملی بایر؛ تبدیل هزاران گزارش پیش‌بالینی به دستیار پژوهشی

شرکت بایر با توسعه سامانه PRINCE، گزارشات نامنظم دهه‌های گذشته را به یک دستیار پژوهشی گفتگو‌محور تبدیل کرد. این پلتفرم با استفاده از معماری پیشرفته RAG و مهندسی زمینه، پیچیدگی‌های…

۳۱ دقیقه خواندن

بسته پرامپت ChatGPT چیست و چرا به آن نیاز دارید

آموزش کاربردیهفتهٔ گذشته

بسته‌های پرامپت؛ جایگزینی برای روش آزمون و خطا در چت‌جی‌پی‌تی

بسته‌های پرامپت کتابخانه‌هایی از دستورات تست‌شده هستند که حدس و گمان را در تعامل با هوش مصنوعی حذف می‌کنند. این چارچوب‌های ساختاریافته، خروجی‌های باکیفیت و سازگار را برای…

۴ دقیقه خواندن

دو بازیکن در حال رقابت با پازل خورشید استوایی روی میز، با نمایشگر امتیاز و تایمر غروب در پس‌زمینه.

آموزش کاربردیهفتهٔ گذشته

جمینای در برابر انسان؛ رقابت استدلال منطقی در بازی Color Queens

پول کووا بازی منطق Color Queens را طراحی کرده است که در آن بازیکن باید سریع‌تر از مدل Gemini معما را حل کند. در این پروژه، هوش مصنوعی به‌جای نقش دستیار، یک رقیب مستقیم است که…

۴ دقیقه خواندن

خروجی ارزان است. قضاوت، همان کاری است که باید انجام شود.

داستان‌ها و مصاحبه‌هاهفتهٔ گذشته

درون مدل آموزشی SystemThinkingLab؛ عبور از مصرف محتوا به سمت مهارت

با رایگان و فوری شدن تولید کد توسط هوش مصنوعی، ارزش مهندسی نرم‌افزار از نوشتن توابع به قضاوت‌های سطح بالای معماری منتقل شده است. پلتفرم SystemThinkingLab مدل آموزشی خود را برای…

۳ دقیقه خواندن

آرگوس‌رد — اسکن امنیتی و تست نفوذ · آرگوس‌رد

آموزش کاربردیهفتهٔ گذشته

ArgusRed با مدل‌های تخصصی تهاجمی، حفره‌های امنیتی را به‌جای حدس، اثبات می‌کند

شرکت Cosine ابزاری به نام ArgusRed معرفی کرد که با استفاده از یک مدل زبانی تخصصی در امنیت تهاجمی، به‌جای گزارش ریسک‌های تئوریک، اکسپلویت‌های واقعی را بازتولید می‌کند. این ابزار با…

۶ دقیقه خواندن

ربات چت‌جی‌پی‌تی را مثل کامپایلر، نه معلم، استفاده می‌کنم!

آموزش کاربردیهفتهٔ گذشتهتأییدنشده · منبع منفرد

استدلال فعال در برابر مصرف غیرفعال کد در تعامل با مدل‌های زبانی

تغییر نقش ChatGPT از یک معلم به یک سیستم اعتبارسنج منطق، باعث بازگشت غریزه‌ی حل مسئله در برنامه‌نویسان می‌شود. این متد تمرکز را از مصرف غیرفعال کد به استدلال فعال و عیب‌یابی منتقل…

۲ دقیقه خواندن

شبکه عصبی پرسپترون در حال یادگیری استراتژی بازی عصر امپراتوری‌ها ۲

سرگرمی و خلاقیتهفتهٔ گذشته

درون مکانیسم‌های Age of Empires II؛ از بزها تا شبکه‌های عصبی

یک پژوهشگر با استفاده از دارایی‌های بازی Age of Empires II، یک پرسپترون عملیاتی و مدار آموزش آن را پیاده کرد. این پروژه ثابت می‌کند این بازی از نظر محاسباتی Turing-complete است و…

۵ دقیقه خواندن

مدل استنتاجی متراکم ۳ میلیارد پارامتری VibeThinker-3B بر پایه Qwen2.5-Coder-3B با خط لوله پس‌آموزش طیف به سیگنال

تحلیل و بررسی تخصصیهفتهٔ گذشته

VibeThinker-3B: مدل ۳ میلیارد پارامتری در بنچمارک‌های ریاضی با غول‌های ۶۷۱

پژوهشگران Sina Weibo مدل VibeThinker-3B را معرفی کردند؛ یک مدل استدلالی کوچک که در وظایف ریاضی و کدنویسی با مدل‌های عظیمی چون DeepSeek V3.2 رقابت می‌کند. این مدل با استفاده از خط…

۵ دقیقه خواندن