پرش به محتوای اصلی

موضوع

استدلال

Chain-of-thought, reasoning models (o-series, R-series), test-time compute

۶۰۷ مقاله منتشر شده

۵ معماری جایگزین رپرهای ChatGPT برای تبدیل نمونه‌های اولیه به محصول واقعی
آموزش کاربردی

۵ معماری جایگزین رپرهای ChatGPT برای تبدیل نمونه‌های اولیه به محصول واقعی

مهندسی هوش مصنوعی از رپرهای ساده‌ی API به سمت سیستم‌های عامل‌محور و تخصصی حرکت می‌کند. توسعه‌دهندگان برتر اکنون برای دستیابی به پایداری و کاهش هزینه، بر RAG عامل‌محور و مدل‌های…

۶ دقیقه خواندن
چگونه ابزارهای حافظه مدل‌های هوش مصنوعی را بدتر می‌کنند

چرا حافظه‌ی بلندمدت در مدل‌های زبانی منجر به افزایش چاپلوسی می‌شود؟

پژوهش جدید شرکت Writer نشان می‌دهد سیستم‌های حافظه برای شخصی‌سازی، می‌توانند دقت مدل‌ها را کاهش دهند. این ابزارها مدل را به سمت چاپلوسی سوق می‌دهند تا به جای حقیقت، باورهای غلط…

۳ دقیقه خواندن
مطالعه آنتروپیک: هوش مصنوعی ساعت‌ها نه هفته‌ها برای ساخت اکسپلویت از وصله امنیتی نیاز دارد

گزارش انتروپیک: تبدیل وصله‌های امنیتی ویندوز به اکسپلویت در ۶ ساعت

هوش مصنوعی اکنون می‌تواند وصله‌های امنیتی را طی چند ساعت به ابزارهای حمله (Exploit) تبدیل کند. مدل Mythos Preview انتروپیک با شکستن امنیت هسته ویندوز و فایرفاکس، چرخه ماهانه…

۴ دقیقه خواندن
نوت‌بوک‌ال‌ام گوگل اکنون رایانه ابری با اجرای کد و پژوهش عامل‌محور دارد.

بهبود ۶۵ درصدی NotebookLM: وقتی دفترچه یادداشت گوگل به رایانه تبدیل شد

گوگل NotebookLM را با رایانه‌های ابری اختصاصی و قابلیت اجرای کد به‌روزرسانی کرد. این ابزار اکنون از تحقیقات عامل‌محور پشتیبانی کرده و خروجی‌های مستقیم به اکسل و پاورپوینت می‌دهد.

۱ دقیقه خواندن
نمره‌دهی به استدلال حقوقی مدل زبانی با قاضی هوش مصنوعی
آموزش کاربردی

چرا پاسخ درست در هوش مصنوعی حقوقی می‌تواند خطرناک‌ترین معیار باشد؟

مدل‌های زبانی اغلب با منطقی غلط به پاسخی درست می‌رسند. روش جدید LegalBench با استفاده از «سیگنال‌های اتمیک» و چارچوب IRAC، خطاهای استدلالی را از نتایج تصادفی جدا می‌کند تا توهمات…

۶ دقیقه خواندن
آیا حافظه ضعیف هوش مصنوعی را محتاط‌تر می‌کند؟ ما آزمایش کردیم
آموزش کاربردی

چگونه تزریق خاطرات جعلی از شکست، ریسک‌پذیری عامل‌های هوش مصنوعی را کاهش می‌دهد؟

پژوهش‌های جدید نشان می‌دهد تزریق تاریخچه‌ای جعلی از شکست‌ها در حافظه‌ی مدل‌ها، جسارت آن‌ها در تصمیم‌گیری را به‌شدت می‌کوبد. این پدیده بدون تخریب منطق مدل یا فعال کردن سیستم‌های…

۱۰ دقیقه خواندن
چرا سیستم‌های چند-عاملی هوش مصنوعی در مقیاس واقعی شکست می‌خورند؟
آموزش کاربردی

چرا سیستم‌های چند-عاملی هوش مصنوعی در مقیاس واقعی شکست می‌خورند؟

سیستم‌های چند-عاملی می‌توانند یک درخواست ساده‌ی کاربر را به صدها فراخوانی داخلی API تبدیل کنند و زیرساخت‌ها را به سرعت ساقط کنند. پیاده‌سازی محدودیت‌های نرخ درخواست داخلی، راهکاری…

۳ دقیقه خواندن۱