موضوع

استدلال

Chain-of-thought, reasoning models (o-series, R-series), test-time compute

۶۱۳ مقاله منتشر شده

چگونه معماری Search as Code مصرف توکن‌های Perplexity را ۸۵٪ کاهش داد؟

معماری جدید Perplexity به مدل‌های هوش مصنوعی اجازه می‌دهد به‌جای استفاده از APIهای صلب، کدهای پایتون سفارشی برای جست‌وجو بنویسند. این تغییر منجر به کاهش شدید هزینه‌های عملیاتی و…

۵ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

استخراج آرگومان‌های ریاضی از فعال‌سازهای Llama بدون تحلیل متن

پژوهشگران ثابت کردند که عملیات و اعداد ریاضی را می‌توان مستقیماً از فعال‌سازهای داخلی مدل‌های Llama استخراج کرد. این دستاورد اجازه می‌دهد ابزارهای خارجی به‌جای تحلیل متنی پرامپت،…

۹ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

آیا «پرتاب» مدل‌های فوق-پارامتری مشکل تعمیم‌پذیری هوش مصنوعی را حل می‌کند؟

یک پیشنهاد نظری جدید ادعا می‌کند که دستیابی به هوش سطح انسانی نیازمند «پرتاب» (Catapulting) مدل‌های بسیار بزرگ از طریق چرخه‌های نرخ یادگیری بالاست. این رویکرد، اولویت را از حجم…

۱۰ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

افزایش ۱۰,۰۰۰ برابری سرعت محاسبات نمادین با Symbolica 2.0

نسخه ۲.۰ کتابخانه Symbolica با معرفی «نمادهای برنامه‌پذیر» و کامپایل JIT، سرعت پردازش‌های ریاضی پیچیده را تا ۱۰ هزار برابر افزایش داده است. این به‌روزرسانی با ارائه دقت ۳۱ رقم…

۱۱ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

چگونه ۱۴ مدل هوش مصنوعی را تنها با یک کلید API متصل کنیم؟

پلتفرم AIBridge امکان دسترسی به مدل‌های پیشرو از جمله DeepSeek و Qwen را تنها با یک کلید API فراهم کرده است. این ابزار با سازگاری کامل با SDK شرکت OpenAI، هزینه‌های عملیاتی…

۱ دقیقه خواندن

اخبار کوتاه روزانه۳ هفته پیش

سقوط ۸ درصدی سهام FactSet؛ بازی جدید Anthropic برای جایگزینی نرم‌افزارهای مالی

شرکت Anthropic با سرمایه‌ای ۱.۵ میلیارد دلاری و همکاری غول‌هایی چون گلدمن ساکس، یک سیستم‌عامل هوش مصنوعی برای صنعت مالی راه‌اندازی کرد. انتشار رایگان قالب‌های عامل‌های هوشمند برای…

۶ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

کاهش هزینه توکن به صفر: راهنمای استقرار محلی Qwen3-Coder با Ollama

برنامه‌نویسان اکنون می‌توانند به جای APIهای ابری، از سرور محلی Ollama برای اجرای عامل‌های کدنویسی استفاده کنند. این ترکیب با مدل Qwen3-Coder:30B، نشت داده‌ها را متوقف و هزینه‌های…

۸ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

چگونه «تراشیدن بافت» حافظه، نویز عامل‌های هوش مصنوعی را پاکسازی می‌کند؟

یک الگوی مهندسی جدید به مدل‌های بزرگ اجازه می‌دهد تا حافظه‌ی مدل‌های کوچک‌تر را به‌صورت پویا ویرایش و بازنویسی کنند. این روش نویز را حذف و دقت را بالا می‌برد، اما ریسک افزایش شدید…

۹ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

چرا چت‌های طولانی با هوش مصنوعی، هزینه استنتاج شما را به‌شدت بالا می‌برد؟

عامل‌های برنامه‌نویسی اغلب با پردازش مجدد داده‌های قدیمی در چت‌های طولانی، بودجه شما را می‌سوزانند. ابزار oowl با جایگزینی پنجرهٔ چت یکپارچه با «آرتیفکت‌های محدود» و تیمی از…

۵ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

رمزگشایی از مکانیسم توجه: چرا پرامپت‌های شما گاهی با توهم پاسخ می‌دهند؟

مدل‌های زبانی واقعاً حقایق را نمی‌شناسند، بلکه موتورهای آماری برای پیش‌بینی توکن بعدی هستند. درک معماری ترنسفورمر و فرآیند RLHF به کاربران کمک می‌کند تا توهمات را کاهش داده و…

۱۰ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

Google Converse: حذف مدیریت دستی حافظه در عامل‌های هوش مصنوعی

گوگل سرویس Converse را معرفی کرد که مدیریت وضعیت و حافظه عامل‌ها را به‌صورت بومی انجام می‌دهد. این ابزار نیاز به استفاده از ارکستریتورهای پیچیده خارجی برای گردش‌کارهای چندمرحله‌ای…

۳ دقیقه خواندن

زندگی با AI۳ هفته پیش

چرا بلک‌راک مدل‌های تک‌کاره را با کمیته‌های عامل جایگزین کرد؟

شرکت بلک‌راک و پژوهشگران آکادمیک از مدل‌های تک‌کاره به عنوان «پیش‌گوی ترید» فاصله گرفته‌اند. آن‌ها اکنون از سامانه‌های چندعاملی استفاده می‌کنند که در آن عامل‌های متخصص «گاوی» و…

۶ دقیقه خواندن