
چگونه معماری Search as Code مصرف توکنهای Perplexity را ۸۵٪ کاهش داد؟
معماری جدید Perplexity به مدلهای هوش مصنوعی اجازه میدهد بهجای استفاده از APIهای صلب، کدهای پایتون سفارشی برای جستوجو بنویسند. این تغییر منجر به کاهش شدید هزینههای عملیاتی و…
موضوع
Chain-of-thought, reasoning models (o-series, R-series), test-time compute
۶۱۳ مقاله منتشر شده

معماری جدید Perplexity به مدلهای هوش مصنوعی اجازه میدهد بهجای استفاده از APIهای صلب، کدهای پایتون سفارشی برای جستوجو بنویسند. این تغییر منجر به کاهش شدید هزینههای عملیاتی و…

پژوهشگران ثابت کردند که عملیات و اعداد ریاضی را میتوان مستقیماً از فعالسازهای داخلی مدلهای Llama استخراج کرد. این دستاورد اجازه میدهد ابزارهای خارجی بهجای تحلیل متنی پرامپت،…

یک پیشنهاد نظری جدید ادعا میکند که دستیابی به هوش سطح انسانی نیازمند «پرتاب» (Catapulting) مدلهای بسیار بزرگ از طریق چرخههای نرخ یادگیری بالاست. این رویکرد، اولویت را از حجم…

نسخه ۲.۰ کتابخانه Symbolica با معرفی «نمادهای برنامهپذیر» و کامپایل JIT، سرعت پردازشهای ریاضی پیچیده را تا ۱۰ هزار برابر افزایش داده است. این بهروزرسانی با ارائه دقت ۳۱ رقم…

پلتفرم AIBridge امکان دسترسی به مدلهای پیشرو از جمله DeepSeek و Qwen را تنها با یک کلید API فراهم کرده است. این ابزار با سازگاری کامل با SDK شرکت OpenAI، هزینههای عملیاتی…

شرکت Anthropic با سرمایهای ۱.۵ میلیارد دلاری و همکاری غولهایی چون گلدمن ساکس، یک سیستمعامل هوش مصنوعی برای صنعت مالی راهاندازی کرد. انتشار رایگان قالبهای عاملهای هوشمند برای…

برنامهنویسان اکنون میتوانند به جای APIهای ابری، از سرور محلی Ollama برای اجرای عاملهای کدنویسی استفاده کنند. این ترکیب با مدل Qwen3-Coder:30B، نشت دادهها را متوقف و هزینههای…

یک الگوی مهندسی جدید به مدلهای بزرگ اجازه میدهد تا حافظهی مدلهای کوچکتر را بهصورت پویا ویرایش و بازنویسی کنند. این روش نویز را حذف و دقت را بالا میبرد، اما ریسک افزایش شدید…

عاملهای برنامهنویسی اغلب با پردازش مجدد دادههای قدیمی در چتهای طولانی، بودجه شما را میسوزانند. ابزار oowl با جایگزینی پنجرهٔ چت یکپارچه با «آرتیفکتهای محدود» و تیمی از…

مدلهای زبانی واقعاً حقایق را نمیشناسند، بلکه موتورهای آماری برای پیشبینی توکن بعدی هستند. درک معماری ترنسفورمر و فرآیند RLHF به کاربران کمک میکند تا توهمات را کاهش داده و…

گوگل سرویس Converse را معرفی کرد که مدیریت وضعیت و حافظه عاملها را بهصورت بومی انجام میدهد. این ابزار نیاز به استفاده از ارکستریتورهای پیچیده خارجی برای گردشکارهای چندمرحلهای…

شرکت بلکراک و پژوهشگران آکادمیک از مدلهای تککاره به عنوان «پیشگوی ترید» فاصله گرفتهاند. آنها اکنون از سامانههای چندعاملی استفاده میکنند که در آن عاملهای متخصص «گاوی» و…