
چرا معماری دو-نمایی Orthrus سرعت استنتاج Qwen3 را ۷.۸ برابر کرد؟
چارچوب جدید Orthrus سرعت استنتاج مدلهای Qwen3 را تا ۷.۸ برابر افزایش میدهد بدون اینکه دقت پاسخها کاهش یابد. این سیستم مدلهای پیشنویس سنگین را با یک معماری انتشار دو-نمایی…
دستهبندی
تحلیلهای عمیق مدلها، مقالات و بنچمارکها — پیشچاپها، ارزیابیها، مدلهای زبانی پیشرو و پژوهش همراستاسازی.
۱٬۶۷۲ مقاله منتشر شده

چارچوب جدید Orthrus سرعت استنتاج مدلهای Qwen3 را تا ۷.۸ برابر افزایش میدهد بدون اینکه دقت پاسخها کاهش یابد. این سیستم مدلهای پیشنویس سنگین را با یک معماری انتشار دو-نمایی…

بلکراک هشدار میدهد که هزینههای کلان هوش مصنوعی از یک روند شرکتی به یک نیروی اقتصاد کلان تبدیل شده است. این تغییر باعث همسویی داراییهای نامرتبط شده و استراتژیهای سنتی مدیریت…

پژوهشگران مؤسسه Allen و دانشگاه برکلی مدلی به نام EMO را معرفی کردند که با سازماندهی متخصصان بر اساس دامنههای معنایی، عملکرد خود را حتی با حذف ۸۷.۵٪ از ظرفیت متخصصان حفظ میکند.

در سال ۲۰۲۶، انتخاب ابزار کدنویسی از مقایسه کیفیت مدلها به انتخاب «مدل عملیاتی» تغییر کرده است. تیمها باید بین چهار گردشکار متمایز انتخاب کنند تا از اصطکاک مهندسی و هزینههای…

دیتابریکس مدل GPT-5.5 را به جریانهای کاری عاملهای خود اضافه کرد. این مدل با عبور از مرز ۵۰٪ دقت در بنچمارک OfficeQA Pro، نرخ خطای پردازش اسناد قدیمی و PDFهای اسکنشده را ۴۶٪…

لنگچین با تأسیس یک مرکز پژوهشی جدید، بر روی «یادگیری مستمر» برای عاملهای هوش مصنوعی تمرکز کرده است. هدف این است که ردپاهای اجرایی مدلها به دادههای آموزشی تبدیل شوند تا…

استفاده از فایلهای دستورالعمل حجیم در Claude Code باعث اتلاف هزاران توکن در هر درخواست میشود. جایگزینی این روش با سیستم «مهارتها» میتواند این هزینه را به ۵۰ توکن کاهش دهد.

نسخه ۲.۱.۱۳۹ ابزار Claude Code با معرفی دستور /goal، امکان تعریف شرایط پایان برای کارهای خودکار را فراهم کرد. در این سیستم، یک مدل مجزا از خانواده Haiku وظیفه ارزیابی هر گام را بر…

شرکت Zyphra با معرفی ZAYA1-8B-Diffusion-Preview، نخستین مدل MoE را ارائه کرد که از ساختار خودبازگشتی به مدل انتشار گسسته تبدیل شده است. این معماری با تولید همزمان ۱۶ توکن، سرعت…

یک استراتژی جدید با ترکیب مدل Mistral Nemo و ابزار vLLM، هزینه استنتاج را تا ۹۵٪ کاهش میدهد. این پیکربندی روی GPUهای ارزانقیمت، سرعت پاسخدهی را ۳ برابر کرده و نیاز به پرداخت…

پروژهی جدید OWASP با نام Agent Memory Guard، عاملهای هوش مصنوعی را در برابر حملات مسمومیت حافظه محافظت میکند. این ابزار با استفاده از امضاهای رمزنگاری و تحلیل معنایی، مانع از…

زبان آزمایشی Aperio با جایگزینی نحو سنتی با مدلهای ساختاری به نام loci، فاصله بین تفکر انسانی و کد را میگیرد. هدف این پروژه کاهش هزینه توکنها و تأخیر در عاملهای کدنویسی است.