OpenAI: افزایش دقت عامل مالیاتی از ۲۵٪ به ۸۶٪ با حلقهی بازخورد Codex
شرکت OpenAI و Thrive Holdings سیستم Tax AI را توسعه دادند؛ عاملی که با تبدیل اصلاحات انسانی به کدهای برنامهنویسی، دقت خود را بهشدت افزایش میدهد. این سیستم زمان آمادهسازی…
دستهبندی
تحلیلهای عمیق مدلها، مقالات و بنچمارکها — پیشچاپها، ارزیابیها، مدلهای زبانی پیشرو و پژوهش همراستاسازی.
۱٬۶۷۶ مقاله منتشر شده
شرکت OpenAI و Thrive Holdings سیستم Tax AI را توسعه دادند؛ عاملی که با تبدیل اصلاحات انسانی به کدهای برنامهنویسی، دقت خود را بهشدت افزایش میدهد. این سیستم زمان آمادهسازی…
چین با ادغام مدلهای زبانی و بینایی ماشین در میلیونها دوربین قدیمی، نظارت را از حالت «ضبط و بازبینی» به «تحلیل رفتاری لحظهای» تغییر داد. این سیستم به پلیس اجازه میدهد با…
گزارش روند ۲۰۲۶ آنتروپیک پیشبینی میکند که تمرکز برنامهنویسی از نوشتن کد به مدیریت عاملها تغییر کند. در این مسیر، گلوگاه اصلی دیگر قدرت مدل نیست، بلکه «مهندسی کانتکست» برای…
اتصال هیبریدی ۴۵۰ نانومتری توسط اپلاید متریالز و ایوی گروپ، محدودیتهای فیزیکی بسترهای ارگانیک را میشکند. این فناوری با دستیابی به بازدهی ۹۸ درصدی، مسیر را برای پهنای باند عظیم…
بنچمارک جدید DeepSWE با هدف حذف آلودگی دادهها، شکاف عملکردی عاملهای کدنویسی در وظایف پیچیده و بلندمدت را آشکار کرد. این مطالعه نشان میدهد مدلهای پیشرو در بسیاری از موارد، به…
انویدیا با معرفی CUDA 13.3 و قابلیت Tile C++، مدیریت دستی رشتهها در GPU را خودکار کرد. این تغییر به توسعهدهندگان اجازه میدهد به جای درگیری با جزئیات سختافزاری، روی عملیات…
NSA و CISA حفرههای امنیتی خطرناکی را در پروتکل MCP شناسایی کردند، اما ابزاری برای شناسایی آنها ارائه ندادند. اکنون ATR با انتشار ۴۳۳ قانون عملیاتی بر اساس بررسی ۱۰۰ هزار مهارت…
یک چارچوب تست جدید نشان میدهد که تغییرات جزئی در کلماتِ «مهارتهای» هوش مصنوعی میتواند لایههای امنیتی را بهطور خاموش غیرفعال کند. توسعهدهندگان اکنون میتوانند با استفاده از…
آندری کارپاتی سیستم autoresearch را معرفی کرد که حلقههای پژوهشی خودکار را بر اساس معیارهای انسانی اجرا میکند. این ابزار نقش متخصص را از «اجراکننده آزمایش» به «طراح فضای جستوجو…
هواوئی برای دور زدن تحریمهای آمریکا، استراتژی جدیدی را برای تولید تراشههای ۱.۴ نانومتری تا سال ۲۰۳۱ تعریف کرده است. این شرکت با جایگزینی «قانون مور» با «قانون مقیاسپذیری تائو»،…
پژوهشی جدید مکانیسمی شبیه به «خواب» را برای مدلهای زبانی پیشنهاد میدهد که با تبدیل بافت متنی به وزنهای دائمی، مشکل مقیاسپذیری حافظه را حل میکند. این روش باعث کاهش تأخیر در…
یک اسکریپت C# با استفاده از SDK ابزار Cadenza.Agent، امکان اتصال Codex CLI به مدلهایی مثل Claude 3.5 و Llama را فراهم میکند. این روش با ایجاد یک پروکسی برای APIهای OpenAI،…