گزیدهای از خواندنیترین و مهمترین مطالب داتهوش.
پروژه tiny-vllm یک موتور آموزشی مبتنی بر C++ و CUDA است که معماری vLLM را بازسازی میکند. این ابزار به توسعهدهندگان میآموزد چگونه استنتاج Llama 3.2 را از صفر پیاده کنند و بر پیچیدگیهای حافظه GPU غلبه کنند.
مدلهای پیشرو همچنان در رفع نیمی از آسیبپذیریهای امنیتی واقعی ناتواناند. بنچمارک CVE-Bench نشان میدهد که «استدلال امنیتی» در این مدلها بیشتر شبیه به تطبیق الگو است تا تحلیل عمیق کد.
شرکت OpenAI دسترسی رایگان به مدل تخصصی علوم زیستی خود، GPT-Rosalind را برای شرکای دولتی و غیرانتفاعی تأییدشده فراهم کرد. هدف این برنامه تسریع در تولید واکسن و ایجاد سامانههای هشدار زودهنگام برای پیشگیری از پاندمیهای آینده است.
شرکت StepFun مدل Step 3.7 Flash را معرفی کرد؛ یک مدل ۱۹۸ میلیارد پارامتری بهینه برای پردازندههای NVIDIA. این مدل استدلال چندوجهی در مقیاس سازمانی را با پنجره متنی ۲۵۶ هزار توکنی ممکن میکند.
شرکت Braintrust با استفاده از Codex و GPT-5.5، زمان تبدیل درخواستهای مشتری به کد را از هفتهها به چند دقیقه کاهش داده است. این رویکرد با حذف صفهای انتظار توسعه، چرخه بازخورد را به شدت تسریع کرده است.
دولت بریتانیا قراردادی برای توسعه فناوری تخمین سن با هوش مصنوعی منعقد کرد تا مانع از دسترسی بزرگسالانی شود که ادعای کودک بودن دارند. این سیستم قرار است جایگزین بخشی از قضاوتهای انسانی در مرزها شود.
گوگل با رفع چندین باگ فنی، سرعت اتمام سهمیهی کاربران Gemini را کاهش داد. از مهمترین تغییرات میتوان به رایگان شدن درخواستهای Flash Lite و دو برابر شدن سهمیه ویدئو برای کاربران Ultra اشاره کرد.
شرکت OpenAI در حال بازسازی خط تولید مدلهای خود است. این شرکت در کنار بهبود خوانایی GPT-5.5 Instant و حذف پنل Canvas، تاریخ بازنشستگی مدلهای GPT-4.5 و o3 را برای سال ۲۰۲۶ اعلام کرد.
متا کتابخانه ATLAS را منتشر کرد؛ مجموعهای عظیم از متون ریاضی که توسط هوش مصنوعی به کد Lean 4 تبدیل شدهاند. این پایگاه داده با بیش از ۴۶ هزار قضیه اثباتشده، زیربنایی مقیاسپذیر برای استدلال ماشین فراهم میکند.
شرکت OpenAI در یک دستورالعمل فنی استدلال میکند که توانایی مدلهای پیشرو یک مقدار ثابت نیست، بلکه متغیری وابسته به «هارنس» (Harness) یا همان محیط، ابزارها و بودجه محاسباتی است. این چارچوب با معرفی بررسیهای سختگیرانه، قصد دارد از نتایج گمراهکننده ناشی از «هک پاداش» و «کمکاری استراتژیک» جلوگیری کند.
شرکت Mistral AI از یک آزمایشگاه مدلسازی به ارائهدهنده کامل زیرساخت، پلتفرم و مشاوره تبدیل شده است. این شرکت با راهاندازی مرکز داده اختصاصی در پاریس، بر استقرار محلی و مدلهای تخصصی کوچک برای تضمین حاکمیت دادهها در اروپا تمرکز کرده است.
پژوهشی جدید با معرفی «تست تورینگ فرآیندی» نشان میدهد که مدلهای پیشرو با وجود ارائه پاسخهای صحیح، مسیری کاملاً متفاوت از انسان برای رسیدن به جواب طی میکنند. این مطالعه فاش میکند که مدلهای کوچکتر و تخصصی، در شبیهسازی فرآیندهای شناختی انسانی موفقتر از مدلهای غولپیکر هستند.
استارتاپ XCENA با جذب ۱۳۵ میلیون دلار سرمایه، تراشهی MX1 را برای حذف گلوگاه حافظه در هوش مصنوعی توسعه میدهد. این فناوری با انتقال پردازش به درون ماژولهای حافظه، تعداد سرورهای مورد نیاز برای استنتاج را بهشدت کاهش میدهد.
سید معاذ احمد ابزاری به نام Interlock ساخت تا از نشت دادهها در عاملهای هوش مصنوعی جلوگیری کند. این سیستم با نظارت لحظهای بر ابزارهای MCP، حملات تزریق پرامپت و تغییرات مخرب را مسدود میکند.
پژوهشگران استنفورد و متا استدلال میکنند که عاملهای هوش مصنوعی تنها یک مدل زبانی نیستند، بلکه ترکیبی از مدل و یک «هارنس» نرمافزاریاند. این لایهی کد اجرایی است که تداوم وضعیت، قابلیت اطمینان و هماهنگی بینعاملی را ممکن میسازد.
گوگل با معرفی کتابخانه AppFunctions در اندروید ۱۶، به اپلیکیشنها اجازه میدهد منطق داخلی خود را مستقیماً به عنوان ابزاری برای عاملهای هوش مصنوعی ارائه دهند. این تغییر، رابطهای اختصاصی قدیمی را با یک استاندارد جهانی روی دستگاه جایگزین میکند.
استارتاپ Shift برای جمعآوری دادههای آموزشی رباتها، خدمات نظافت رایگان در نیویورک ارائه میدهد. این شرکت با استفاده از کلاههای مجهز به دوربین، حرکات نظافتکنندگان را ضبط میکند تا مدلهای هوش مصنوعی خود را در محیطهای واقعی آموزش دهد.
راهنمایی فنی برای استفاده از torch.profiler جهت شناسایی گلوگاههای پردازشی در PyTorch. این ابزار نشان میدهد چگونه هزینههای پنهان CPU در torch.compile میتواند بهرهوری مدل را کاهش دهد.
OpenAI با راهاندازی ابتکار Rosalind Biodefense و مدل تخصصی GPT-Rosalind، دسترسی دولتها و شرکتهای تأییدشده به ابزارهای پیشرفته پیشبینی پاندمی را فراهم کرد. این اقدام نشاندهندهی چرخش استراتژیک شرکت از «ایمنی غیرفعال» به «شتاب دفاعی» برای مقابله با تهدیدات زیستی است.
دستیار جدید ادوبی به عنوان یک واسط گفتگو عمل میکند که ابزارهای فتوشاپ و ایلاستریتور را کنترل میکند. برخلاف مدلهای رایج، این ابزار مراحل کار خود را توضیح میدهد، هرچند کیفیت خروجی آن فعلاً در سطح یک مبتدی است.
آمازون سیستم رتبهبندی «Kirorank» را حذف کرد چون کارکنان با سپردن کارهای بیهوده به عاملهای هوش مصنوعی، امتیاز خود را بالا میبردند. این رفتار باعث افزایش هزینههای ابری شد و شرکت را مجبور کرد معیار «تعداد توکن» را با «کارایی واقعی کد» جایگزین کند.
درآمد مراکز داده انویدیا دیگر تنها در دست پنج غول فناوری نیست. برای نخستین بار، نیمی از این درآمد از سوی دولتها و خریداران سازمانی تأمین شده که ریسک تمرکز شرکت را بهشدت کاهش میدهد.
ارائهدهندگان مدل بهعنوان سرویس (MaaS) در حال گذار از «تنوع مدلها» به «پایداری استنتاج» هستند. این تحول منجر به ظهور مفهوم «توکن بهعنوان سرویس» (TaaS) شده است که در آن مسیریابی هوشمند، بهینهترین مسیر محاسباتی را برای هر توکن تعیین میکند.
افزونه Everything Claude Code (ECC) با تبدیل Claude به یک تیم توسعه چند-عاملی، ۲۰۰ هزار ستاره در گیتهاب گرفت. این ابزار با استفاده از مکانیسم بارگذاری تنبل، ۲۴۹ مهارت تخصصی را بدون پر کردن حافظه مدل مدیریت میکند.
شرکت Liquid AI مدل LFM2.5-8B-A1B را معرفی کرد؛ یک مدل MoE برای اجرا روی دستگاه که تنها ۱.۵ میلیارد پارامتر فعال دارد. این مدل با کاهش شدید توهمات و بهبود استدلال، امکان اجرای هوش مصنوعی سطح بالا را روی گوشیها و لپتاپها فراهم میکند.
کتابخانه تست جاوا jqwik با استفاده از توالیهای ANSI، دستورات مخفی را به عاملهای کدنویسی تزریق میکند تا آنها را به حذف کدها ترغیب کند. این حمله نخستین مورد ثبتشدهای است که بهجای انسان، مستقیماً مدل زبانی (LLM) را هدف قرار میدهد.
شرکت Anthropic با جذب ۶۵ میلیارد دلار سرمایه در سری H، ارزش بازار خود را به نزدیکی یک تریلیون دلار رساند. این جهش مالی همزمان با عرضه مدل Claude Opus 4.8 و رشد خیرهکننده درآمدهای سازمانی رخ داده است.
شرکت Anthropic مدل Claude Opus 4.8 را با تمرکز بر کاهش توهمات و افزایش صداقت در کدنویسی منتشر کرد. این بهروزرسانی قابلیت کنترل میزان تلاش مدل و پیشنمایشی از گردشهای کاری پویا با عاملهای موازی را معرفی میکند.
Asana با خرید ۷۵ میلیون دلاری Stack AI، مسیر خود را به سمت یک محیط کاری عاملمحور تغییر داد. هدف این شرکت تبدیل پلتفرم خود به سیستمعاملی است که در آن انسانها و عاملهای هوشمند در کنار هم کار میکنند.
پروژه متنباز A3M Router برای نخستین بار رتبه اول جدول RouterArena را از رقبای تجاری ربود. این ابزار با استفاده از یک سازوکار امتیازدهی موازی، هزینههای عملیاتی را بهشدت کاهش میدهد.