هر چیزی که در داتهوش منتشر شده، به ترتیب زمان. تازههای کمتر از یک ساعت با نشانک زنده مشخص شدهاند.
شرکت OpenAI در حال بازسازی خط تولید مدلهای خود است. این شرکت در کنار بهبود خوانایی GPT-5.5 Instant و حذف پنل Canvas، تاریخ بازنشستگی مدلهای GPT-4.5 و o3 را برای سال ۲۰۲۶ اعلام کرد.
متا کتابخانه ATLAS را منتشر کرد؛ مجموعهای عظیم از متون ریاضی که توسط هوش مصنوعی به کد Lean 4 تبدیل شدهاند. این پایگاه داده با بیش از ۴۶ هزار قضیه اثباتشده، زیربنایی مقیاسپذیر برای استدلال ماشین فراهم میکند.
شرکت OpenAI در یک دستورالعمل فنی استدلال میکند که توانایی مدلهای پیشرو یک مقدار ثابت نیست، بلکه متغیری وابسته به «هارنس» (Harness) یا همان محیط، ابزارها و بودجه محاسباتی است. این چارچوب با معرفی بررسیهای سختگیرانه، قصد دارد از نتایج گمراهکننده ناشی از «هک پاداش» و «کمکاری استراتژیک» جلوگیری کند.
شرکت Mistral AI از یک آزمایشگاه مدلسازی به ارائهدهنده کامل زیرساخت، پلتفرم و مشاوره تبدیل شده است. این شرکت با راهاندازی مرکز داده اختصاصی در پاریس، بر استقرار محلی و مدلهای تخصصی کوچک برای تضمین حاکمیت دادهها در اروپا تمرکز کرده است.
پژوهشی جدید با معرفی «تست تورینگ فرآیندی» نشان میدهد که مدلهای پیشرو با وجود ارائه پاسخهای صحیح، مسیری کاملاً متفاوت از انسان برای رسیدن به جواب طی میکنند. این مطالعه فاش میکند که مدلهای کوچکتر و تخصصی، در شبیهسازی فرآیندهای شناختی انسانی موفقتر از مدلهای غولپیکر هستند.
استارتاپ XCENA با جذب ۱۳۵ میلیون دلار سرمایه، تراشهی MX1 را برای حذف گلوگاه حافظه در هوش مصنوعی توسعه میدهد. این فناوری با انتقال پردازش به درون ماژولهای حافظه، تعداد سرورهای مورد نیاز برای استنتاج را بهشدت کاهش میدهد.
سید معاذ احمد ابزاری به نام Interlock ساخت تا از نشت دادهها در عاملهای هوش مصنوعی جلوگیری کند. این سیستم با نظارت لحظهای بر ابزارهای MCP، حملات تزریق پرامپت و تغییرات مخرب را مسدود میکند.
پژوهشگران استنفورد و متا استدلال میکنند که عاملهای هوش مصنوعی تنها یک مدل زبانی نیستند، بلکه ترکیبی از مدل و یک «هارنس» نرمافزاریاند. این لایهی کد اجرایی است که تداوم وضعیت، قابلیت اطمینان و هماهنگی بینعاملی را ممکن میسازد.
گوگل با معرفی کتابخانه AppFunctions در اندروید ۱۶، به اپلیکیشنها اجازه میدهد منطق داخلی خود را مستقیماً به عنوان ابزاری برای عاملهای هوش مصنوعی ارائه دهند. این تغییر، رابطهای اختصاصی قدیمی را با یک استاندارد جهانی روی دستگاه جایگزین میکند.
استارتاپ Shift برای جمعآوری دادههای آموزشی رباتها، خدمات نظافت رایگان در نیویورک ارائه میدهد. این شرکت با استفاده از کلاههای مجهز به دوربین، حرکات نظافتکنندگان را ضبط میکند تا مدلهای هوش مصنوعی خود را در محیطهای واقعی آموزش دهد.
راهنمایی فنی برای استفاده از torch.profiler جهت شناسایی گلوگاههای پردازشی در PyTorch. این ابزار نشان میدهد چگونه هزینههای پنهان CPU در torch.compile میتواند بهرهوری مدل را کاهش دهد.
OpenAI با راهاندازی ابتکار Rosalind Biodefense و مدل تخصصی GPT-Rosalind، دسترسی دولتها و شرکتهای تأییدشده به ابزارهای پیشرفته پیشبینی پاندمی را فراهم کرد. این اقدام نشاندهندهی چرخش استراتژیک شرکت از «ایمنی غیرفعال» به «شتاب دفاعی» برای مقابله با تهدیدات زیستی است.
دستیار جدید ادوبی به عنوان یک واسط گفتگو عمل میکند که ابزارهای فتوشاپ و ایلاستریتور را کنترل میکند. برخلاف مدلهای رایج، این ابزار مراحل کار خود را توضیح میدهد، هرچند کیفیت خروجی آن فعلاً در سطح یک مبتدی است.
آمازون سیستم رتبهبندی «Kirorank» را حذف کرد چون کارکنان با سپردن کارهای بیهوده به عاملهای هوش مصنوعی، امتیاز خود را بالا میبردند. این رفتار باعث افزایش هزینههای ابری شد و شرکت را مجبور کرد معیار «تعداد توکن» را با «کارایی واقعی کد» جایگزین کند.
درآمد مراکز داده انویدیا دیگر تنها در دست پنج غول فناوری نیست. برای نخستین بار، نیمی از این درآمد از سوی دولتها و خریداران سازمانی تأمین شده که ریسک تمرکز شرکت را بهشدت کاهش میدهد.
ارائهدهندگان مدل بهعنوان سرویس (MaaS) در حال گذار از «تنوع مدلها» به «پایداری استنتاج» هستند. این تحول منجر به ظهور مفهوم «توکن بهعنوان سرویس» (TaaS) شده است که در آن مسیریابی هوشمند، بهینهترین مسیر محاسباتی را برای هر توکن تعیین میکند.
افزونه Everything Claude Code (ECC) با تبدیل Claude به یک تیم توسعه چند-عاملی، ۲۰۰ هزار ستاره در گیتهاب گرفت. این ابزار با استفاده از مکانیسم بارگذاری تنبل، ۲۴۹ مهارت تخصصی را بدون پر کردن حافظه مدل مدیریت میکند.
شرکت Liquid AI مدل LFM2.5-8B-A1B را معرفی کرد؛ یک مدل MoE برای اجرا روی دستگاه که تنها ۱.۵ میلیارد پارامتر فعال دارد. این مدل با کاهش شدید توهمات و بهبود استدلال، امکان اجرای هوش مصنوعی سطح بالا را روی گوشیها و لپتاپها فراهم میکند.
کتابخانه تست جاوا jqwik با استفاده از توالیهای ANSI، دستورات مخفی را به عاملهای کدنویسی تزریق میکند تا آنها را به حذف کدها ترغیب کند. این حمله نخستین مورد ثبتشدهای است که بهجای انسان، مستقیماً مدل زبانی (LLM) را هدف قرار میدهد.
شرکت Anthropic با جذب ۶۵ میلیارد دلار سرمایه در سری H، ارزش بازار خود را به نزدیکی یک تریلیون دلار رساند. این جهش مالی همزمان با عرضه مدل Claude Opus 4.8 و رشد خیرهکننده درآمدهای سازمانی رخ داده است.
شرکت Anthropic مدل Claude Opus 4.8 را با تمرکز بر کاهش توهمات و افزایش صداقت در کدنویسی منتشر کرد. این بهروزرسانی قابلیت کنترل میزان تلاش مدل و پیشنمایشی از گردشهای کاری پویا با عاملهای موازی را معرفی میکند.
Asana با خرید ۷۵ میلیون دلاری Stack AI، مسیر خود را به سمت یک محیط کاری عاملمحور تغییر داد. هدف این شرکت تبدیل پلتفرم خود به سیستمعاملی است که در آن انسانها و عاملهای هوشمند در کنار هم کار میکنند.
پروژه متنباز A3M Router برای نخستین بار رتبه اول جدول RouterArena را از رقبای تجاری ربود. این ابزار با استفاده از یک سازوکار امتیازدهی موازی، هزینههای عملیاتی را بهشدت کاهش میدهد.
ابزار ktx یک لایهی محلی است که به عاملهای هوش مصنوعی یاد میدهد دادههای انبار را با معیارهای تأییدشده استخراج کنند. این سیستم نیاز به بازنویسی منطق SQL در هر درخواست را از بین میبرد.
Claude Code با استفاده از جریانهای کاری پویا، توانست پروژه Bun را در ۱۱ روز از Zig به Rust منتقل کند. این دستاورد با دقت ۹۹.۸ درصد در تستها به دست آمد و نشاندهنده گذار از دستیارهای کدنویسی به مهندسان خودکار است.
OpenAI با انتشار «چارچوب حاکمیتی پیشرو»، تلاش میکند استانداردهای داخلی ایمنی خود را با قوانین سختگیرانه اتحادیه اروپا و کالیفرنیا همراستا کند. این سند در واقع ترجمه مدیریت ریسک داخلی به یک نقشه راه قانونی برای رگولاتورها است.
اپل در iOS 27 سیری را بازطراحی کرده و مدل Gemini گوگل را به آن اضافه میکند. این شرکت با تکیه بر ۲.۵ میلیارد دستگاه، قصد دارد سهم ChatGPT از بازار را به شدت کاهش دهد.
فیلم ۷۵ دقیقهای «رویاهای بنفشه» با بودجهای اندک، نخستین اثر بلند ساختهشده با هوش مصنوعی است که به برنامه اصلی جشنواره تریبکا راه یافت. این اتفاق نشان میدهد که کیفیت بصری سینما دیگر به بودجههای میلیونی وابسته نیست.
شرکت Sesame با معرفی اپلیکیشنی مبتنی بر جستجوی موازی، سکوتهای طولانی چتباتها را حذف کرد. این سیستم به عاملهای هوش مصنوعی اجازه میدهد پاسخهای خود را در حین صحبت بهروز کنند.
تضاد شدیدی میان ادعاهای ایلان ماسک و اسناد رسمی SpaceX دربارهی قرارداد اجارهی سختافزاری Anthropic دیده میشود. طبق اسناد S-1، این شرکت ماهانه ۱.۲۵ میلیارد دلار میپردازد، در حالی که ماسک ادعای کوتاهمدت بودن این قرارداد را دارد.