گزیدهای از خواندنیترین و مهمترین مطالب داتهوش.
مایکروسافت مدل MAI-Code-1-Flash را معرفی کرد که به جای بنچمارکهای تئوری، بر کارایی واقعی در محیط تولید تمرکز دارد. این مدل در حل مسائل پیچیده کدنویسی، ۶۰٪ توکن کمتری نسبت به رقیب خود یعنی Claude Haiku 4.5 مصرف میکند.
شرکت DuckDuckGo با ارائه افزونههای جدید، جستوجوی بدون هوش مصنوعی را به گزینه پیشفرض کاربران تبدیل کرد. این استراتژی درست زمانی اجرا شد که موجی از کاربران بهدلیل نارضایتی از تجربه جدید گوگل، به این موتور جستوجو پناه آوردند.
شرکت WindBorne با معرفی مدل WeatherMesh-6، دقت پیشبینیهای آبوهوایی را به سطحی رسانده که مدلهای پیشرو دولتی را به چالش میکشد. این استارتاپ با ترکیب سختافزار (۴۰۰ بالن) و هوش مصنوعی، انحصار دادههای هواشناسی را میشکند.
دادستان کل فلوریدا در اقدامی بیسابقه، از OpenAI و سام آلتمن به دلیل نادیده گرفتن هشدارهای ایمنی شکایت کرد. این پرونده مدعی است که این شرکت برای پیروزی در رقابت هوش مصنوعی، ابزاری ساخته که به تیراندازان جمعی کمک کرده و کاربران را به خودکشی ترغیب کرده است.
انویدیا با معرفی تراشه RTX Spark قصد دارد از تسلط بر بازار پردازندههای گرافیکی فراتر رفته و وارد بازار ۲۰۰ میلیارد دلاری CPU شود. این استراتژی بر پایه ایجاد زیرساختی امن برای اجرای محلی عاملهای هوش مصنوعی در لپتاپهای نسل جدید است.
دونالد ترامپ فرمانی را امضا کرد که شرکتهای AI را موظف میکند مدلهای جدید خود را ۳۰ روز پیش از انتشار برای بازبینی دولتی ارسال کنند. این بازه زمانی پس از فشار صنعت، از ۹۰ روز پیشبینیشده به ۳۰ روز کاهش یافت تا سرعت نوآوری آمریکا حفظ شود.
شرکت Anthropic برای عرضه اولیه سهام خود در بورس آمریکا اقدام کرد تا با ارزشی نزدیک به یک تریلیون دلار وارد بازار عمومی شود. این حرکت رقابت این شرکت با OpenAI را از آزمایشگاههای خصوصی به میدان نظارت سرمایهگذاران جهانی میبرد.
گوگل با معرفی مکانیکی تحت عنوان «دست دادن دیجیتال» در اندروید ۱۲ و بالاتر، تلاش میکند جلوی کلاهبرداریهای صوتی مبتنی بر هوش مصنوعی را بگیرد. این سیستم از طریق پروتکل RCS هویت تماسگیرنده را بهصورت رمزنگاریشده تأیید میکند تا از جعل هویت افراد مورد اعتماد جلوگیری شود.
مایکروسافت دستیار Scout را برای ادغام عاملهای تطبیقپذیر در مجموعه ۳۶۵ معرفی کرد. این ابزار با تکیه بر سامانه انطباق با سیاستها، تلاش میکند رفتار پیشبینیناپذیر عاملهای هوش مصنوعی را برای محیطهای تجاری مهار کند.
مارتین اسکورسیزی برای طراحی داستانهای تصویری با شرکت Black Forest Labs همکاری میکند. این اقدام نشاندهنده تغییر دیدگاه هالیوود از مقابله با هوش مصنوعی به استفاده از آن برای افزایش بهرهوری در مراحل پیشتولید است.
مایکروسافت ابزار بازمتن ASSERT را معرفی کرد که قوانین متنی سازمانها را به تستهای خودکار رفتاری تبدیل میکند. این چارچوب به توسعهدهندگان کمک میکند تا اطمینان یابند عاملهای هوش مصنوعی از سیاستهای داخلی شرکت تخطی نمیکنند.
شرکت اوبر پس از آنکه بودجه سالانه خود را تنها در چهار ماه سوزاند، سقف هزینه ماهانه برای ابزارهای کدنویسی AI را تعیین کرد. این تصمیم نشاندهنده چرخش این شرکت از پذیرش تهاجمی فناوری به تمرکز بر بازگشت سرمایه (ROI) است.
لینکدین با بازطراحی موتور بهینهساز خود و انتقال از زیرساخت CPU-bound به یک موتور شتابیافته با GPU، توانست سرعت حل مسائل با تریلیونها متغیر را ۷۵ برابر کند. این تغییر رویکرد، PyTorch را از یک ابزار صرفاً یادگیری عمیق به یک موتور محاسباتی کلی برای مسائل برنامهریزی خطی تبدیل کرده است.
انویدیا در نسخهی JetPack 7.2 قابلیتهای خودکارسازی استقرار را معرفی کرد تا فاصله بین نمونههای آزمایشگاهی و تولید صنعتی رباتها کاهش یابد. این بهروزرسانی همچنین با معرفی Super Mode، قدرت محاسباتی مدل AGX Orin 32GB را ۲۰٪ افزایش داد.
پشتهی نرمافزاری NemoClaw از شرکت NVIDIA به عاملهای هوش مصنوعی اجازه میدهد مهارتهای جدید را مستقیماً از گفتگو با کاربر بیاموزند و آنها را ذخیره کنند. این سیستم با استفاده از محیط امن OpenShell، دسترسی به دادههای حساس سازمانی را بدون خطر نشت اطلاعات فراهم میکند.
انویدیا و مایکروسافت با معرفی کانتینرهای امنیتی و بهینهسازیهای سختافزاری، اجرای سریع عاملهای هوش مصنوعی روی ویندوز را ممکن کردند. این بهروزرسانی سرعت استنتاج را تا ۲.۶ برابر افزایش داده و امنیت فایلهای شخصی را در برابر حملات تزریق پرامپت تضمین میکند.
مدل Nemotron 3 Ultra انویدیا اکنون باهوشترین مدل با وزنهای باز در ایالات متحده است. این مدل در سرعت و هوش رقبای آمریکایی را پشت سر گذاشته اما همچنان از رقیب چینی خود، Kimi K2.6، عقبتر است.
مدل M3 از شرکت MiniMax، نخستین مدل بازمتنی است که حافظه یک میلیون توکنی را با قابلیتهای چندوجهی ترکیب میکند. این مدل در بنچمارکهای کدنویسی و جستجوی وب، رقبای قدرتمندی چون GPT-5.5 و Gemini 3.1 Pro را شکست داده است.
ریچارد ساتون، برنده جایزه تورینگ، معتقد است مدلهای زبانی فعلی به دلیل نبود «حلقه ارزیابی» قادر به اکتشاف علمی نیستند. این مدلها در تقلید عالیاند، اما برای کشف حقیقت به سیستمی نیاز دارند که نتایج را بسنجد و پالایش کند.
Alphabet برای گسترش زیرساختهای هوش مصنوعی ۸۰ میلیارد دلار جمعآوری میکند که ۱۰ میلیارد دلار آن از سوی Berkshire Hathaway تأمین میشود. این تصمیم پس از رشد ۶۳ درصدی درآمد بخش ابری گوگل و افزایش بیسابقه تقاضا برای سختافزار اتخاذ شد.
اوپنایآی با ادغام لیستهای شغلی زنده و ویرایشگر رزومه، ChatGPT را به یک پلتفرم جامع برای مدیریت مسیر شغلی تبدیل کرد. این بهروزرسانی، ابزاری که پیشتر فقط برای پیشنویس متن بود را به یک عامل عملیاتی برای بازار کار آمریکا تبدیل میکند.
هکرهای حرفهای با سوءاستفاده از یک نقص امنیتی در چتبات پشتیبانی متا، حسابهای سطح بالای اینستاگرام از جمله صفحه کاخ سفید اوباما را سرقت کردند. این حمله با دور زدن احراز هویت دو مرحلهای و استفاده از ویدئوهای جعل عمیق برای فریب سیستمهای امنیتی صورت گرفت.
OpenAI در حال تبدیل Codex از یک ابزار تخصصی کدنویسی به اپلیکیشن بهرهوری برای متخصصان کسبوکار است. جذب کاربران غیربرنامهنویس با سرعتی سه برابر بیشتر از توسعهدهندگان، مسیر این پلتفرم را به سمت یک «سوپراپلیکیشن» تجاری میبرد.
لنگچین ابزار RubricMiddleware را معرفی کرد تا عاملهای هوش مصنوعی بتوانند خروجیهای خود را بر اساس معیارهای مشخص اصلاح کنند. در این سیستم، یک عامل ارزیاب با استفاده از ابزارهای تست، از تکمیل واقعی وظایف پیش از تحویل نهایی اطمینان مییابد.
شرکتهای LangChain و Harvey چارچوبی برای کاهش هزینهی تأیید صحت عملکرد عاملهای حقوقی پیچیده معرفی کردهاند. یافتههای آنها نشان میدهد مدل DeepSeek-V4-Flash میتواند با هزینهای ۱۰۰۰ برابر کمتر، کیفیتی نزدیک به مدلهای پیشرو ارائه دهد.
یک شرکت به دلیل نبود سقف مصرف، در یک ماه ۵۰۰ میلیون دلار برای لایسنسهای Claude هزینه کرد. این اتفاق بحران جدیدی را در سازمانها ایجاد کرده است: هزینههای نجومی ناشی از انتخاب غلط مدل و سوءاستفاده کارکنان.
پروژه tiny-vllm یک موتور آموزشی مبتنی بر C++ و CUDA است که معماری vLLM را بازسازی میکند. این ابزار به توسعهدهندگان میآموزد چگونه استنتاج Llama 3.2 را از صفر پیاده کنند و بر پیچیدگیهای حافظه GPU غلبه کنند.
مدلهای پیشرو همچنان در رفع نیمی از آسیبپذیریهای امنیتی واقعی ناتواناند. بنچمارک CVE-Bench نشان میدهد که «استدلال امنیتی» در این مدلها بیشتر شبیه به تطبیق الگو است تا تحلیل عمیق کد.
شرکت OpenAI دسترسی رایگان به مدل تخصصی علوم زیستی خود، GPT-Rosalind را برای شرکای دولتی و غیرانتفاعی تأییدشده فراهم کرد. هدف این برنامه تسریع در تولید واکسن و ایجاد سامانههای هشدار زودهنگام برای پیشگیری از پاندمیهای آینده است.
شرکت StepFun مدل Step 3.7 Flash را معرفی کرد؛ یک مدل ۱۹۸ میلیارد پارامتری بهینه برای پردازندههای NVIDIA. این مدل استدلال چندوجهی در مقیاس سازمانی را با پنجره متنی ۲۵۶ هزار توکنی ممکن میکند.