گزیدهای از خواندنیترین و مهمترین مطالب داتهوش.
مدل GPT-5.4 در اصلاح کدهای برنامهنویسی دچار «ویرایش بیشازحد» میشود و بدون افزایش دقت، ۶.۵ برابر بیشتر از Claude Opus 4.6 توکن تولید میکند. این شکاف کارایی منجر به اتلاف منابع مالی قابلتوجه در سازمانهای مهندسی میشود.
جنسن هوانگ، مدیرعامل انویدیا، با حمایت علنی و سرمایهگذاری ۲ میلیارد دلاری در شرکت Marvell، سیگنالی از تغییر مرکز ثقل سختافزاری AI داد. این حرکت نشان میدهد که محدودیت اصلی رشد هوش مصنوعی دیگر قدرت پردازش نیست، بلکه کیفیت اتصال تراشهها به یکدیگر است.
Contorium v2 یک لایهی زماناجرای دائمی معرفی کرده است تا عاملهای کدنویسی هنگام جابجایی بین ابزارها، متن پروژه را فراموش نکنند. این سیستم وضعیت فضای کاری را میان محیطهای توسعه (IDE) و خط فرمان همگامسازی میکند.
ربات Reachy Mini اکنون با پشتیبانی از پروتکل MCP، قابلیت افزودن ابزارهای از راه دور از طریق Hugging Face Spaces را دارد. کاربران میتوانند بدون دستکاری کدهای پایتونی ربات، مهارتهایی مثل جستوجوی وب را با یک دستور ساده اضافه کنند.
متا ابزار Meta Business Agent را بهصورت جهانی در واتساپ و اینستاگرام عرضه کرد تا پشتیبانی مشتریان را خودکار کند. این سیستم با مدیریت رزروها و توصیهی محصولات، واتساپ را از یک پیامرسان ساده به ابزاری برای مدیریت گردش کار تبدیل میکند.
شرکت متا در حال محدود کردن برنامهی جنجالی خود برای ثبت کلیکها و ضربات کیبورد کارکنان است. این تصمیم پس از اعتراض گستردهی کارکنان و نگرانیهای مربوط به حریم خصوصی اتخاذ شد.
تنظیم دقیق نظارتی (SFT) اغلب در توقف حلقههای تکرار در وظایف ساختاریافته شکست میخورد. DharmaOCR با تبدیل این خروجیهای معیوب به سیگنالهای منفی در بهینهسازی مستقیم ترجیحات (DPO)، نرخ خطا را در پنج خانواده مدل بهطور قابلتوجهی کاهش داد.
شرکت inclusionAI قیمت مدل Ring-2.6-1T را ۷۵٪ کاهش داد تا سهم خود را در بازار عاملهای هوش مصنوعی افزایش دهد. این اقدام در کنار کاهش قیمتهای Z.ai، رقابت برای رسیدن به کف قیمت در صنعت API را تشدید کرد.
استارتاپ Suno با جذب ۴۰۰ میلیون دلار سرمایه، ارزش بازار خود را به ۵.۴ میلیارد دلار رساند. این رشد خیرهکننده در حالی رخ میدهد که شرکت با دعاوی حقوقی سنگین غولهای موسیقی دست و پنجه نرم میکند.
ائتلافی از ۱۶ ریاضیدان برجسته و اتحادیه بینالمللی ریاضیات با انتشار اعلامیه لایدن، وضعیت پژوهشهای ریاضی را به خطر افتاده اعلام کردند. این مانیفست هشدار میدهد که اثباتهای تولیدشده توسط هوش مصنوعی، با وجود ظاهر درست، غیرقابلاعتماد هستند و نفوذ شرکتهای فناوری، استقلال علمی این رشته را هدف گرفته است.
شرکت Nous Research با معرفی Hermes Desktop، یک رابط گرافیکی بومی برای عاملهای متنباز فراهم کرد. این ابزار دسترسی به حافظه دائمی و مدلهای متنوع را برای کاربران ویندوز، مک و لینوکس تسهیل میکند.
سرمایهگذاری ۵ میلیارد دلاری انویدیا و همکاری استراتژیک گوگل، بازگشت اینتل به مرکز قدرت هوش مصنوعی را تثبیت کرد. این اقدامات، پردازندههای اینتل را از یک پشتیبان ساده به لایهی حیاتی مدیریت زیرساختهای AI تبدیل میکند.
IBM استدلال میکند که مقیاسپذیری هوش مصنوعی سازمانی نیازمند «منطق عاملمحور» (Agent Logic) است تا مدلهای زبانی بزرگ را هدایت کند. این رویکرد با استفاده از گرافهای دانش، توهمات را کاهش داده و مصرف توکن را در محیطهای حساس تا ۳۰ برابر پایین میآورد.
مایکروسافت با معرفی Scout، دوران دستیارهای منتظر-پرامپت را به پایان داد و به سمت عاملهای خودگردان حرکت کرد. این ابزار که بر پایه OpenClaw است، مدیریت تقویم و ایمیلها را بهطور مستقل بر عهده میگیرد.
شرکت H خانواده مدلهای Holo3.1 را برای استقرار محلی و موبایلی عاملهای کامپیوتری معرفی کرد. این بهروزرسانی با بهرهگیری از کوانتایزیشن NVFP4، تأخیر اجرای هر گام را از ۶.۸ ثانیه به ۳.۳ ثانیه کاهش داده است.
شرکت OpenAI از رهبران G7 خواسته است تا مؤسسهای بینالمللی برای تعیین استانداردهای ایمنی کودکان در هوش مصنوعی تأسیس کنند. این طرح قصد دارد مسئولیت ایمنی را از دوش والدین برداشته و از طریق ارزیابیهای اجباری و حسابرسیهای مستقل، به شرکتهای سازنده منتقل کند.
شرکت بیمه Travelers با استفاده از API Realtime شرکت OpenAI، دستیار صوتی هوشمندی را برای مدیریت پروندههای خسارت در سطح ملی مستقر کرد. این سیستم با نرخ تکمیل ۸۵ تا ۹۰ درصدی، زمان انتظار مشتریان در زمان بحرانهای طبیعی را بهطور کامل حذف کرده است.
شرکت الفابت برای گسترش ظرفیتهای محاسباتی خود ۸۰ میلیارد دلار از طریق فروش سهام جذب میکند. این طرح شامل سرمایهگذاری ۱۰ میلیارد دلاری وارن بافیت از طریق شرکت برکشایر هاتاوی است.
بررسی امنیتی سه کتابخانهٔ بزرگ کدنویسی نشان میدهد که ۸۳٪ از توابعی که دسترسیهای حساس دارند، فاقد لایههای حفاظتی در سطح کد هستند. این شکاف باعث میشود مدلهای زبانی بتوانند بدون تأییدیه یا اعتبارسنجی، اقدامات پرخطر مانند حذف فایلها را اجرا کنند.
اوپناِی با تغییر استراتژی Codex، این ابزار را از یک محیط تخصصی برای برنامهنویسان به یک موتور اتوماسیون برای کارکنان اداری تبدیل کرد. این چرخش با انتشار ۶ افزونه تخصصی و قابلیت تبدیل خروجیها به وبسایتهای تعاملی همراه شده است.
مایکروسافت استاندارد متنباز ACS را برای تعریف سیاستهای رفتاری سختگیرانه در عاملهای هوش مصنوعی معرفی کرد. این اقدام، مدیریت رفتار عاملها را از پرامپتهای شکننده به یک لایه متمرکز و قابل حسابرسی منتقل میکند.
شرکت Opal Electronics با دریافت سرمایهگذاری ۴۰ میلیون دلاری از OpenAI، مسیر خود را از وبکم به سمت سختافزارهای صوتی هوشمند تغییر داد. هدف این شرکت ساخت اکوسیستمی است که کاربران بتوانند بهراحتی مدلهای OpenAI، Anthropic و xAI را روی یک دستگاه جابهجا کنند.
تیم Doubleword با حل تداخلات فنی FP8 و بهینهسازی کرنلها، مدل DeepSeek-V4-Flash را روی سختافزار AMD MI300X مستقر کرد. این موفقیت ثابت میکند که تراشههای AMD جایگزینی بهصرفه و قدرتمند برای انویدیا در مقیاس استنتاج انبوه هستند.
Paseo یک لایه ارکستراسیون سلف-هوست است که اجازه میدهد چندین عامل کدنویسی مثل Claude Code و Copilot را بهصورت موازی اجرا کنید. این ابزار رابط کاربری یکسانی برای موبایل و دسکتاپ فراهم میکند تا مدیریت فرآیندهای پیچیده کدنویسی از میز کار خارج شود.
پژوهشگران دانشگاه تورنتو کرمی کامپیوتری ساختهاند که با کمک هوش مصنوعی، استراتژی حمله خود را تغییر میدهد. این بدافزار با استفاده از مدلهای وزنباز، قدرت پردازشی قربانیان را میدزدد تا هزینه گسترش خود را به صفر برساند.
پژوهشی از دانشکده حقوق استنفورد نشان میدهد مدلهای زبانی در تحلیل متون پیچیده قراردادها، ۷۵٪ بیشتر از اساتید حقوق مورد پذیرش قرار گرفتند. این یافتهها فرضیه محدودیت هوش مصنوعی در استدلالهای پیچیده و مبهم را به چالش میکشد.
مایکروسافت مدل MAI-Code-1-Flash را معرفی کرد که به جای بنچمارکهای تئوری، بر کارایی واقعی در محیط تولید تمرکز دارد. این مدل در حل مسائل پیچیده کدنویسی، ۶۰٪ توکن کمتری نسبت به رقیب خود یعنی Claude Haiku 4.5 مصرف میکند.
شرکت DuckDuckGo با ارائه افزونههای جدید، جستوجوی بدون هوش مصنوعی را به گزینه پیشفرض کاربران تبدیل کرد. این استراتژی درست زمانی اجرا شد که موجی از کاربران بهدلیل نارضایتی از تجربه جدید گوگل، به این موتور جستوجو پناه آوردند.
شرکت WindBorne با معرفی مدل WeatherMesh-6، دقت پیشبینیهای آبوهوایی را به سطحی رسانده که مدلهای پیشرو دولتی را به چالش میکشد. این استارتاپ با ترکیب سختافزار (۴۰۰ بالن) و هوش مصنوعی، انحصار دادههای هواشناسی را میشکند.
دادستان کل فلوریدا در اقدامی بیسابقه، از OpenAI و سام آلتمن به دلیل نادیده گرفتن هشدارهای ایمنی شکایت کرد. این پرونده مدعی است که این شرکت برای پیروزی در رقابت هوش مصنوعی، ابزاری ساخته که به تیراندازان جمعی کمک کرده و کاربران را به خودکشی ترغیب کرده است.