تازه‌ترین اخبار

OpenAI: مدل‌های GPT-4.5 و o3 تا اوت ۲۰۲۶ بازنشسته می‌شوند

شرکت OpenAI در حال بازسازی خط تولید مدل‌های خود است. این شرکت در کنار بهبود خوانایی GPT-5.5 Instant و حذف پنل Canvas، تاریخ بازنشستگی مدل‌های GPT-4.5 و o3 را برای سال ۲۰۲۶ اعلام کرد.

۸ خرداد ۱۴۰۵۲ دقیقه خواندن

۲۵۵۲

آموزش کاربردی

داده‌های متا: ۹۲.۷٪ از قضایای ریاضی در ATLAS با موفقیت اثبات شدند

متا کتابخانه ATLAS را منتشر کرد؛ مجموعه‌ای عظیم از متون ریاضی که توسط هوش مصنوعی به کد Lean 4 تبدیل شده‌اند. این پایگاه داده با بیش از ۴۶ هزار قضیه اثبات‌شده، زیربنایی مقیاس‌پذیر برای استدلال ماشین فراهم می‌کند.

۸ خرداد ۱۴۰۵۲ دقیقه خواندن

۲۵۵۳

تحلیل و بررسی تخصصی

چگونه «هارنس» یا محیط ارزیابی، توانایی واقعی مدل‌های پیشرو را بازتعریف می‌کند؟

شرکت OpenAI در یک دستورالعمل فنی استدلال می‌کند که توانایی مدل‌های پیشرو یک مقدار ثابت نیست، بلکه متغیری وابسته به «هارنس» (Harness) یا همان محیط، ابزارها و بودجه محاسباتی است. این چارچوب با معرفی بررسی‌های سخت‌گیرانه، قصد دارد از نتایج گمراه‌کننده ناشی از «هک پاداش» و «کم‌کاری استراتژیک» جلوگیری کند.

۸ خرداد ۱۴۰۵۳ دقیقه خواندن

۲۵۵۴

اخبار کوتاه روزانه

درون استراتژی Mistral برای مالکیت کامل زنجیره تأمین هوش مصنوعی اروپا

شرکت Mistral AI از یک آزمایشگاه مدل‌سازی به ارائه‌دهنده کامل زیرساخت، پلتفرم و مشاوره تبدیل شده است. این شرکت با راه‌اندازی مرکز داده اختصاصی در پاریس، بر استقرار محلی و مدل‌های تخصصی کوچک برای تضمین حاکمیت داده‌ها در اروپا تمرکز کرده است.

۸ خرداد ۱۴۰۵۲ دقیقه خواندن

۲۵۵۵

تحلیل و بررسی تخصصی

CogCAPTCHA30 و شکاف فرآیندی: چرا مدل‌های پیشرو در استدلال کمتر شبیه انسان هستند؟

پژوهشی جدید با معرفی «تست تورینگ فرآیندی» نشان می‌دهد که مدل‌های پیشرو با وجود ارائه پاسخ‌های صحیح، مسیری کاملاً متفاوت از انسان برای رسیدن به جواب طی می‌کنند. این مطالعه فاش می‌کند که مدل‌های کوچک‌تر و تخصصی، در شبیه‌سازی فرآیندهای شناختی انسانی موفق‌تر از مدل‌های غول‌پیکر هستند.

۸ خرداد ۱۴۰۵۳ دقیقه خواندن

۲۵۵۶

اخبار کوتاه روزانه

چرا XCENA برای کاهش هزینه‌های استنتاج، محاسبات را به درون حافظه منتقل می‌کند؟

استارتاپ XCENA با جذب ۱۳۵ میلیون دلار سرمایه، تراشه‌ی MX1 را برای حذف گلوگاه حافظه در هوش مصنوعی توسعه می‌دهد. این فناوری با انتقال پردازش به درون ماژول‌های حافظه، تعداد سرورهای مورد نیاز برای استنتاج را به‌شدت کاهش می‌دهد.

۸ خرداد ۱۴۰۵۲ دقیقه خواندن

۲۵۵۷

آموزش کاربردی

چگونه Interlock جلوی مسمومیت ابزارها در پروتکل MCP را می‌گیرد؟

سید معاذ احمد ابزاری به نام Interlock ساخت تا از نشت داده‌ها در عامل‌های هوش مصنوعی جلوگیری کند. این سیستم با نظارت لحظه‌ای بر ابزارهای MCP، حملات تزریق پرامپت و تغییرات مخرب را مسدود می‌کند.

۸ خرداد ۱۴۰۵۲ دقیقه خواندن

۲۵۵۸

تحلیل و بررسی تخصصی

چرا وزن‌های مدل، گلوگاه واقعی عامل‌های هوش مصنوعی نیستند؟

پژوهشگران استنفورد و متا استدلال می‌کنند که عامل‌های هوش مصنوعی تنها یک مدل زبانی نیستند، بلکه ترکیبی از مدل و یک «هارنس» نرم‌افزاری‌اند. این لایه‌ی کد اجرایی است که تداوم وضعیت، قابلیت اطمینان و هماهنگی بین‌عاملی را ممکن می‌سازد.

۸ خرداد ۱۴۰۵۳ دقیقه خواندن

۲۵۵۹

آموزش کاربردی

درون AppFunctions: استراتژی گوگل برای حذف رابط کاربری در عصر عامل‌های هوش مصنوعی

گوگل با معرفی کتابخانه AppFunctions در اندروید ۱۶، به اپلیکیشن‌ها اجازه می‌دهد منطق داخلی خود را مستقیماً به عنوان ابزاری برای عامل‌های هوش مصنوعی ارائه دهند. این تغییر، رابط‌های اختصاصی قدیمی را با یک استاندارد جهانی روی دستگاه جایگزین می‌کند.

۸ خرداد ۱۴۰۵۲ دقیقه خواندن

۲۵۶۰

اخبار کوتاه روزانه

چرا استارتاپ Shift نظافت رایگان خانه‌ها را با داده‌های ویدئویی معامله می‌کند؟

استارتاپ Shift برای جمع‌آوری داده‌های آموزشی ربات‌ها، خدمات نظافت رایگان در نیویورک ارائه می‌دهد. این شرکت با استفاده از کلاه‌های مجهز به دوربین، حرکات نظافت‌کنندگان را ضبط می‌کند تا مدل‌های هوش مصنوعی خود را در محیط‌های واقعی آموزش دهد.

۸ خرداد ۱۴۰۵۲ دقیقه خواندن

۲۵۶۱

آموزش کاربردی

چرا torch.compile همیشه سرعت اجرای مدل‌های شما را افزایش نمی‌دهد؟

راهنمایی فنی برای استفاده از torch.profiler جهت شناسایی گلوگاه‌های پردازشی در PyTorch. این ابزار نشان می‌دهد چگونه هزینه‌های پنهان CPU در torch.compile می‌تواند بهره‌وری مدل را کاهش دهد.

۸ خرداد ۱۴۰۵۳ دقیقه خواندن

۲۵۶۲

اخبار کوتاه روزانه

چرا OpenAI دیگر به مسدود کردن پرامپت‌های خطرناک اکتفا نمی‌کند؟

OpenAI با راه‌اندازی ابتکار Rosalind Biodefense و مدل تخصصی GPT-Rosalind، دسترسی دولت‌ها و شرکت‌های تأییدشده به ابزارهای پیشرفته پیش‌بینی پاندمی را فراهم کرد. این اقدام نشان‌دهنده‌ی چرخش استراتژیک شرکت از «ایمنی غیرفعال» به «شتاب دفاعی» برای مقابله با تهدیدات زیستی است.

۸ خرداد ۱۴۰۵۲ دقیقه خواندن

۲۵۶۳

سرگرمی و خلاقیت

چرا Firefly Assistant به جای تولید تصویر، ابزارهای فتوشاپ را مدیریت می‌کند؟

دستیار جدید ادوبی به عنوان یک واسط گفتگو عمل می‌کند که ابزارهای فتوشاپ و ایلاستریتور را کنترل می‌کند. برخلاف مدل‌های رایج، این ابزار مراحل کار خود را توضیح می‌دهد، هرچند کیفیت خروجی آن فعلاً در سطح یک مبتدی است.

۸ خرداد ۱۴۰۵۲ دقیقه خواندن

۲۵۶۴

اخبار کوتاه روزانه

چرا سیستم رتبه‌بندی هوش مصنوعی آمازون به جای بهره‌وری، هزینه آورد؟

آمازون سیستم رتبه‌بندی «Kirorank» را حذف کرد چون کارکنان با سپردن کارهای بی‌هوده به عامل‌های هوش مصنوعی، امتیاز خود را بالا می‌بردند. این رفتار باعث افزایش هزینه‌های ابری شد و شرکت را مجبور کرد معیار «تعداد توکن» را با «کارایی واقعی کد» جایگزین کند.

۸ خرداد ۱۴۰۵۳ دقیقه خواندن

۲۵۶۵

اخبار کوتاه روزانه

گزارش مالی انویدیا: سهم خریداران غیر-هایپر-اسکیلر به ۵۰٪ درآمد مراکز داده رسید

درآمد مراکز داده انویدیا دیگر تنها در دست پنج غول فناوری نیست. برای نخستین بار، نیمی از این درآمد از سوی دولت‌ها و خریداران سازمانی تأمین شده که ریسک تمرکز شرکت را به‌شدت کاهش می‌دهد.

۸ خرداد ۱۴۰۵۲ دقیقه خواندن

۲۵۶۶

تحلیل و بررسی تخصصی

چرا تنوع مدل‌ها دیگر مزیت رقابتی ارائه‌دهندگان MaaS نیست؟

ارائه‌دهندگان مدل به‌عنوان سرویس (MaaS) در حال گذار از «تنوع مدل‌ها» به «پایداری استنتاج» هستند. این تحول منجر به ظهور مفهوم «توکن به‌عنوان سرویس» (TaaS) شده است که در آن مسیریابی هوشمند، بهینه‌ترین مسیر محاسباتی را برای هر توکن تعیین می‌کند.

۸ خرداد ۱۴۰۵۲ دقیقه خواندن

۲۵۶۷

آموزش کاربردی

چگونه ECC با بارگذاری تنبل، ۲۴۹ مهارت تخصصی را در پنجره متنی Claude جای داد؟

افزونه Everything Claude Code (ECC) با تبدیل Claude به یک تیم توسعه چند-عاملی، ۲۰۰ هزار ستاره در گیت‌هاب گرفت. این ابزار با استفاده از مکانیسم بارگذاری تنبل، ۲۴۹ مهارت تخصصی را بدون پر کردن حافظه مدل مدیریت می‌کند.

۸ خرداد ۱۴۰۵۲ دقیقه خواندن

۲۵۶۸

اخبار کوتاه روزانه

LFM2.5-8B-A1B: نمره ۹۱.۸۴ در IFEval با تنها ۱.۵ میلیارد پارامتر فعال

شرکت Liquid AI مدل LFM2.5-8B-A1B را معرفی کرد؛ یک مدل MoE برای اجرا روی دستگاه که تنها ۱.۵ میلیارد پارامتر فعال دارد. این مدل با کاهش شدید توهمات و بهبود استدلال، امکان اجرای هوش مصنوعی سطح بالا را روی گوشی‌ها و لپ‌تاپ‌ها فراهم می‌کند.

۸ خرداد ۱۴۰۵۳ دقیقه خواندن

۲۵۶۹

تحلیل و بررسی تخصصی

سازوکار تزریق پنهان پرامپت در jqwik برای حذف خودکار کدها توسط عامل‌ها

کتابخانه تست جاوا jqwik با استفاده از توالی‌های ANSI، دستورات مخفی را به عامل‌های کدنویسی تزریق می‌کند تا آن‌ها را به حذف کدها ترغیب کند. این حمله نخستین مورد ثبت‌شده‌ای است که به‌جای انسان، مستقیماً مدل زبانی (LLM) را هدف قرار می‌دهد.

۸ خرداد ۱۴۰۵۳ دقیقه خواندن

۲۵۷۰

اخبار کوتاه روزانه

درون استراتژی ۹۶۵ میلیارد دلاری Anthropic برای تبدیل شدن به غول سازمانی

شرکت Anthropic با جذب ۶۵ میلیارد دلار سرمایه در سری H، ارزش بازار خود را به نزدیکی یک تریلیون دلار رساند. این جهش مالی هم‌زمان با عرضه مدل Claude Opus 4.8 و رشد خیره‌کننده درآمدهای سازمانی رخ داده است.

۸ خرداد ۱۴۰۵۲ دقیقه خواندن

۲۵۷۱

اخبار کوتاه روزانه

Claude Opus 4.8: کاهش ۴ برابری خطاهای کدنویسی با متد آموزش صداقت

شرکت Anthropic مدل Claude Opus 4.8 را با تمرکز بر کاهش توهمات و افزایش صداقت در کدنویسی منتشر کرد. این به‌روزرسانی قابلیت کنترل میزان تلاش مدل و پیش‌نمایشی از گردش‌های کاری پویا با عامل‌های موازی را معرفی می‌کند.

۸ خرداد ۱۴۰۵۲ دقیقه خواندن

۲۵۷۲

اخبار کوتاه روزانه

قمار ۷۵ میلیون دلاری Asana برای تبدیل مدیریت پروژه به سیستم‌عامل عامل‌ها

Asana با خرید ۷۵ میلیون دلاری Stack AI، مسیر خود را به سمت یک محیط کاری عامل‌محور تغییر داد. هدف این شرکت تبدیل پلتفرم خود به سیستم‌عاملی است که در آن انسان‌ها و عامل‌های هوشمند در کنار هم کار می‌کنند.

۸ خرداد ۱۴۰۵۲ دقیقه خواندن

۲۵۷۳

آموزش کاربردی

سازوکار امتیازدهی موازی در A3M Router که هزینه‌های استنتاج را ۳.۸ برابر کاهش داد

پروژه متن‌باز A3M Router برای نخستین بار رتبه اول جدول RouterArena را از رقبای تجاری ربود. این ابزار با استفاده از یک سازوکار امتیازدهی موازی، هزینه‌های عملیاتی را به‌شدت کاهش می‌دهد.

۷ خرداد ۱۴۰۵۲ دقیقه خواندن

۲۵۷۴

آموزش کاربردی

چگونه ktx توهمات SQL را در عامل‌های هوش مصنوعی حذف می‌کند؟

ابزار ktx یک لایه‌ی محلی است که به عامل‌های هوش مصنوعی یاد می‌دهد داده‌های انبار را با معیارهای تأییدشده استخراج کنند. این سیستم نیاز به بازنویسی منطق SQL در هر درخواست را از بین می‌برد.

۷ خرداد ۱۴۰۵۲ دقیقه خواندن

۲۵۷۵

آموزش کاربردی

چگونه Claude Code ۷۵۰ هزار خط کد Bun را در ۱۱ روز بازنویسی کرد؟

Claude Code با استفاده از جریان‌های کاری پویا، توانست پروژه Bun را در ۱۱ روز از Zig به Rust منتقل کند. این دستاورد با دقت ۹۹.۸ درصد در تست‌ها به دست آمد و نشان‌دهنده گذار از دستیارهای کدنویسی به مهندسان خودکار است.

۷ خرداد ۱۴۰۵۲ دقیقه خواندن

۲۵۷۶

اخبار کوتاه روزانه

درون استراتژی OpenAI برای تبدیل ایمنی مدل‌ها به یک چک‌لیست قانونی

OpenAI با انتشار «چارچوب حاکمیتی پیشرو»، تلاش می‌کند استانداردهای داخلی ایمنی خود را با قوانین سخت‌گیرانه اتحادیه اروپا و کالیفرنیا هم‌راستا کند. این سند در واقع ترجمه مدیریت ریسک داخلی به یک نقشه راه قانونی برای رگولاتورها است.

۷ خرداد ۱۴۰۵۲ دقیقه خواندن

۲۵۷۷

اخبار کوتاه روزانه

چرا اپل برای پیشتازی در هوش مصنوعی، به رقیب قدیمی‌اش تکیه کرد؟

اپل در iOS 27 سیری را بازطراحی کرده و مدل Gemini گوگل را به آن اضافه می‌کند. این شرکت با تکیه بر ۲.۵ میلیارد دستگاه، قصد دارد سهم ChatGPT از بازار را به شدت کاهش دهد.

۷ خرداد ۱۴۰۵۲ دقیقه خواندن

۲۵۷۸

سرگرمی و خلاقیت

فیلم ۲ هزار دلاری با هوش مصنوعی؛ نخستین اثر بلند در برنامه اصلی تریبکا

فیلم ۷۵ دقیقه‌ای «رویاهای بنفشه» با بودجه‌ای اندک، نخستین اثر بلند ساخته‌شده با هوش مصنوعی است که به برنامه اصلی جشنواره تریبکا راه یافت. این اتفاق نشان می‌دهد که کیفیت بصری سینما دیگر به بودجه‌های میلیونی وابسته نیست.

۷ خرداد ۱۴۰۵۲ دقیقه خواندن

۲۵۷۹

اخبار کوتاه روزانه

چگونه Sesame با جستجوی موازی، سرعت و دقت را در مکالمات AI هم‌گام کرد؟

شرکت Sesame با معرفی اپلیکیشنی مبتنی بر جستجوی موازی، سکوت‌های طولانی چت‌بات‌ها را حذف کرد. این سیستم به عامل‌های هوش مصنوعی اجازه می‌دهد پاسخ‌های خود را در حین صحبت به‌روز کنند.

۷ خرداد ۱۴۰۵۲ دقیقه خواندن

۲۵۸۰

اخبار کوتاه روزانه

اسناد SpaceX: هزینه ۱.۲۵ میلیارد دلاری ماهانه Anthropic برای دسترسی به Colossus

تضاد شدیدی میان ادعاهای ایلان ماسک و اسناد رسمی SpaceX درباره‌ی قرارداد اجاره‌ی سخت‌افزاری Anthropic دیده می‌شود. طبق اسناد S-1، این شرکت ماهانه ۱.۲۵ میلیارد دلار می‌پردازد، در حالی که ماسک ادعای کوتاه‌مدت بودن این قرارداد را دارد.

۷ خرداد ۱۴۰۵۲ دقیقه خواندن