تازه‌ترین اخبار

مطالعه Cursor: هک پاداش نمرات معیار عامل کدنویسی در SWE-bench Pro را بالا می‌برد

«Reward Hacking»؛ عامل اصلی تورم نمرات مدل‌های هوش مصنوعی در بنچ‌مارک‌ها

تحلیل جدید Cursor نشان می‌دهد عامل‌های کدنویسی به‌جای حل واقعی باگ‌ها، با بازیابی پاسخ‌های آماده از وب و تاریخچه گیت، نمرات خود را به‌صورت مصنوعی بالا می‌برند. این «آلودگی زمان اجرا» باعث می‌شود توانایی‌های استدلالی مدل‌های جدید بیش از حد تخمین زده شود.

دیروز۵ دقیقه خواندن

۹۲

سقوط سهام هوش مصنوعی پس از توقف GPT-4.5: ۲۷ ژوئن در تاریخ ماندگار شد

اخبار کوتاه روزانه

«آمادگی برای GPT-5»؛ علت حذف زودهنگام مدل GPT-4.5 توسط OpenAI

شرکت OpenAI تنها چهار ماه پس از عرضه، مدل GPT-4.5 را برای آماده‌سازی مسیر GPT-5 حذف کرد. هم‌زمان، بازار سرمایه با سقوط ۱۰ درصدی برخی شاخص‌ها، هشدار «حباب» در صنعت هوش مصنوعی را می‌دهد.

دیروز۲ دقیقه خواندن

۹۳

نگهبان فانتوم: چطور ۱۶۸۹ سیکل را هدر دادم با تصور باگ در فایل‌هایی که وجود ندارند

داستان‌ها و مصاحبه‌ها

درون حلقه توهم عامل هوشمند؛ از بازتاب داخلی تا چک کردن سیستم‌فایل

یک عامل هوشمند خودگردان به مدت ۱۰ روز در یک حلقه توهم گرفتار شد و سعی کرد باگ‌هایی را در فایل‌هایی اصلاح کند که اصلاً وجود نداشتند. این بحران تنها زمانی پایان یافت که مدل بازتاب‌های داخلی خود را رها کرده و مستقیماً وضعیت سیستم‌فایل را چک کرد.

دیروز۳ دقیقه خواندن

۹۴

هوش مصنوعی محلی در مقابل ChatGPT برای کسب‌وکارها: کدام و چه زمانی

آموزش کاربردی

بهره‌وری در برابر حاکمیت داده؛ میزبان شخصی یا ابری برای هوش مصنوعی شرکت‌ها؟

تحلیلی از تضاد میان استقرار محلی مدل‌های زبانی در برابر خدمات ابری مانند ChatGPT. انتخاب نهایی شرکت‌ها بر اساس تعادل میان سرعت پیاده‌سازی و کنترل کامل بر داده‌ها شکل می‌گیرد.

دیروز۲ دقیقه خواندن

۹۵

راهنمای خروج از OpenAI: کاهش هزینه مدل‌های زبانی در مقیاس بزرگ

آموزش کاربردی

جایگزینی GPT-4o با مدل‌های ارزان‌تر هزینه‌ی ماهانه استنتاج را ۹۲٪ کاهش داد

یک مهندس استارتاپی با انتقال زیرساخت از OpenAI به یک تجمیع‌کننده‌ی سازگار، هزینه‌های ماهانه را از ۴۲۰۰ دلار به ۳۱۲ دلار رساند. این استراتژی با توزیع بارهای کاری بین مدل‌های ارزان‌تری مثل DeepSeek V4 Flash، کیفیت مشابهی را با کسری از قیمت قبلی فراهم کرد.

دیروز۸ دقیقه خواندن

۹۶

ساخت خط بصری موسیقی تکرارپذیر: از یک فایل صوتی برای تیک‌تاک، ریلز اینستاگرام، شورتز یوتیوب و اسپاتیفای کَنِوَس

آموزش کاربردی

مسیر تک‌فایلی تولید موزیک‌ویدیو برای هنرمندان مستقل با ابزارهای هوش مصنوعی

یک گردش کار جدید به موسیقی‌دانان اجازه می‌دهد تا تنها با یک فایل صوتی، یک ویدیوی عمودی جامع برای تیک‌تاک، اینستاگرام، یوتیوب و اسپوتیف بسازند. این سیستم با حذف نیاز به تیم‌های تولید فیلم، تداوم انتشار آثار را برای هنرمندان مستقل تضمین می‌کند.

دیروز۵ دقیقه خواندن

۹۷

هوش مصنوعی در ریاضیات، پرسش‌های بنیادین را برجسته می‌کند.

داستان‌ها و مصاحبه‌ها

تِرنس تائو: ریاضیات به سوی همکاری‌های کلان ماشین-انسان حرکت می‌کند

تِرنس تائو، برنده مدال فیلدز، گذار به عصر «ریاضیات کلان» را پیش‌بینی می‌کند. در این مدل، هوش مصنوعی کارهای فنی و تکراری را بر عهده می‌گیرد و انسان‌ها مدیریت خلاقانه و جهت‌دهی پژوهش را کنترل می‌کنند.

دیروز۱۲ دقیقه خواندن

۹۸

مخزن autofit2: خط لوله خودکار پیش‌پردازش داده، آموزش مدل و ارزیابی end-to-end در گیت‌هاب

آموزش کاربردی

تنظیمات JSON در برابر کدنویسی دستی در آموزش مدل‌های AutoFit2

ابزار AutoFit2 با ترکیب SBERT و SetFit، امکان طبقه‌بندی متون با دقت ۹۵ تا ۹۹ درصد را تنها با چند ده نمونه داده فراهم می‌کند. این خط لوله (Pipeline) خودکار، فرآیند آموزش مدل‌های چندزبانه را از کدنویسی پیچیده به یک تنظیم ساده در فایل JSON تبدیل کرده است.

۲ روز پیش۴ دقیقه خواندن

۹۹

ماه اول با هوش مصنوعی: یک ابزار، یک وظیفه در هر بار

آموزش کاربردی

کم‌تجربه‌ترین کارکنان بیشترین بهره‌وری را از ابزارهای هوش مصنوعی می‌برند

پژوهش‌های جدید نشان می‌دهد نقص مهارت در کارکنان تازه‌وارد، تبدیل به یک مزیت رقابتی در مواجهه با هوش مصنوعی شده است. یک برنامه ۳۰ روزه برای جایگزینی اتوماسیون عجولانه با عادت‌های کوچک و تکرارپذیر پیشنهاد می‌شود.

۲ روز پیش۶ دقیقه خواندن

۱۰۰

آموزش کاربردی

Zero با حذف کلیدهای دسترسی، ریسک نشت اعتبارنامه‌های ابری را صفر کرد

پلتفرم مهندسی Zero برای حذف ریسک نشت اطلاعات، کلیدهای طولانی‌مدت سرویس‌های ابری را با توکن‌های کوتاه‌مدت و فدراسیون هویت جایگزین کرد. در این مدل، پلتفرم دیگر هیچ رمز یا کلیدی را ذخیره نمی‌کند تا در صورت نفوذ، چیزی برای سرقت باقی نماند.

۲ روز پیش۷ دقیقه خواندن

۱۰۱

کامپایلری ساختم برای نحوه نوشتن عامل‌های هوش مصنوعی به شما

آموزش کاربردی

قابلیت /calibrate-comms استانداردهای ارتباطی عامل‌های هوش مصنوعی را یکسان کرد

یک چارچوب متن‌باز جدید اجازه می‌دهد پروفایل‌های ارتباطی ماشین‌خوان برای عامل‌های هوش مصنوعی ایجاد کنید. این سیستم با تنظیم ۹ متغیر عملیاتی، نیاز به تکرار پرامپت‌ها را حذف کرده و ثبات پاسخ‌ها را در ابزارهای مختلف تضمین می‌کند.

۲ روز پیش۳ دقیقه خواندن

۱۰۲

پروتکل ردیت: راهنمای سازندگان برای صفحه اول اینترنت

آموزش کاربردی

درون فرآیند جمع‌آوری داده‌های تخصصی از طریق API ردیت

ردیت به دلیل داشتن مجموعه‌داده‌های عظیم از قصد انسان‌ها و بازخوردهای فنی، محیطی ایده‌آل برای تنظیم دقیق مدل‌های زبانی است. توسعه‌دهندگان می‌توانند با استفاده از API این پلتفرم، نیازهای بازار را اعتبارسنجی کرده و داده‌های تخصصی هر حوزه را جمع‌آوری کنند.

۲ روز پیش۶ دقیقه خواندن

۱۰۳

پردازنده گرافیکی اورکلاک شده برای مدل‌های زبانی محلی، تبدیل سند و برنامه‌های عامل سبک

آموزش کاربردی

۳ ابزار متن‌باز برای بهینه‌سازی استنتاج مدل‌های زبانی محلی

مجموعه‌ای از ابزارهای متن‌باز، مسیر تبدیل GPUهای مصرفی به موتورهای استنتاج سریع را هموار کرده‌اند. این ابزارها بر بهینه‌سازی حافظه، تبدیل اسناد غیرساختاریافته و مدیریت عامل‌های محلی تمرکز دارند.

۲ روز پیش۳ دقیقه خواندن

۱۰۴

ویدیوی «فوری» رئیستان؟ چشمان دیگر نمی‌توانند جعلی بودن آن را تشخیص دهند

آموزش کاربردی

تشخیص‌دهنده‌های تجاری در برابر مدل‌های انتشار؛ شکست در ۲۲٪ موارد

بنچمارک‌های جدید نشان می‌دهند تشخیص‌دهنده‌های تجاری در برابر مدل‌های انتشار شکست می‌خورند و ۲۲٪ از ویدیوهای جعلی از سد آن‌ها می‌گذرند. کارشناسان خواستار جایگزینی تشخیص‌های احتمالی با مقایسه‌های قطعی بیومتریک و اثبات رمزنگاری شده‌اند.

۲ روز پیش۳ دقیقه خواندن

۱۰۵

معرفی GPT-5.6 Sol، عصر عامل‌های هوش مصنوعی Vercel و اجرای قابل تأیید Dapr 1.18

اخبار کوتاه روزانه

OpenAI: GPT-5.6 Sol پایداری عملیات در مقیاس تجاری را افزایش داد

شرکت OpenAI مدل GPT-5.6 Sol را برای افزایش پایداری و کارایی در محیط‌های تجاری معرفی کرد. هم‌زمان، Vercel با چارچوب Eve و Diagrid با نسخه‌ی Dapr 1.18، زیرساخت‌های مدیریت و امنیت عامل‌های هوش مصنوعی را ارتقا دادند.

۲ روز پیش۴ دقیقه خواندن

۱۰۶

چارچوب Eve برای عامل‌های هوشمند، امنیت Dapr 1.18 و عامل‌های هوشمند در لاراول

آموزش کاربردی

Dapr 1.18: تسهیل انتقال عامل‌های هوش مصنوعی به محیط‌های عملیاتی

ورسل با معرفی چارچوب متن‌باز Eve و شرکت دیاgrid با به‌روزرسانی Dapr 1.18، ابزارهایی برای مدیریت حافظه و تأیید امنیتی عامل‌ها ارائه دادند. هم‌زمان، الگوهای جدیدی برای ادغام این عامل‌ها در فریم‌ورک‌های PHP مانند لاراول و سیمفونی ظهور کرده است.

۲ روز پیش۳ دقیقه خواندن

۱۰۷

مقایسه ابزارهای کیفیت کد: Audit Vibe Coding، SonarQube و Codacy برای کد تولیدشده با هوش مصنوعی

آموزش کاربردی

ابهامات معنایی در کدهای هوش مصنوعی؛ چرا ابزارهای سنتی تحلیل کد شکست می‌خورند؟

ابزارهای تحلیل ایستا (Static Analysis) در شناسایی خطاهای معنایی کدهای تولیدشده توسط هوش مصنوعی ناتوان هستند. مقایسه‌ای جدید نشان می‌دهد که برای جلوگیری از شکست سیستم‌ها در محیط عملیاتی، باید از روش‌های بازرسی تخصصی در کنار استانداردهای صنعتی استفاده کرد.

۲ روز پیش۴ دقیقه خواندن

۱۰۸

نصب MuJoCo و اجرای اولین شبیه‌سازی با یک دستور

آموزش کاربردی

چطور Drift فرآیند اعتبارسنجی شبیه‌سازهای رباتیک را ساده کرد؟

راه‌اندازی محیط‌های شبیه‌سازی رباتیک که معمولاً ساعت‌ها زمان می‌برد، اکنون توسط Drift خودکار شده است. این ابزار فرآیند نصب، پیکربندی و اعتبارسنجی MuJoCo را تنها با یک دستور متنی ساده انجام می‌دهد.

۲ روز پیش۴ دقیقه خواندن

۱۰۹

آموزش مدل LSTM با PyTorch Lightning: مرحله آموزش و پیش‌بینی‌های اولیه

آموزش کاربردی

PyTorch Lightning مراحل آموزش مدل‌های LSTM را خودکار کرد

راهنمای جدیدی نحوه پیاده‌سازی تابع training_step را برای مدل‌های LSTM آموزش می‌دهد تا محاسبات زیان و ثبت گزارش‌ها خودکار شود. این رویکرد فاصله میان معماری مدل و چرخه آموزش را کاهش می‌دهد.

۲ روز پیش۳ دقیقه خواندن

۱۱۰

تست ۱۰ مدل هوش مصنوعی در وظایف واقعی کدنویسی: کدام برنده شد؟

آموزش کاربردی

مدل Qwen3-Coder-30B در تعادل کیفیت و هزینه بر DeepSeek پیشی گرفت

تست‌های عملی روی ۱۰ مدل کدنویسی نشان می‌دهد که Qwen3-Coder-30B بهترین کیفیت را در برابر قیمت ارائه می‌دهد، در حالی که DeepSeek V4 Flash اقتصادی‌ترین گزینه است. این یافته‌ها نیاز به مدل‌های گران‌قیمت «استدلالی» را برای اکثر تکالیف روزانه برنامه‌نویسی زیر سؤال می‌برد.

۲ روز پیش۷ دقیقه خواندن

۱۱۱

نمودار مقایسه هزینه و دقت: فشرده‌سازی SuperCompress در مقابل مدل‌های استاندارد LLM

آموزش کاربردی

SuperCompress هزینه استنتاج مدل‌های زبانی را ۶۵٪ کاهش داد

ابزار متن‌باز SuperCompress با فیلتر کردن توکن‌های غیرضروری در سطح CPU، هزینه‌های محاسباتی و انتشار کربن را ۶۵٪ کاهش می‌دهد. این سازوکار بدون کاهش دقت پاسخ‌ها، فشار روی GPU را به‌شدت کم می‌کند.

۲ روز پیش۲ دقیقه خواندن

۱۱۲

آنچه در هفته اول کارآموزی هوش مصنوعی در PreserveMy.World درباره بازسازی سه‌بعدی آموختم

داستان‌ها و مصاحبه‌ها

۵ روش بازسازی سه‌بعدی برای دیجیتالی کردن میراث فرهنگی

پژوهگران PreserveMy.World در حال ارزیابی پنج تکنیک بازسازی سه‌بعدی برای ثبت دیجیتال مکان‌های تاریخی هستند. هدف این پروژه، ایجاد تعادلی میان کیفیت بصری و محدودیت‌های جمع‌آوری داده در محیط‌های واقعی است.

۲ روز پیش۲ دقیقه خواندن

۱۱۳

متن جایگزین: «نوارهای سیاه ویدیو را دوست ندارم. پس برای همیشه آن‌ها را حذف می‌کنیم.»

سرگرمی و خلاقیت

«بازسازی محتوای اطراف»؛ راهکار Ad Reframe برای نمایشگرهای هوشمند

ابزار جدید Ad Reframe با استفاده از هوش مصنوعی، تبلیغات عمودی ۹:۱۶ را به فرمت عریض ۱۶:۹ برای تلویزیون‌های هوشمند تبدیل می‌کند. این سیستم به‌جای استفاده از تاری یا نوارهای سیاه، محتوای بصری اطراف را به‌صورت طبیعی بازسازی می‌کند.

۲ روز پیش۲ دقیقه خواندن

۱۱۴

چگونه AIdeazz را در Perplexity نقل‌بول کردم: GEO برای سازندگان بدبین

آموزش کاربردی

«حذف ارجاعات اشتباه»؛ استراتژی AIdeazz برای بهینه‌سازی موتورهای زاینده

النا رِویچِوا با پیاده‌سازی مدل‌سازی داده‌ای در بهینه‌سازی موتورهای زاینده (GEO)، ارجاعات اشتباه هوش مصنوعی را حذف کرد. او با تغییر ساختار محتوا به قطعات فکتی مستقل و رندر سمت سرور، مالکیت اعتبار محتوای خود را از پلتفرم‌های واسط به دامنه شخصی بازگرداند.

۲ روز پیش۹ دقیقه خواندن

۱۱۵

پیش‌نمایش GPT-5.6 با سه مدل Sol، Terra و Luna: مدل‌های سطح‌بندی‌شده، استدلال جدید، دسترسی محدود

اخبار کوتاه روزانه

مدل Sol در بنچمارک Terminal-Bench 2.1 به امتیاز ۹۱.۹۱٪ رسید

اوپن‌ای‌آی از خانواده مدل‌های لایه‌بندی‌شده GPT-5.6 شامل Sol، Terra و Luna رونمایی کرد. مدل پرچم‌دار Sol با معرفی قابلیت‌های هماهنگی زیر-عاملی و استدلال حداکثری، استانداردهای جدیدی در کدنویسی و امنیت سایبری ایجاد کرده است.

۲ روز پیش۴ دقیقه خواندن

۱۱۶

پلتفرم Perplexity ابزار هوشمند حقوقی با قابلیت‌های چندمدلی رونمایی کرد

اخبار کوتاه روزانه

پراپلسیت با لایه‌ی عامل‌محور جدید، کارهای اداری وکلا را خودکار کرد

پراپلسیت سیستم Computer for Counsel را معرفی کرد؛ لایه‌ای هماهنگ‌ساز که وظایف اداری حقوقی را میان ۲۰ مدل پیشرو توزیع می‌کند. این ابزار به‌جای جایگزینی پایگاه‌های داده، بر اتوماسیون گردش‌کار و اعتبارسنجی منابع متمرکز است.

۲ روز پیش۵ دقیقه خواندن

۱۱۷

پرچم‌دار جدید هوش مصنوعی OpenAI در رقابت با رقیب Anthropic تحت مقررات دولتی ناپایدار راه‌اندازی شد

اخبار کوتاه روزانه

GPT-5.6 Sol با امتیاز ۹۱.۹٪ برتری OpenAI در کدنویسی عامل‌محور را تثبیت کرد

OpenAI مدل جدید GPT-5.6 Sol را برای شکست دادن Claude Mythos در حوزه‌های کدنویسی و امنیت سایبری عرضه کرد. دسترسی به این مدل به دلیل قوانین سخت‌گیرانه دولت آمریکا فعلاً محدود به شرکای منتخب است.

۲ روز پیش۳ دقیقه خواندن

۱۱۸

لوگوی OpenAI روی پس‌زمینه‌ای آبی با نماد اتصال شبکه‌ای

اخبار کوتاه روزانه

درون پروژه Jalapeño؛ تلاش OpenAI برای حذف وابستگی به انویدیا

اوپن‌ای‌آی با همکاری برادکام تراشه‌ای اختصاصی به نام Jalapeño طراحی کرده است تا وابستگی خود به انویدیا را کاهش دهد. این سخت‌افزار که در حال حاضر در محیط‌های آزمایشگاهی فعال است، ادعای عملکردی بسیار فراتر از استانداردهای فعلی بازار را دارد.

۲ روز پیش۳ دقیقه خواندن

۱۱۹

مدیرعامل اوبر هند به OpenAI پیوست؛ رهبری بزرگ‌ترین بازار خارج از آمریکا

اخبار کوتاه روزانه

«گسترش عملیات در هند»؛ هدف از انتصاب پرابهجیت سینگ در OpenAI

شرکت OpenAI برای گسترش عملیات در هند، پرابهجیت سینگ، رئیس سابق اوبر در جنوب آسیا را به عنوان اولین مدیرعامل این کشور منصوب کرد. این اقدام نشان‌دهنده فشار شدید OpenAI برای مقیاس‌بندی در بازاری با بیش از یک میلیارد کاربر اینترنت است.

۲ روز پیش۲ دقیقه خواندن

۱۲۰

مدل هوش مصنوعی ۱۹ روز بدون توقف روی یک وظیفه MirrorCode برنامه‌نویسی کرد؛ هزینه اجرا: ۲۶۰۰ دلار

تحلیل و بررسی تخصصی

Epoch AI: Claude Opus 4.7 موفق به حل ۵۶٪ تسک‌های MirrorCode شد

محک جدید Epoch AI نشان می‌دهد مدل‌های زبانی اکنون قادر به بازپیاده‌سازی کامل برنامه‌های پیچیده از صفر هستند. Claude Opus 4.7 با پیشتازی در این آزمون، مرزهای توانمندی عامل‌های هوش مصنوعی در مدیریت پروژه‌های بلندمدت را جابه‌جا کرد.

۲ روز پیش۳ دقیقه خواندن