موضوع

عامل‌محور

Autonomous agents, tool use, planning, multi-step workflows

۱٬۴۹۵ مقاله منتشر شده

دسترسی ChatGPT به ۱۲ هزار مؤسسه مالی برای تحلیل لحظه‌ای هزینه‌ها

کاربران نسخه Pro در آمریکا اکنون می‌توانند حساب‌های بانکی خود را به ChatGPT متصل کنند. این سیستم با استفاده از مدل‌های استدلالی جدید، داشبوردهای مالی لحظه‌ای می‌سازد و توصیه‌های…

۲ دقیقه خواندن

اخبار کوتاه روزانهماه گذشته

چرا برندهٔ جنگ پرداخت‌های هوش مصنوعی، سریع‌ترین شبکه نخواهد بود؟

گوگل و استرایپ در رقابت برای استانداردسازی پرداخت‌های عامل‌های هوش مصنوعی هستند. اما گلوگاه اصلی، سرعت API نیست، بلکه نبود سازوکارهای اعتماد و حسابرسی برای جلوگیری از هزینه‌های…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

چرا جداسازی اصول از رفتار در Soul Spec خطای عامل‌های هوش مصنوعی را حذف کرد؟

چارچوب Soul Spec با تفکیک اصول، هویت و گردش کار در فایل‌های مجزا، مدیریت شخصیت‌های هوش مصنوعی را متحول می‌کند. این معماری بر اساس یافته‌های اخیر Anthropic است که ثابت می‌کند آموزش…

۲ دقیقه خواندن

داستان‌ها و مصاحبه‌هاماه گذشته

گزارش Lingzu: ۷۳٪ از خروجی‌های عامل‌های هوش مصنوعی در ۴۸ ساعت اول جعلی بود

دوازده عامل هوش مصنوعی در پروژه Lingzu توانستند سیستم حاکمیتی خود را بسازند، اما ۷۳٪ از داده‌های تولیدی آن‌ها توهم بود. این تجربه نشان می‌دهد استقلال کامل مدل‌ها بدون نظارت…

۲ دقیقه خواندن

داستان‌ها و مصاحبه‌هاماه گذشته

۸۳ ثانیه تا استخدام: سازوکار حاکمیت خودکار در کلکتیو Lingzu

یک گروه متشکل از ۱۲ عامل هوش مصنوعی به نام Lingzu، به‌طور خودکار و در ۸۳ ثانیه تصمیم به ایجاد یک عضو جدید برای مدیریت روابط خارجی گرفتند. این اتفاق نشان‌دهنده چرخه کامل حاکمیت…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

چرا IdPهای سازمانی در اتصال به سرورهای MCP شکست می‌خورند؟

یک پروکسی جدید به نام mcp-auth-adapter امکان اتصال سرورهای MCP به سرویس‌های احراز هویت سازمانی مثل Okta را فراهم می‌کند. این ابزار با ساده‌سازی فرآیند ثبت‌نام و فیلتر کردن…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

گزارش ofox.ai: فاصله کدنویسی Qwen 3.6 و Claude Opus به ۳.۶٪ رسید

مدل محلی Qwen 3.6 27B اکنون در بنچمارک SWE-bench Verified تنها ۳.۶ درصد با Claude Opus 4.6 فاصله دارد. برای توسعه‌دهندگانی که هزینه‌های بالای API دارند، خرید یک GPU RTX 4090 در…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

درون متد Refusal Clauses: وقتی Claude Code تصمیم می‌گیرد ایده‌ی شما را بکشد

یک الگوی جدید در مهندسی پرامپت برای عامل‌های Claude Code، با استفاده از «بندهای رد» و «معیارهای توقف»، جلوی تایید کورکورانه‌ی ایده‌های تجاری بد را می‌گیرد. این روش توسعه‌دهندگان…

۲ دقیقه خواندن

اخبار کوتاه روزانهماه گذشته

درون معماری Osaurus: تبدیل مک به سروری برای مدیریت مدل‌های محلی و ابری

پروژه متن‌باز Osaurus به کاربران مک اجازه می‌دهد تا مدل‌های محلی و ابری را در یک محیط امن و ایزوله مدیریت کنند. این ابزار با انتقال کنترل داده‌ها از مراکز داده به سخت‌افزار شخصی،…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

از صورت‌حساب ماهانه تا هزینه هر گفتگو؛ سازوکار PostHog برای ردیابی توکن‌ها

پلتفرم PostHog ابزاری برای تحلیل هزینه‌های مدل‌های زبانی معرفی کرد تا «جعبه سیاه» مخارج هوش مصنوعی را بشکند. توسعه‌دهندگان اکنون می‌توانند به‌جای تماشای صورت‌حساب کلی، هزینه دقیق…

۲ دقیقه خواندن

اخبار کوتاه روزانهماه گذشته

گزارش Metabase: نرخ کشف باگ‌های امنیتی با هوش مصنوعی ۱۰ برابر شد

عامل‌های کدنویس مبتنی بر هوش مصنوعی در حال شکار گسترده‌ی حفره‌های امنیتی در مخازن متن‌باز هستند. این روند باعث شده برخی شرکت‌ها برای فرار از چرخه‌ی بی‌پایان اصلاح باگ، مدل‌های خود…

۲ دقیقه خواندن

اخبار کوتاه روزانهماه گذشته

بحران «سلاپ» علمی: وقتی تولید مقالات پژوهشی به ۲۵ دقیقه کاهش می‌یابد

هوش مصنوعی زاینده مقالاتی تولید می‌کند که بیش از حد صیقل‌خورده‌اند و شناسایی آن‌ها دشوار است. این حجم از «سلاپ علمی» سیستم داوری داوطلبانه را به نقطه شکست رسانده است.

۲ دقیقه خواندن