پرش به محتوای اصلی

موضوع

عامل‌محور

Autonomous agents, tool use, planning, multi-step workflows

۱٬۴۹۵ مقاله منتشر شده

دسترسی ChatGPT به ۱۲ هزار مؤسسه مالی برای تحلیل لحظه‌ای هزینه‌ها

دسترسی ChatGPT به ۱۲ هزار مؤسسه مالی برای تحلیل لحظه‌ای هزینه‌ها

کاربران نسخه Pro در آمریکا اکنون می‌توانند حساب‌های بانکی خود را به ChatGPT متصل کنند. این سیستم با استفاده از مدل‌های استدلالی جدید، داشبوردهای مالی لحظه‌ای می‌سازد و توصیه‌های…

۲ دقیقه خواندن
چرا برندهٔ جنگ پرداخت‌های هوش مصنوعی، سریع‌ترین شبکه نخواهد بود؟

چرا برندهٔ جنگ پرداخت‌های هوش مصنوعی، سریع‌ترین شبکه نخواهد بود؟

گوگل و استرایپ در رقابت برای استانداردسازی پرداخت‌های عامل‌های هوش مصنوعی هستند. اما گلوگاه اصلی، سرعت API نیست، بلکه نبود سازوکارهای اعتماد و حسابرسی برای جلوگیری از هزینه‌های…

۲ دقیقه خواندن
چرا جداسازی اصول از رفتار در Soul Spec خطای عامل‌های هوش مصنوعی را حذف کرد؟
آموزش کاربردی

چرا جداسازی اصول از رفتار در Soul Spec خطای عامل‌های هوش مصنوعی را حذف کرد؟

چارچوب Soul Spec با تفکیک اصول، هویت و گردش کار در فایل‌های مجزا، مدیریت شخصیت‌های هوش مصنوعی را متحول می‌کند. این معماری بر اساس یافته‌های اخیر Anthropic است که ثابت می‌کند آموزش…

۲ دقیقه خواندن
گزارش Lingzu: ۷۳٪ از خروجی‌های عامل‌های هوش مصنوعی در ۴۸ ساعت اول جعلی بود

گزارش Lingzu: ۷۳٪ از خروجی‌های عامل‌های هوش مصنوعی در ۴۸ ساعت اول جعلی بود

دوازده عامل هوش مصنوعی در پروژه Lingzu توانستند سیستم حاکمیتی خود را بسازند، اما ۷۳٪ از داده‌های تولیدی آن‌ها توهم بود. این تجربه نشان می‌دهد استقلال کامل مدل‌ها بدون نظارت…

۲ دقیقه خواندن
۸۳ ثانیه تا استخدام: سازوکار حاکمیت خودکار در کلکتیو Lingzu

۸۳ ثانیه تا استخدام: سازوکار حاکمیت خودکار در کلکتیو Lingzu

یک گروه متشکل از ۱۲ عامل هوش مصنوعی به نام Lingzu، به‌طور خودکار و در ۸۳ ثانیه تصمیم به ایجاد یک عضو جدید برای مدیریت روابط خارجی گرفتند. این اتفاق نشان‌دهنده چرخه کامل حاکمیت…

۲ دقیقه خواندن
درون متد Refusal Clauses: وقتی Claude Code تصمیم می‌گیرد ایده‌ی شما را بکشد
آموزش کاربردی

درون متد Refusal Clauses: وقتی Claude Code تصمیم می‌گیرد ایده‌ی شما را بکشد

یک الگوی جدید در مهندسی پرامپت برای عامل‌های Claude Code، با استفاده از «بندهای رد» و «معیارهای توقف»، جلوی تایید کورکورانه‌ی ایده‌های تجاری بد را می‌گیرد. این روش توسعه‌دهندگان…

۲ دقیقه خواندن
درون معماری Osaurus: تبدیل مک به سروری برای مدیریت مدل‌های محلی و ابری

درون معماری Osaurus: تبدیل مک به سروری برای مدیریت مدل‌های محلی و ابری

پروژه متن‌باز Osaurus به کاربران مک اجازه می‌دهد تا مدل‌های محلی و ابری را در یک محیط امن و ایزوله مدیریت کنند. این ابزار با انتقال کنترل داده‌ها از مراکز داده به سخت‌افزار شخصی،…

۲ دقیقه خواندن
از صورت‌حساب ماهانه تا هزینه هر گفتگو؛ سازوکار PostHog برای ردیابی توکن‌ها
آموزش کاربردی

از صورت‌حساب ماهانه تا هزینه هر گفتگو؛ سازوکار PostHog برای ردیابی توکن‌ها

پلتفرم PostHog ابزاری برای تحلیل هزینه‌های مدل‌های زبانی معرفی کرد تا «جعبه سیاه» مخارج هوش مصنوعی را بشکند. توسعه‌دهندگان اکنون می‌توانند به‌جای تماشای صورت‌حساب کلی، هزینه دقیق…

۲ دقیقه خواندن
گزارش Metabase: نرخ کشف باگ‌های امنیتی با هوش مصنوعی ۱۰ برابر شد

گزارش Metabase: نرخ کشف باگ‌های امنیتی با هوش مصنوعی ۱۰ برابر شد

عامل‌های کدنویس مبتنی بر هوش مصنوعی در حال شکار گسترده‌ی حفره‌های امنیتی در مخازن متن‌باز هستند. این روند باعث شده برخی شرکت‌ها برای فرار از چرخه‌ی بی‌پایان اصلاح باگ، مدل‌های خود…

۲ دقیقه خواندن
بحران «سلاپ» علمی: وقتی تولید مقالات پژوهشی به ۲۵ دقیقه کاهش می‌یابد

بحران «سلاپ» علمی: وقتی تولید مقالات پژوهشی به ۲۵ دقیقه کاهش می‌یابد

هوش مصنوعی زاینده مقالاتی تولید می‌کند که بیش از حد صیقل‌خورده‌اند و شناسایی آن‌ها دشوار است. این حجم از «سلاپ علمی» سیستم داوری داوطلبانه را به نقطه شکست رسانده است.

۲ دقیقه خواندن