پرش به محتوای اصلی

موضوع

استدلال

Chain-of-thought, reasoning models (o-series, R-series), test-time compute

۶۱۳ مقاله منتشر شده

کاهش نرخ توهم در تشخیص‌های پزشکی به ۳.۳٪ با معماری عامل‌محور Baichuan-M4

کاهش نرخ توهم در تشخیص‌های پزشکی به ۳.۳٪ با معماری عامل‌محور Baichuan-M4

سیستم Baichuan-M4 رویکرد هوش مصنوعی در پزشکی را از پاسخ‌های تک‌مرحله‌ای به «مراقبت مستمر» تغییر می‌دهد. این سامانه با بهره‌گیری از معماری عامل‌محور (Agentic) و آموزش تخصصی RL، نرخ…

۱ دقیقه خواندن
RTL-BenchLS: نرخ موفقیت مدل‌های زبانی در رفع خطاهای سخت‌افزاری تنها ۱۲٪ است

RTL-BenchLS: نرخ موفقیت مدل‌های زبانی در رفع خطاهای سخت‌افزاری تنها ۱۲٪ است

پژوهشگران با معرفی بنچمارک RTL-BenchLS نشان دادند که حتی پیشرفته‌ترین مدل‌های زبانی در طراحی سخت‌افزارهای پیچیده شکست می‌خورند. این نتایج حاکی از آن است که توانایی مدل‌ها در…

۲ دقیقه خواندن
DiScO: ارتقای استدلال ریاضی در مدل‌های زبانی از طریق متنوع‌سازی طرحواره‌های تفکر

DiScO: ارتقای استدلال ریاضی در مدل‌های زبانی از طریق متنوع‌سازی طرحواره‌های تفکر

چارچوب جدیدی به نام DiScO با متنوع کردن «طرحواره‌های تفکر»، توانایی مدل‌های استدلالی در حل مسائل پیچیده ریاضی را افزایش داده است. این روش با استفاده از یادگیری تقویت‌شده، مدل را…

۱ دقیقه خواندن
OrderPlace: کاهش ۳۴ درصدی طول سیم‌کشی تراشه با توالی‌های بهینه شده توسط LLM

OrderPlace: کاهش ۳۴ درصدی طول سیم‌کشی تراشه با توالی‌های بهینه شده توسط LLM

چارچوب جدیدی به نام OrderPlace با استفاده از تکامل مدل‌های زبانی بزرگ، توالی قرارگیری ماکروها در طراحی تراشه را بهینه می‌کند. این رویکرد با جایگزینی قوانین ایستا با سیاست‌های…

۱ دقیقه خواندن
ربات شیائومی MiMo با شعار اکتشاف و عشق

شیائومی: دستیابی به سرعت ۱۰۰۰ توکن در ثانیه برای مدل ۱ تریلیون پارامتری

شیائومی مدل MiMo-V2.5-Pro-UltraSpeed را معرفی کرد که روی GPUهای معمولی به سرعت ۱۰۰۰ توکن در ثانیه می‌رسد. این پیشرفت با ترکیب کوانتایزاسیون FP4 و رمزگشایی موازی-گمانه، گلوگاه‌های…

۷ دقیقه خواندن
هوش مصنوعی عاملی و تبدیل توکن‌ها به معیار تجاری

مدل پرداخت توکن‌محور: چرا GitHub Copilot اشتراک‌های ثابت را کنار می‌گذارد؟

تأمین‌کنندگان هوش مصنوعی برای پوشش هزینه‌های سنگین محاسباتیِ عامل‌های خودکار، از مدل اشتراک ماهانه به «پرداخت به میزان استفاده» تغییر مسیر می‌دهند. این روند، «اقتصاد توکن» را…

۱۰ دقیقه خواندن
رابط Claude Code در حال اجرای دستورات تست نفوذ
آموزش کاربردی

از تست دستی تا اتوماسیون: Claude Code چگونه حفره‌های IDOR را ردیابی می‌کند؟

متخصصان امنیت حالا می‌توانند فرآیندهای تکراری تست نفوذ مثل بررسی IDOR را با Claude Code خودکار کنند. این ابزار با اتصال به سرورهای MCP، تست‌های «جعبه‌سیاه» را به یک گردش‌کار دقیق…

۸ دقیقه خواندن
جامعه متن‌باز از اوپن‌انو برای یادگیری تقویتی عامل‌محور حمایت می‌کند
آموزش کاربردی

OpenEnv چگونه فاصلهٔ کارایی بین عامل‌های متن‌باز و مدل‌های تجاری را پر می‌کند؟

هاگینگ فیس و کنسرسیومی از آزمایشگاه‌های هوش مصنوعی، OpenEnv را به یک پروتکل جامعه‌محور برای استانداردسازی محیط‌های اجرای عامل‌ها تبدیل کردند. هدف این پروژه حذف مزیت انحصاری…

۴ دقیقه خواندن
«دروازه قطعی»: روشی برای حذف توهمات ریاضی هوش مصنوعی در پایش بازار
آموزش کاربردی

«دروازه قطعی»: روشی برای حذف توهمات ریاضی هوش مصنوعی در پایش بازار

یک خط لوله خودکار با ترکیب n8n و GPT-4 به سرمایه‌گذاران اجازه می‌دهد بدون بررسی‌های دستی یا هزینه‌های بالای API، سبد دارایی خود را رصد کنند. این سیستم با استفاده از کدهای قطعی،…

۴ دقیقه خواندن
چرا بدون «بایاس»، مدل‌های هوش مصنوعی در ساده‌ترین تصمیمات شکست می‌خورند؟
آموزش کاربردی

چرا بدون «بایاس»، مدل‌های هوش مصنوعی در ساده‌ترین تصمیمات شکست می‌خورند؟

پرسپترون کوچک‌ترین واحد سازنده تمام شبکه‌های عصبی مدرن است. این راهنما توضیح می‌دهد که چگونه تنظیم وزن‌ها و بایاس به یک مدل تک‌نورونی اجازه می‌دهد مرزهای تصمیم‌گیری را از صفر یاد…

۷ دقیقه خواندن
چرا اکتشاف واقعی در هوش مصنوعی نیازمند تغییر زبان مفهومی است؟

چرا اکتشاف واقعی در هوش مصنوعی نیازمند تغییر زبان مفهومی است؟

پژوهشگران MIT چارچوبی ریاضیاتی برای تکامل زبان مفهومی در سیستم‌های هوش مصنوعی پیشنهاد کرده‌اند. این رویکرد، نوآوری علمی را نه بر اساس نتایج بنچمارک، بلکه بر اساس توانایی مدل در…

۲ دقیقه خواندن
آموزش کاربردی

چگونه یادگیری تقویت‌شده‌ی علی بقای ماهی‌ها را به ۹۴٪ رساند؟

استقرار یک سیستم یادگیری تقویت‌شده‌ی علی (CRL) در مزارع ماهی تایلند، نرخ بقای ماهی‌ها را به ۹۴٪ رساند و هزینه‌های انرژی را ۲۷٪ کاهش داد. این فناوری برخلاف مدل‌های سنتی، به جای…

۹ دقیقه خواندن