AnomalyClaw: افزایش ۷.۹۳ واحدی AUROC در تشخیص ناهنجاری‌های بصری با رویکرد ردّیه

باید بدانید که تشخیص ناهنجاری‌های بصری دیگر یک بازی حدس‌زدن نیست. تصور کنید سیستمی داشته باشید که به جای پذیرش اولین پاسخ، فعالانه سعی کند آن را رد کند تا به حقیقت برسد.

تشخیص ناهنجاری‌های بصری (Visual Anomaly Detection - VAD) در بازرسی‌های صنعتی و تصویربرداری پزشکی حیاتی است، اما مدل‌ها معمولاً در انتقال دانش بین دامنه‌های مختلف شکست می‌خورند. همان‌طور که در تحلیل‌های پیشین ما درباره‌ی محدودیت‌های مدل‌های چندوجهی در درک جزئیات اشاره کردیم، این مدل‌ها اغلب به جای تکیه بر شواهد دقیق از نمونه‌های مرجع، به دانش پیشین خود اتکا می‌کنند و نتایجی متناقض ارائه می‌دهند.

طبق گزارش ۱۱ مه ۲۰۲۶ در arxiv.org، ابزار AnomalyClaw از یک کتابخانه‌ی شامل ۱۳ ابزار برای تأیید بصری، تجزیه مراجع و کاوش‌های تخصصی استفاده می‌کند. بر اساس مستندات این پژوهش، در بنچمارک CrossDomainVAD-12، این عامل (Agent) بهبودهای ثابتی در معیار macro-AUROC نسبت به استنتاج (Inference) مستقیم ایجاد کرده است:

Seed2.0-lite: افزایش ۷.۹۳ واحدی
GPT-5.5: افزایش ۶.۲۳ واحدی
Qwen3.5-VL-27B: افزایش ۳.۵۲ واحدی

این سیستم همچنین شامل یک افزونه‌ی تکامل خودکار است که از اختلافات داخلی برای ساخت یک دفترچه قوانین آنلاین استفاده می‌کند. این سازوکار بدون نیاز به برچسب‌های مرجع، باعث افزایش ۲.۰۹ واحدی دقت در مدل Qwen3.5-VL-27B شده است.

این چرخش، VAD را از تطبیق ساده‌ی الگوها به سوی تأیید فعالانه می‌برد. با مبنی‌سازی (Grounding) قضاوت‌ها در یک حلقه‌ی ردّیه، این عامل توهمات (Hallucinations) و تمایل مدل‌های چندوجهی (Vision-Language Models - VLMs) به نادیده گرفتن نمونه‌های مرجع را کاهش می‌دهد. برای جامعه‌ی فنی، این موضوع ثابت می‌کند که استدلال عامل‌محور (Agentic) — و نه صرفاً تجمیع خروجی ابزارها — کلید دستیابی به دقت در ادراک بین‌دامنه‌ای است.

گام بعدی شما

رصد کاربردهای این منطق ردّیه در تشخیص‌های حساس پزشکی که هزینه مثبت کاذب در آن‌ها بسیار بالاست.
آزمایش حلقه‌های ردّیه در سایر وظایف پیچیده‌ی مدل‌های چندوجهی برای کاهش نرخ خطا.
بررسی چارچوب‌های عامل‌محور که بدون نیاز به آموزش مجدد (Training-free)، عملکرد مدل‌های بنیادی را ارتقا می‌دهند.

اما این رویکرد ردّیه تنها بخشی از پازل است؛ برای درک چگونگی ادغام این منطق در سخت‌افزارهای لبه، تحلیل ما درباره‌ی رایانش لبه را بخوانید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

Seed2.0-lite: افزایش ۷.۹۳ واحدی
GPT-5.5: افزایش ۶.۲۳ واحدی
Qwen3.5-VL-27B: افزایش ۳.۵۲ واحدی

گام بعدی شما

رصد کاربردهای این منطق ردّیه در تشخیص‌های حساس پزشکی که هزینه مثبت کاذب در آن‌ها بسیار بالاست.
آزمایش حلقه‌های ردّیه در سایر وظایف پیچیده‌ی مدل‌های چندوجهی برای کاهش نرخ خطا.
بررسی چارچوب‌های عامل‌محور که بدون نیاز به آموزش مجدد (Training-free)، عملکرد مدل‌های بنیادی را ارتقا می‌دهند.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

AnomalyClaw: افزایش ۷.۹۳ واحدی AUROC در تشخیص ناهنجاری‌های بصری با رویکرد ردّیه

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

AnomalyClaw: افزایش ۷.۹۳ واحدی AUROC در تشخیص ناهنجاری‌های بصری با رویکرد ردّیه

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

AnomalyClaw: افزایش ۷.۹۳ واحدی AUROC در تشخیص ناهنجاری‌های بصری با رویکرد ردّیه

گام بعدی شما

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

AnomalyClaw: افزایش ۷.۹۳ واحدی AUROC در تشخیص ناهنجاری‌های بصری با رویکرد ردّیه

گام بعدی شما

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران