دادههای علمی شما احتمالاً بزرگترین مانع در مسیر اکتشافات هوش مصنوعی هستند. اگر هنوز برای تایید کیفیت دادهها به بازبینی دستی تکیه میکنید، در واقع دارید سرعت پیشرفت خود را میکُشید.
در ۳۰ آوریل ۲۰۲۶، طبق یک مقاله پژوهشی که در arxiv.org منتشر شد، سیستمی به نام SciHorizon-DataEVA معرفی شد. این سیستم عاملمحور (agentic) برای حل بحران مقیاسپذیری در حوزه «هوش مصنوعی برای علم» (AI4Science) طراحی شده است. به نقل از این گزارش، سیستم مذکور بازبینیهای دستی و خستهکننده را با یک مکانیسم ارزیابی خودکار و ابزارمحور جایگزین میکند.
قلب تپنده این فناوری، چارچوب Sci-TQA2 است که آمادگی دادهها را در چهار بُعد قابل اندازهگیری میسنجد:
- اعتمادپذیری حاکمیتی (Governance Trustworthiness)
- کیفیت داده (Data Quality)
- سازگاری با هوش مصنوعی (AI Compatibility)
- انطباقپذیری علمی (Scientific Adaptability)
برای اجرای این بررسیها، پژوهشگران Sci-TQA2-Eval را توسعه دادند؛ یک رویکرد سلسلهمراتبی که از چندین عامل (agent) استفاده میکند. این سیستم از یک گردشکار چرخشی و هدایتشده بهره میبرد که پروفایلبندی سبک مجموعهدادهها را با برنامهریزی تقویتشده با دانش ترکیب میکند. بر اساس مستندات این پژوهش، این عاملها میتوانند با استفاده از سیگنالهای موجود در مقالات و محدودیتهای دامنه، مشخصات ارزیابی را بهصورت پویا بسازند و خطاها را در حین مسیر اصلاح کنند.
همانطور که در تحلیلهای پیشین ما دربارهی چالشهای مبنیسازی (grounding) در مدلهای زبانی اشاره کردیم، کیفیت ورودیها تعیینکننده نهایی خروجی است. در اینجا نیز شاهد چرخش راهبردی هستیم؛ جایی که هوش مصنوعی زاینده (Generative AI) دیگر فقط داده را پردازش نمیکند، بلکه فعالانه ورودیهای خود را بازرسی میکند.
اگرچه نویسندگان مقاله بر اثربخشی سیستم در دامنههای مختلف تأکید کردهاند، اما در چکیده مقاله، معیارهای دقیق درصدی برای دقت آن ذکر نشده است.
اما سوال بزرگتر این است: آیا این عاملها میتوانند شکافهای دادهای را که شناسایی میکنند، خودشان ترمیم کنند؟ پاسخ این پرسش در گزارش بعدی ما دربارهی خودترمیمگری دادهها نهفته است.
گام بعدی شما
- مقاله کامل SciHorizon-DataEVA را در arxiv برای درک جزئیات معماری مطالعه کنید.
- مجموعهدادههای فعلی خود را بر اساس چهار بُعد Sci-TQA2 بازبینی کنید.
- بر روی پیادهسازی گردشکارهای عاملمحور برای مدیریت دادههای تخصصی تمرکز کنید.




گفتگو