اگر تصور میکنید عاملهای هوشمند میتوانند بدون نظارت، کشفیات علمی را پیش ببرند، باید با خطر «تفسیر بیش از حد» (Overinterpretation) آشنا شوید؛ وضعیتی که در آن مدلها الگوهای تصادفی را به عنوان دستاوردهای علمی معرفی میکنند.
این شکاف در کالیبراسیون شواهد باعث میشود مدلها ادعاهایی را مطرح کنند که دادههای زیربنایی آنها را پشتیبانی نمیکند. در پوشش پیشین ما از توهمات مدلهای زبانی در حوزههای تخصصی، دیدیم که مدلها تمایل دارند برای خوشطبعانه به نظر رسیدن، نتایج را بیش از حد تفسیر کنند. برای حل این مشکل، چارچوب StatefulDiscovery وارد عمل میشود تا تعیین کند چه چیزی باید کاوش شود و چه ادعایی بر اساس شواهد قابل پذیرش است.
به نقل از گزارش منتشرشده در arxiv.org در تاریخ ۱۱ ژوئن ۲۰۲۶، این سیستم با بیرونیسازی وضعیت تحقیق (Investigation State)، مسیر کاوش را مدیریت میکند تا عامل از پذیرفتن نویز به جای سیگنال اجتناب کند. طبق مستندات این پژوهش، StatefulDiscovery سه کارکرد اصلی را هماهنگ میکند:
- انتخاب مرز (Frontier Selection): مدیریت محدودهی کاوش
- کسب شواهد (Evidence Acquisition): جمعآوری دادههای پشتیبان
- داوری ادعا (Claim Adjudication): تأیید انطباق دامنه شواهد با ادعای مطرحشده
این رویکرد در ۴۰ تکلیف اکتشافی با دادههای واقعی ارزیابی شد و در مقایسه با مدلهای پایه، حجم بیشتری از ادعاهای «باارزش و پشتیبانیشده» تولید کرد.
این تحول، پارادایم هوش مصنوعی در علوم را از یک حلقهی سادهی «پرامپت و تحلیل» (Prompt-and-Analyze) به یک رویکرد ماشین حالت (State-Machine) تغییر میدهد. با تبدیل «وضعیت اکتشاف» به یک شیء درجهیک، مدل دیگر نمیتواند بدون پشتوانه به نتایج عجله کند. برای پژوهشگران، این معنای آن است که پیشرفت بعدی در علومِ AI-Driven، کمتر به مقیاس مدلها و بیشتر به «دفترداری دقیق شواهد» وابسته است.
گام بعدی شما
- بررسی کامل تحلیلهای تخریبی (Ablation Study) و نتایج ۴۰ سناریوی ارزیابی در وبسایت arxiv.org.
- رصد قابلیت ادغام این رویکرد وضعیتمحور در سختافزارهای آزمایشگاهی خودمختار برای سنتز شیمیایی و بیولوژیکی.
- ارزیابی جایگزینی زنجیرههای پرامپت سنتی با ماشینهای حالت در گردشهای کاری پژوهشی.
اما تأثیر این متدولوژی بر کاهش هزینههای محاسباتی در استنتاجهای پیچیده، مبحثی است که در تحلیلهای آینده به آن خواهیم پرداخت.



گفتگو