حلقه ارزیابی: قطعه گم‌شده‌ای در معماری AI که مانع از کشف علم می‌شود

اگر امروز برای کشف پیشرفت‌های جدید در پزشکی یا فیزیک به مدل‌های زبانی تکیه کرده‌اید، احتمالاً در تعقیب یک سراب هستید. در ۱ ژوئن ۲۰۲۶، ریچارد ساتون، برنده جایزه تورینگ، استدلال کرد که هوش مصنوعی زاینده (Generative AI) معمولی اساساً ناتوان از اکتشافات علمی واقعی است؛ چرا که نمی‌تواند نتایج خود را ارزیابی کند.

این نقد درست زمانی مطرح شد که صنعت روی مدل‌های بزرگتر با داده‌های حجیم‌تر شرط‌بندی کرده است. ساتون که پدر یادگیری تقویت‌شده شناخته می‌شود، باور دارد تمرکز بر تقلید، مکانیسم واقعی دانش را نادیده می‌گیرد. او معتقد است مدل زبانی بزرگ (LLM) — مثل کتابخانه‌داری که میلیارد‌ها صفحه را خوانده و حالا با همان لحن کتاب‌ها جواب می‌دهد — فقط یک دستیار است و نه یک دانشمند مستقل.

همان‌طور که در تحلیل‌های پیشین ما درباره‌ی مدل‌های استدلالی اشاره کردیم، تفاوت میان «تولید متن» و «رسیدن به حقیقت» در ساختار بازخورد است. طبق گزارش the-decoder.com، ساتون کشف واقعی را در سه مرحله تعریف می‌کند:

تنوع (Variation): تولید گزینه‌های مختلف.
ارزیابی (Evaluation): سنجش این گزینه‌ها بر اساس یک هدف مشخص.
حفظ گزینشی (Selective Retention): نگه داشتن تنها روش‌هایی که واقعاً اثر می‌کنند.

مدل‌های متنی و تصویری فعلی فقط مرحله اول را انجام می‌دهند. بدون راهی برای تشخیص اینکه آیا یک ایده «خوب» است یا نه، نوآوری‌ها صرفاً تصادفی باقی می‌مانند. ساتون به AlphaGo (به‌خصوص حرکت مشهور ۳۷)، AlphaFold، AlphaProof و Claude Code به عنوان استثنا اشاره می‌کند. این سیستم‌ها موفق‌اند چون «حلقه‌های ارزیابی» دارند؛ مثلاً یک رکورد برد/باخت در بازی یا یک تست واحد (Unit Test) در کدنویسی که تولید را به جست‌وجوی حقیقت تبدیل می‌کند.

برای مدیران کسب‌وکار، این یعنی ارزش فعلی AI در بهره‌وری است، نه اختراع. یک مدل زبانی می‌تواند پژوهش‌ها را سریع‌تر خلاصه کند، اما نمی‌تواند به‌طور مستقل یک فرضیه علمی را تغییر دهد. مزیت رقابتی از کسانی که «داده‌های بیشتر» دارند، به سمتی می‌رود که سیستم‌های «یادگیری مستمر» دقیق‌تری بسازند.

گام بعدی شما

به جای تکیه بر خروجی خام LLM، برای پروژه‌های فنی از سیستم‌های بازخورد خودکار (مثل تست‌های نرم‌افزاری) استفاده کنید.
بر روی معماری‌های عامل‌محور (Agentic) تمرکز کنید که قابلیت تعامل با محیط و اصلاح خطا دارند.
رشدهای معماری Oak را دنبال کنید که اولویت را به مدل‌های ذهنی درونی می‌دهد، نه آموزش ایستا.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است؛ به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

تنوع (Variation): تولید گزینه‌های مختلف.
ارزیابی (Evaluation): سنجش این گزینه‌ها بر اساس یک هدف مشخص.
حفظ گزینشی (Selective Retention): نگه داشتن تنها روش‌هایی که واقعاً اثر می‌کنند.

گام بعدی شما

به جای تکیه بر خروجی خام LLM، برای پروژه‌های فنی از سیستم‌های بازخورد خودکار (مثل تست‌های نرم‌افزاری) استفاده کنید.
بر روی معماری‌های عامل‌محور (Agentic) تمرکز کنید که قابلیت تعامل با محیط و اصلاح خطا دارند.
رشدهای معماری Oak را دنبال کنید که اولویت را به مدل‌های ذهنی درونی می‌دهد، نه آموزش ایستا.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است؛ به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

حلقه ارزیابی: قطعه گم‌شده‌ای در معماری AI که مانع از کشف علم می‌شود

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

حلقه ارزیابی: قطعه گم‌شده‌ای در معماری AI که مانع از کشف علم می‌شود

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

حلقه ارزیابی: قطعه گم‌شده‌ای در معماری AI که مانع از کشف علم می‌شود

گام بعدی شما

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

حلقه ارزیابی: قطعه گم‌شده‌ای در معماری AI که مانع از کشف علم می‌شود

گام بعدی شما

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران