مطالعه استنفورد: هوش مصنوعی در ۷۵٪ تست‌های استدلال حقوقی از اساتید برتر بود

شکاف میان قضاوت حرفه‌ای انسان و خروجی ماشین در حوزه‌های حساس دانشگاهی، بسیار کمتر از آن چیزی است که پیش‌تر تصور می‌شد. اگر تصور می‌کردید استدلال‌های پیچیده حقوقی آخرین سنگر دفاع انسان در برابر هوش مصنوعی زاینده (Generative AI) است، نتایج جدید از استنفورد این باور را متزلزل می‌کند.

طبق گزارش منتشر شده در ۲ ژوئن ۲۰۲۶ از وب‌سایت law.stanford.edu، مدل‌های زبانی در ارزیابی‌های کور (Blind Evaluations) مربوط به پرسش‌های پیچیده حقوق قراردادها، در ۷۵٪ موارد عملکرد بهتری نسبت به مدرسان انسانی داشتند. همان‌طور که در تحلیل‌های پیشین ما درباره‌ی مدل‌های استدلالی (Reasoning Models) اشاره کردیم، گذار از بازیابی ساده اطلاعات به تحلیل ساختاری، نقطه عطف تکامل LLMها است. در حالی که بنچمارک‌های قدیمی بر پاسخ‌های صفر و یکی متمرکز بودند، آموزش حقوق نیازمند پیمایش در ابهام‌ها و ترکیب استدلال‌های متضاد است؛ مهارتی که تا پیش از این، قلمرو انحصاری خبرگان انسانی счита می‌شد.

این پژوهش که توسط پروفسور جولیان نیارکو (Julian Nyarko) و تیم liftlab هدایت شد، شامل بررسی ۱۶ استاد حقوق بود که نزدیک به ۳۰۰۰ مقایسه ناشناس را انجام دادند.

هوش مصنوعی در مطالعه دانشکده حقوق استنفورد از اساتید حقوق پیشی گرفت

بر اساس مستندات این مطالعه، یافته‌های کلیدی عبارتند از:

پیروزی هوش مصنوعی در ۷۵٪ از رقابت‌های رودررو با پاسخ‌های نوشته شده توسط اساتید.
شناسایی پاسخ‌های هوش مصنوعی به عنوان «مضر از نظر آموزشی» تنها در ۳.۵٪ موارد (در مقابل ۱۲٪ برای پاسخ‌های انسانی).
توانایی مدل‌هایی نظیر Google NotebookLM در رعایت استانداردهای حرفه‌ای مورد استفاده توسط وکلا برای ارزیابی یکدیگر.

این تغییر عملکرد، این فرض بنیادین را که هوش مصنوعی محدود به بازیابی حقایق (Factual Recall) است، تغییر می‌دهد. با اثبات ظرفیت استدلال ظریف، اکنون می‌توان استدلال کرد که آموزش‌های هوشمند می‌توانند پشتیبانی باکیفیتی را به‌صورت آن‌دمان (On-demand) فراهم کنند که مکمل تدریس در کلاس است، نه فقط جایگزین آن. در واقع، گلوگاه پذیرش این فناوری دیگر کیفیت خروجی نیست، بلکه طراحی چارچوب‌های اجرایی مسئولانه است.

هوش مصنوعی در مطالعه دانشکده حقوق استنفورد از اساتید حقوق پیشی گرفت

گام بعدی شما

بررسی قابلیت‌های NotebookLM در تحلیل اسناد حقوقی برای شناسایی نقاط ضعف در استدلال‌ها.
رصد اولین استقرار گسترده مدرسان هوش مصنوعی در برنامه‌های درسی تایید شده حقوقی.
تحلیل تغییرات در متدهای ارزیابی دانشجویان حقوق با ورود ابزارهای استدلال پیشرفته.

اما تأثیر این تحول بر بازار اشتغال وکالت و حقوق‌دانان حتی تکان‌دهنده‌تر است — به تحلیل ما درباره‌ی جایگزینی مشاغل دانش‌بنیان مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

هوش مصنوعی در مطالعه دانشکده حقوق استنفورد از اساتید حقوق پیشی گرفت

بر اساس مستندات این مطالعه، یافته‌های کلیدی عبارتند از:

پیروزی هوش مصنوعی در ۷۵٪ از رقابت‌های رودررو با پاسخ‌های نوشته شده توسط اساتید.
شناسایی پاسخ‌های هوش مصنوعی به عنوان «مضر از نظر آموزشی» تنها در ۳.۵٪ موارد (در مقابل ۱۲٪ برای پاسخ‌های انسانی).
توانایی مدل‌هایی نظیر Google NotebookLM در رعایت استانداردهای حرفه‌ای مورد استفاده توسط وکلا برای ارزیابی یکدیگر.

هوش مصنوعی در مطالعه دانشکده حقوق استنفورد از اساتید حقوق پیشی گرفت

گام بعدی شما

بررسی قابلیت‌های NotebookLM در تحلیل اسناد حقوقی برای شناسایی نقاط ضعف در استدلال‌ها.
رصد اولین استقرار گسترده مدرسان هوش مصنوعی در برنامه‌های درسی تایید شده حقوقی.
تحلیل تغییرات در متدهای ارزیابی دانشجویان حقوق با ورود ابزارهای استدلال پیشرفته.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

مطالعه استنفورد: هوش مصنوعی در ۷۵٪ تست‌های استدلال حقوقی از اساتید برتر بود

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

مطالعه استنفورد: هوش مصنوعی در ۷۵٪ تست‌های استدلال حقوقی از اساتید برتر بود

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

مطالعه استنفورد: هوش مصنوعی در ۷۵٪ تست‌های استدلال حقوقی از اساتید برتر بود

گام بعدی شما

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

مطالعه استنفورد: هوش مصنوعی در ۷۵٪ تست‌های استدلال حقوقی از اساتید برتر بود

گام بعدی شما

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران