دیواری ریاضیاتی در برابر تلاش برای ساخت یک مدل هوش مصنوعی واحد و قادر مطلق ایستاده است. در پژوهشی با عنوان «هوش مصنوعی باید از طریق هوشمندی سازگار فرازمانی، تخصصگرایی را بپذیرد»، گولدفدر (Goldfeder)، وایدر (Wyder)، لهکان (LeCun) و شوارتز-زیو (Shwartz-Ziv) در تحلیلی در سال ۲۰۲۶ استدلال میکنند که تخصصگرایی برای هر سیستمی که تحت محدودیتهای متناهی عمل میکند، نه صرفاً یک انتخاب، بلکه یک الزام اجتنابناپذیر است. نویسندگان با ارائه یک مورد همگرایی که حوزههای زیستشناسی، اقتصاد سازمانی، نظریه بهینهسازی و یادگیری ماشین را در بر میگیرد، شالوده فکری و ساختار شواهدی را برای چگونگی شکلگیری سیستمهای هوش مصنوعی مؤثر بنا میکنند؛ این طیف از قابلیت اطمینان و حاکمیت گرفته تا عملکرد و هزینه را شامل میشود.
این نتیجه در زمانی حاصل میشود که کل صنعت بر روی «هوش عمومی» (General Intelligence) وسواس پیدا کرده است. بهطور سنتی، این فرض وجود داشته که افزایش توان محاسباتی (Compute) و دادههای گستردهتر، بهطور خودکار منجر به قابلیتهای جامع بهتر میشود. این انتظار متداول منطقی به نظر میرسد: قابلیت بیشتر و کاربرد گستردهتر، همراهانی طبیعی به نظر میرسند. تصور میشود که آموزش گستردهتر باید سیستمهایی تولید کند که با اطمینان روزافزون به وظایف بیشتری دست یابند. با این حال، این مقاله پیشنهاد میکند که مهمترین پیشرفتها — مانند پیشبینی تاشدگی پروتئینها — نتیجهی هدفگیری محدود و دقیق بودهاند، نه گسترش breadth. نقاط عطف تاریخی هوش مصنوعی، در بررسیهای دقیق، بازتابدهنده هدفگیری شدید در یک دامنه خاص هستند، نه گسترش جامعیت. این الگو در دامنههای مختلف، در طی دههها و در انتخابهای معماری که تقریباً هیچ وجه مشترکی ندارند، تکرار میشود.
اثبات ریاضی: هیچ ناهار رایگانی نیست
بنیان این استدلال بر قضیه «هیچ ناهار رایگانی نیست» (No Free Lunch) است که توسط ولپرت (Wolpert) و مکریدی (Macready) در سال ۱۹۹۷ اثبات شد. اثبات ریاضی آنها نشان میدهد که هیچ تکالگوریتم بهینهساز (Optimizer) جامع وجود ندارد که بتواند در تمام مسائل ممکن، از تمام الگوریتمهای دیگر پیشی بگیرد. این یک واقعیت ریاضی است، نه یک ترجیح فلسفی.
اگر یک الگوریتم در مجموعهای از مسائل به مزیت دست یابد، لزوماً باید عملکرد خود را در مسائل دیگر واگذار کند. اگر میانگین عملکرد در تمام مسائل conceivable که یک یادگیرنده ممکن است با آنها مواجه شود محاسبه شود، هر الگوریتمی به یک اندازه خوب — و به یک اندازه بد — عمل میکند. در واقع، عملکرد بازتوزیع میشود، نه اینکه تکثیر شود. در شرایط عملی، این بدان معناست که جامعیت یک مزیت عملکردی نیست؛ بلکه مسیر رسیدن به برتری، معاوضه استراتژیک breadth در برابر تناسب (Fit) است. همانطور که گولدفدر و همکاران (۲۰۲۶) بیان میکنند: «یک الگوریتم زمانی پیروز میشود که تناسب خوبی با مسئله هدف داشته باشد».
محدودیت منابع: ریاضیات بیرحم
هر سیستم هوش مصنوعی در چارچوب محدودیتهای متناهی محاسبات (Compute)، داده و زمان توسعه عمل میکند. نویسندگان اشاره میکنند که هرچه مجموعه وظایف بهطور بینهایتی گسترش یابد، منابع در دسترس برای هر وظیفه به سمت صفر میل میکند. این حساب و کتاب بیرحم است: پوشش جهانی و عملکرد معنادار، در شرایط منابع متناهی، در تضاد مستقیم هستند. با توجه به انرژی محدود، رویکردی که منابع را به سمت مجموعهای متناهی از وظایف هدایت کند، همیشه از رویکردی که همان منابع را در طیفی نامحدود پخش کند، برتر خواهد بود.
این حرکت به سمت بهینهسازی منابع در سطح عملیاتی نیز مشاهده میشود؛ به گونهای که بسیاری از حجم عملیات هوش مصنوعی به مدلهای ارزانتر و تخصصیتر منتقل میشوند تا تعادل میان هزینه و عملکرد برقرار شود. در نتیجه، سیستمی که از مواجهه با محدودیتهای دنیای واقعی جان سالم به در میبرد، سیستمی نیست که سعی کند همه کار انجام دهد، بلکه سیستمی است که با هدف خاص خود تناسب دارد. مقاله تأکید میکند که اگرچه «جامعیت جهانی یک مفهوم نظری است»، اما در عمل، یک افسانه است. ریاضیات این موضوع را نه به عنوان یک ترجیح، بلکه به عنوان پیشبینیی از رفتار سیستمهای محدود شده تثبیت میکند.
موازیهای زیستشناختی و بازاری
این الگو منحصر به هوش مصنوعی نیست؛ بلکه یکی از اصول محوری زیستشناسی تکاملی است. در طبیعت، جامعگراها (Generalists) ممکن است در محیطهای زیادی زنده بمانند، اما برای هیچیک از آنها بهینه نیستند. شایستگی آنها بیش از حد پخش شده است تا بتوانند در شرایط خاصی سلطه یابند.
تخصص زیستشناختی:
- مکانیسم معاوضه (Trade-off): هیچ بهبودی در عملکرد بدون پذیرش هزینهها ممکن نیست. منابعی که در یک قابلیت سرمایهگذاری میشوند، برای قابلیت دیگر در دسترس نخواهند بود. هر بهبود عملکرد در یک نیچ (Niche) خاص، هزینهای در جای دیگر دارد.
- فشار انتخاب (Selection Pressure): انتخاب طبیعی، طراحیهایی را که با شرایط محلی سازگارند، بر طراحیهایی که برای پوشش یکنواخت تمام محیطهای ممکن بهینه شدهاند، ترجیح میدهد.
- نتیجه: موجوداتی که برای بازتولید زنده میمانند، نه جامعترینها، بلکه سازگارترینها با محیط خود هستند. این منجر به ظهور متخصصانی میشود که در مقیاسهای زمانی تکاملی، نیچهای خاصی را پر میکنند.
همانطور که گولدفدر و همکاران برجسته میکنند، تخصصگرایی در زیستشناسی یک اتفاق تصادفی نیست؛ بلکه پیامد پیشبینیپذیر منابع محدود، اهداف متضاد و محیطهایی است که عملکرد در زیرمجموعه کوچکی از چالشهای مرتبط با تکامل را پاداش میدهند.
تخصص در بازار:
بازارهای رقابتی این انتخاب زیستشناختی را از طریق اقتصاد سازمانی منعکس میکنند. در این سیستمها، سازمانها و استراتژیهایی که نمیتوانند به آستانههای عملکرد دست یابند، حذف میشوند. این حذف نه از طریق انقراض، بلکه از طریق خروج از بازار، قطع بودجه و جایگزینی با جایگزینهای سازگارتر رخ میدهد.
- واحد انتخاب: برخلاف زیستشناسی، واحد انتخاب در اینجا موجود زنده نیست، بلکه سازمان، محصول یا استراتژی است.
- مکانیسم: رقابت به عنوان یک مکانیسم انتخاب عمل میکند که استراتژیهای مؤثر را تقویت و استراتژیهای ناکارآمد را حذف میکند. این فرآیند شامل هیچ ارث و میراثی نیست، جهشی ندارد و نیازی به مقیاسهای زمانی تکاملی ندارد.
- فشار ساختاری: علیرغم نبود ارث یا جهش، بازارها با همان فشار مواجهاند: منابع محدود و الزامات عملکردی.
چه از طریق جهش ژنتیکی و چه از طریق قطع بودجه شرکتی، فشار ساختاری یکسان است: ظرفیت متمرکز در جایی که استانداردهای عملکرد شفاف و ثابت باشند، بر ظرفیت پراکنده پیروز میشود. تکامل و بازارها از طریق مکانیسمهای کاملاً متفاوتی عمل میکنند، اما هر دو تحت فشار منابع، به یک نتیجه میرسند: تناسب بر جامعیت برتری دارد.
تخصص «داخلی» در یادگیری ماشین
در داخل حوزه یادگیری ماشین، این پدیده بهصورت «انتقال منفی» (Negative Transfer) ظاهر میشود؛ یک تخریب مستند شده (Ruder, 2017) که در آن وظایف برای تصرف ظرفیت نمایشگاهی (Representational Capacity) با یکدیگر رقابت میکنند. وقتی وظایف دارای ساختار مشترک باشند، آموزش همزمان به آنها کمک میکند. با این حال، وقتی وظایف در طول آموزش گرادیانهای متضادی ایجاد کنند یا برای ظرفیتی یکسان رقابت کنند، عملکرد در وظایف فردی به سطحی پایینتر از آنچه یک متخصص اختصاصی به دست میآورد، سقوط میکند. در اینجا، دستاورد حاصل از breadth تبدیل به هزینهای برای depth میشود. این نتیجه مستقیم تقسیم ظرفیت متناهی بین وظایفی است که در جهتهای متضاد میکشند.
جالب این است که معماری مدلهای پیشرو فعلی، یک تسلیم ساختاری در برابر این قانون را نشان میدهد. سیستمهای ترکیب خبرهها (Mixture-of-Experts یا MoE)، مانند Switch Transformers (Fedus et al., 2022)، جامعیت را نه از طریق عمومیت یکنواخت، بلکه با هدایت هر ورودی به یک زیرمجموعه تخصصی از شبکه به دست میآورند.
- فرآیند MoE: سیستم به جای استفاده از تمام پارامترها برای هر ورودی، «خبرههای» (Experts) متفاوتی را برای وظایف مختلف فعال میکند.
- تفسیر: نویسندگان استدلال میکنند که این سیستمی است که برای جامعیت طراحی شده، اما نتایج خود را از طریق بازیابی تخصص در لایههای داخلی به دست میآورد.
- استنتاج: در حالی که معماریهای MoE برای کارایی محاسباتی طراحی شدند، موفقیت آنها نشان میدهد که توانمندترین سیستمهای جامع باید برای حفظ عملکرد، در طراحی خود از سیستمهای متخصص تقلید کنند.
مورد مطالعاتی: AlphaFold
موفقیت AlphaFold در پیشبینی ساختار پروتئینها (Jumper et al., 2021) به عنوان نمونهی اعلا عمل میکند. طبق این پژوهش، جهش توانمندی آن از هدفگیری شدید دامنه و معماری متناسب با وظیفه حاصل شد، نه از یک صلاحیت جامع گستردهتر. دستاوردهای آن حاصل تمرکز محدودتر بود، نه پوشش وسیعتر.
از AlphaFold به عنوان تصویری از مکانیسم محوری استفاده میشود: نقاط عطف تاریخی هوش مصنوعی مکرراً بازتابدهنده هدفگیری شدید دامنه هستند، حتی زمانی که نتیجه نهایی شبیه به نمایش هوش عمومی به نظر برسد. این الگو بارها ظاهر شده است — برای مثال در سیستمهایی مانند AlphaZero (Silver et al., 2018) که بازیهای خاصی را از طریق خود-بازی (self-play) هدفمند تسلط یافتند — و این اتفاق در انتخابهای معماری مختلف و در طی دهههای متفاوت رخ داده است.
مقیاس در برابر تخصص
نویسندگان بهطور صریح تز خود را از «درس تلخ» (The Bitter Lesson) ریچ ساتون در سال ۲۰۱۹ متمایز میکنند. ساتون استدلال میکرد که روشهای متکی بر دانش دامنه دستنویس (hand-coded domain knowledge) همیشه توسط روشهایی که محاسبات را مقیاس میکنند، شکست میخورند. در ظاهر، اگر این به معنای پیروزی همیشگی مقیاس و جامعیت باشد، با تخصصگرایی در تضاد است.
با این حال، مقاله سال ۲۰۲۶ استدلال میکند که یک خلط بحرانی بین دو مفهوم متمایز وجود دارد:
۱. دانش دامنه (Domain Knowledge): این مفهوم به ویژگیهای دستنویس، پیشفرضهای مهندسیشده و قوانینی اشاره دارد که برای دادن بصیرت به سیستم در یک حوزه خاص طراحی شدهاند. حق با ساتون است که اینها بهطور مداوم توسط مقیاس شکست میخورند.
۲. تخصص دامنه (Domain Specialization): این یک تصمیم دربارهی چشمانداز (Scope) است؛ یعنی هدایت منابع، معماری و آموزش سیستم به سمت مجموعهای محدود از وظایف، بهجای توزیع گسترده آنها. این کدگذاری دانش نیست، بلکه تصمیمی دربارهی تمرکز است.
مقیاسپذیری تغییر میدهد که یک سیستم «چگونه» از دادهها یاد بگیرد، اما این محدودیت را از بین نمیبرد که تمرکز منابع بر یک مجموعه وظیفه متناهی، بر توزیع آنها در طیفی نامحدود برتری دارد. همانطور که پژوهشگران بیان میکنند: «کاهش کاربردی بودن دانش دامنه، متمایز از کاربردی بودن تخصص دامنه است. با پیشرفت مقیاس، ما برای ساخت سیستمی که تاشدگی پروتئین را انجام دهد، نیاز کمتری به دانستن جزئیات پروتئینها خواهیم داشت؛ با این حال، چنین سیستمی همچنان از تمرکز تخصصی روی پروتئینها سود میبرد».
«درس تلخ» و استدلال تخصصگرایی در ابعاد متفاوتی عمل میکنند — یکی توصیف میکند که دانش چگونه باید کسب شود، در حالی که دیگری توصیف میکند که سیستم باید به سمت چه هدفی نشانه رود. هر دوی اینها میتوانند بهطور همزمان درست باشند. مقیاسپذیری مکانیسمهای یادگیری را تغییر میدهد؛ اما محدودیتی را که تناسب (Fit) را باارزشتر از جامعیت (Breadth) میکند، از بین نمیبرد.
نتیجهگیری: همگرایی محدودیتها
در چهار سنت تحلیلی — نظریه بهینهسازی، زیستشناسی، بازارها و یادگیری ماشین — یک الگوی واحد از مسیرهای مختلف ظهور کرد. این یک تصادف نیست که نیاز به توضیح داشته باشد؛ بلکه خودِ شواهده است. وقتی منابع متناهی با فشار انتخاب مواجه میشوند — چه در یک مسئله بهینهسازی، چه در یک اکوسیستم، چه در یک بازار یا یک فرآیند آموزش — تناسب (Fit) همواره بر جامعیت (Breadth) پیروز میشود.
مکانیسمهای خاص متفاوت هستند. مقیاسهای زمانی متفاوتاند. واحدهای انتخاب متفاوتاند. اما دینامیک ساختاری یکسان است. قضیه «ناهار رایگان نیست»، باعث ایجاد این الگو در زیستشناسی نشده است، و زیستشناسی نیز باعث ایجاد آن در بازارها نشده است. در عوض، همه آنها با یک محدودیت زیربنایی مواجهاند: عملکرد تحت شرایط کمبود، نیازمند تمرکز است.
آنچه قضیه بهصورت ریاضی تثبیت میکند، تاریخ تکاملی بهصورت تجربی تأیید میکند، بازارهای رقابتی بهصورت نهادی نمایش میدهند و یادگیری ماشین بهصورت معماری دوباره کشف میکند. تخصصگرایی یک ترجیح نیست. بلکه چیزی است که وقتی منابع متناهی با الزام به عملکرد ملاقات میکنند، ظهور میکند.
اگر در حال ارزیابی این هستید که تمرکز بر دامنه چگونه بر عملکرد هوش مصنوعی در سازمان شما تأثیر میگذارد — یا در حال ساختن استدلال داخلی برای یک استراتژی تخصصگرایی هستید — مایل هستیم درباره زمینه شما بدانیم. با Dharma AI در تماس باشید.




گفتگو