محدودیت منابع محاسباتی تخصص‌گرایی را بر جامعیت مدل‌های هوش مصنوعی ترجیح می‌دهد

دیواری ریاضیاتی در برابر تلاش برای ساخت یک مدل هوش مصنوعی واحد و قادر مطلق ایستاده است. در پژوهشی با عنوان «هوش مصنوعی باید از طریق هوشمندی سازگار فرازمانی، تخصص‌گرایی را بپذیرد»، گولدفدر (Goldfeder)، وایدر (Wyder)، له‌کان (LeCun) و شوارتز-زیو (Shwartz-Ziv) در تحلیلی در سال ۲۰۲۶ استدلال می‌کنند که تخصص‌گرایی برای هر سیستمی که تحت محدودیت‌های متناهی عمل می‌کند، نه صرفاً یک انتخاب، بلکه یک الزام اجتناب‌ناپذیر است. نویسندگان با ارائه یک مورد همگرایی که حوزه‌های زیست‌شناسی، اقتصاد سازمانی، نظریه بهینه‌سازی و یادگیری ماشین را در بر می‌گیرد، شالوده فکری و ساختار شواهدی را برای چگونگی شکل‌گیری سیستم‌های هوش مصنوعی مؤثر بنا می‌کنند؛ این طیف از قابلیت اطمینان و حاکمیت گرفته تا عملکرد و هزینه را شامل می‌شود.

این نتیجه در زمانی حاصل می‌شود که کل صنعت بر روی «هوش عمومی» (General Intelligence) وسواس پیدا کرده است. به‌طور سنتی، این فرض وجود داشته که افزایش توان محاسباتی (Compute) و داده‌های گسترده‌تر، به‌طور خودکار منجر به قابلیت‌های جامع بهتر می‌شود. این انتظار متداول منطقی به نظر می‌رسد: قابلیت بیشتر و کاربرد گسترده‌تر، همراهانی طبیعی به نظر می‌رسند. تصور می‌شود که آموزش گسترده‌تر باید سیستم‌هایی تولید کند که با اطمینان روزافزون به وظایف بیشتری دست یابند. با این حال، این مقاله پیشنهاد می‌کند که مهم‌ترین پیشرفت‌ها — مانند پیش‌بینی تاشدگی پروتئین‌ها — نتیجه‌ی هدف‌گیری محدود و دقیق بوده‌اند، نه گسترش breadth. نقاط عطف تاریخی هوش مصنوعی، در بررسی‌های دقیق، بازتاب‌دهنده هدف‌گیری شدید در یک دامنه خاص هستند، نه گسترش جامعیت. این الگو در دامنه‌های مختلف، در طی دهه‌ها و در انتخاب‌های معماری که تقریباً هیچ وجه مشترکی ندارند، تکرار می‌شود.

اثبات ریاضی: هیچ ناهار رایگانی نیست

بنیان این استدلال بر قضیه «هیچ ناهار رایگانی نیست» (No Free Lunch) است که توسط ولپرت (Wolpert) و مک‌ریدی (Macready) در سال ۱۹۹۷ اثبات شد. اثبات ریاضی آن‌ها نشان می‌دهد که هیچ تک‌الگوریتم بهینه‌ساز (Optimizer) جامع وجود ندارد که بتواند در تمام مسائل ممکن، از تمام الگوریتم‌های دیگر پیشی بگیرد. این یک واقعیت ریاضی است، نه یک ترجیح فلسفی.

اگر یک الگوریتم در مجموعه‌ای از مسائل به مزیت دست یابد، لزوماً باید عملکرد خود را در مسائل دیگر واگذار کند. اگر میانگین عملکرد در تمام مسائل conceivable که یک یادگیرنده ممکن است با آن‌ها مواجه شود محاسبه شود، هر الگوریتمی به یک اندازه خوب — و به یک اندازه بد — عمل می‌کند. در واقع، عملکرد بازتوزیع می‌شود، نه اینکه تکثیر شود. در شرایط عملی، این بدان معناست که جامعیت یک مزیت عملکردی نیست؛ بلکه مسیر رسیدن به برتری، معاوضه استراتژیک breadth در برابر تناسب (Fit) است. همان‌طور که گولدفدر و همکاران (۲۰۲۶) بیان می‌کنند: «یک الگوریتم زمانی پیروز می‌شود که تناسب خوبی با مسئله هدف داشته باشد».

محدودیت منابع: ریاضیات بی‌رحم

هر سیستم هوش مصنوعی در چارچوب محدودیت‌های متناهی محاسبات (Compute)، داده و زمان توسعه عمل می‌کند. نویسندگان اشاره می‌کنند که هرچه مجموعه وظایف به‌طور بی‌نهایتی گسترش یابد، منابع در دسترس برای هر وظیفه به سمت صفر میل می‌کند. این حساب و کتاب بی‌رحم است: پوشش جهانی و عملکرد معنادار، در شرایط منابع متناهی، در تضاد مستقیم هستند. با توجه به انرژی محدود، رویکردی که منابع را به سمت مجموعه‌ای متناهی از وظایف هدایت کند، همیشه از رویکردی که همان منابع را در طیفی نامحدود پخش کند، برتر خواهد بود.

این حرکت به سمت بهینه‌سازی منابع در سطح عملیاتی نیز مشاهده می‌شود؛ به گونه‌ای که بسیاری از حجم عملیات هوش مصنوعی به مدل‌های ارزان‌تر و تخصصی‌تر منتقل می‌شوند تا تعادل میان هزینه و عملکرد برقرار شود. در نتیجه، سیستمی که از مواجهه با محدودیت‌های دنیای واقعی جان سالم به در می‌برد، سیستمی نیست که سعی کند همه کار انجام دهد، بلکه سیستمی است که با هدف خاص خود تناسب دارد. مقاله تأکید می‌کند که اگرچه «جامعیت جهانی یک مفهوم نظری است»، اما در عمل، یک افسانه است. ریاضیات این موضوع را نه به عنوان یک ترجیح، بلکه به عنوان پیش‌بینیی از رفتار سیستم‌های محدود شده تثبیت می‌کند.

موازی‌های زیست‌شناختی و بازاری

این الگو منحصر به هوش مصنوعی نیست؛ بلکه یکی از اصول محوری زیست‌شناسی تکاملی است. در طبیعت، جامع‌گراها (Generalists) ممکن است در محیط‌های زیادی زنده بمانند، اما برای هیچ‌یک از آن‌ها بهینه نیستند. شایستگی آن‌ها بیش از حد پخش شده است تا بتوانند در شرایط خاصی سلطه یابند.

تخصص زیست‌شناختی:

مکانیسم معاوضه (Trade-off): هیچ بهبودی در عملکرد بدون پذیرش هزینه‌ها ممکن نیست. منابعی که در یک قابلیت سرمایه‌گذاری می‌شوند، برای قابلیت دیگر در دسترس نخواهند بود. هر بهبود عملکرد در یک نیچ (Niche) خاص، هزینه‌ای در جای دیگر دارد.
فشار انتخاب (Selection Pressure): انتخاب طبیعی، طراحی‌هایی را که با شرایط محلی سازگارند، بر طراحی‌هایی که برای پوشش یکنواخت تمام محیط‌های ممکن بهینه شده‌اند، ترجیح می‌دهد.
نتیجه: موجوداتی که برای بازتولید زنده می‌مانند، نه جامع‌ترین‌ها، بلکه سازگارترین‌ها با محیط خود هستند. این منجر به ظهور متخصصانی می‌شود که در مقیاس‌های زمانی تکاملی، نیچ‌های خاصی را پر می‌کنند.

همان‌طور که گولدفدر و همکاران برجسته می‌کنند، تخصص‌گرایی در زیست‌شناسی یک اتفاق تصادفی نیست؛ بلکه پیامد پیش‌بینی‌پذیر منابع محدود، اهداف متضاد و محیط‌هایی است که عملکرد در زیرمجموعه کوچکی از چالش‌های مرتبط با تکامل را پاداش می‌دهند.

تخصص در بازار:
بازارهای رقابتی این انتخاب زیست‌شناختی را از طریق اقتصاد سازمانی منعکس می‌کنند. در این سیستم‌ها، سازمان‌ها و استراتژی‌هایی که نمی‌توانند به آستانه‌های عملکرد دست یابند، حذف می‌شوند. این حذف نه از طریق انقراض، بلکه از طریق خروج از بازار، قطع بودجه و جایگزینی با جایگزین‌های سازگارتر رخ می‌دهد.

واحد انتخاب: برخلاف زیست‌شناسی، واحد انتخاب در اینجا موجود زنده نیست، بلکه سازمان، محصول یا استراتژی است.
مکانیسم: رقابت به عنوان یک مکانیسم انتخاب عمل می‌کند که استراتژی‌های مؤثر را تقویت و استراتژی‌های ناکارآمد را حذف می‌کند. این فرآیند شامل هیچ ارث و میراثی نیست، جهشی ندارد و نیازی به مقیاس‌های زمانی تکاملی ندارد.
فشار ساختاری: علیرغم نبود ارث یا جهش، بازارها با همان فشار مواجه‌اند: منابع محدود و الزامات عملکردی.

چه از طریق جهش ژنتیکی و چه از طریق قطع بودجه شرکتی، فشار ساختاری یکسان است: ظرفیت متمرکز در جایی که استانداردهای عملکرد شفاف و ثابت باشند، بر ظرفیت پراکنده پیروز می‌شود. تکامل و بازارها از طریق مکانیسم‌های کاملاً متفاوتی عمل می‌کنند، اما هر دو تحت فشار منابع، به یک نتیجه می‌رسند: تناسب بر جامعیت برتری دارد.

تخصص «داخلی» در یادگیری ماشین

در داخل حوزه یادگیری ماشین، این پدیده به‌صورت «انتقال منفی» (Negative Transfer) ظاهر می‌شود؛ یک تخریب مستند شده (Ruder, 2017) که در آن وظایف برای تصرف ظرفیت نمایشگاهی (Representational Capacity) با یکدیگر رقابت می‌کنند. وقتی وظایف دارای ساختار مشترک باشند، آموزش همزمان به آن‌ها کمک می‌کند. با این حال، وقتی وظایف در طول آموزش گرادیان‌های متضادی ایجاد کنند یا برای ظرفیتی یکسان رقابت کنند، عملکرد در وظایف فردی به سطحی پایین‌تر از آنچه یک متخصص اختصاصی به دست می‌آورد، سقوط می‌کند. در اینجا، دستاورد حاصل از breadth تبدیل به هزینه‌ای برای depth می‌شود. این نتیجه مستقیم تقسیم ظرفیت متناهی بین وظایفی است که در جهت‌های متضاد می‌کشند.

جالب این است که معماری مدل‌های پیشرو فعلی، یک تسلیم ساختاری در برابر این قانون را نشان می‌دهد. سیستم‌های ترکیب خبره‌ها (Mixture-of-Experts یا MoE)، مانند Switch Transformers (Fedus et al., 2022)، جامعیت را نه از طریق عمومیت یکنواخت، بلکه با هدایت هر ورودی به یک زیرمجموعه تخصصی از شبکه به دست می‌آورند.

فرآیند MoE: سیستم به جای استفاده از تمام پارامترها برای هر ورودی، «خبره‌های» (Experts) متفاوتی را برای وظایف مختلف فعال می‌کند.
تفسیر: نویسندگان استدلال می‌کنند که این سیستمی است که برای جامعیت طراحی شده، اما نتایج خود را از طریق بازیابی تخصص در لایه‌های داخلی به دست می‌آورد.
استنتاج: در حالی که معماری‌های MoE برای کارایی محاسباتی طراحی شدند، موفقیت آن‌ها نشان می‌دهد که توانمندترین سیستم‌های جامع باید برای حفظ عملکرد، در طراحی خود از سیستم‌های متخصص تقلید کنند.

مورد مطالعاتی: AlphaFold

موفقیت AlphaFold در پیش‌بینی ساختار پروتئین‌ها (Jumper et al., 2021) به عنوان نمونه‌ی اعلا عمل می‌کند. طبق این پژوهش، جهش توانمندی آن از هدف‌گیری شدید دامنه و معماری متناسب با وظیفه حاصل شد، نه از یک صلاحیت جامع گسترده‌تر. دستاوردهای آن حاصل تمرکز محدودتر بود، نه پوشش وسیع‌تر.

از AlphaFold به عنوان تصویری از مکانیسم محوری استفاده می‌شود: نقاط عطف تاریخی هوش مصنوعی مکرراً بازتاب‌دهنده هدف‌گیری شدید دامنه هستند، حتی زمانی که نتیجه نهایی شبیه به نمایش هوش عمومی به نظر برسد. این الگو بارها ظاهر شده است — برای مثال در سیستم‌هایی مانند AlphaZero (Silver et al., 2018) که بازی‌های خاصی را از طریق خود-بازی (self-play) هدفمند تسلط یافتند — و این اتفاق در انتخاب‌های معماری مختلف و در طی دهه‌های متفاوت رخ داده است.

مقیاس در برابر تخصص

نویسندگان به‌طور صریح تز خود را از «درس تلخ» (The Bitter Lesson) ریچ ساتون در سال ۲۰۱۹ متمایز می‌کنند. ساتون استدلال می‌کرد که روش‌های متکی بر دانش دامنه دست‌نویس (hand-coded domain knowledge) همیشه توسط روش‌هایی که محاسبات را مقیاس می‌کنند، شکست می‌خورند. در ظاهر، اگر این به معنای پیروزی همیشگی مقیاس و جامعیت باشد، با تخصص‌گرایی در تضاد است.

با این حال، مقاله سال ۲۰۲۶ استدلال می‌کند که یک خلط بحرانی بین دو مفهوم متمایز وجود دارد:

۱. دانش دامنه (Domain Knowledge): این مفهوم به ویژگی‌های دست‌نویس، پیش‌فرض‌های مهندسی‌شده و قوانینی اشاره دارد که برای دادن بصیرت به سیستم در یک حوزه خاص طراحی شده‌اند. حق با ساتون است که این‌ها به‌طور مداوم توسط مقیاس شکست می‌خورند.
۲. تخصص دامنه (Domain Specialization): این یک تصمیم درباره‌ی چشم‌انداز (Scope) است؛ یعنی هدایت منابع، معماری و آموزش سیستم به سمت مجموعه‌ای محدود از وظایف، به‌جای توزیع گسترده آن‌ها. این کدگذاری دانش نیست، بلکه تصمیمی درباره‌ی تمرکز است.

مقیاس‌پذیری تغییر می‌دهد که یک سیستم «چگونه» از داده‌ها یاد بگیرد، اما این محدودیت را از بین نمی‌برد که تمرکز منابع بر یک مجموعه وظیفه متناهی، بر توزیع آن‌ها در طیفی نامحدود برتری دارد. همان‌طور که پژوهشگران بیان می‌کنند: «کاهش کاربردی بودن دانش دامنه، متمایز از کاربردی بودن تخصص دامنه است. با پیشرفت مقیاس، ما برای ساخت سیستمی که تاشدگی پروتئین را انجام دهد، نیاز کمتری به دانستن جزئیات پروتئین‌ها خواهیم داشت؛ با این حال، چنین سیستمی همچنان از تمرکز تخصصی روی پروتئین‌ها سود می‌برد».

«درس تلخ» و استدلال تخصص‌گرایی در ابعاد متفاوتی عمل می‌کنند — یکی توصیف می‌کند که دانش چگونه باید کسب شود، در حالی که دیگری توصیف می‌کند که سیستم باید به سمت چه هدفی نشانه رود. هر دوی این‌ها می‌توانند به‌طور همزمان درست باشند. مقیاس‌پذیری مکانیسم‌های یادگیری را تغییر می‌دهد؛ اما محدودیتی را که تناسب (Fit) را باارزش‌تر از جامعیت (Breadth) می‌کند، از بین نمی‌برد.

نتیجه‌گیری: همگرایی محدودیت‌ها

در چهار سنت تحلیلی — نظریه بهینه‌سازی، زیست‌شناسی، بازارها و یادگیری ماشین — یک الگوی واحد از مسیرهای مختلف ظهور کرد. این یک تصادف نیست که نیاز به توضیح داشته باشد؛ بلکه خودِ شواهده است. وقتی منابع متناهی با فشار انتخاب مواجه می‌شوند — چه در یک مسئله بهینه‌سازی، چه در یک اکوسیستم، چه در یک بازار یا یک فرآیند آموزش — تناسب (Fit) همواره بر جامعیت (Breadth) پیروز می‌شود.

مکانیسم‌های خاص متفاوت هستند. مقیاس‌های زمانی متفاوت‌اند. واحدهای انتخاب متفاوت‌اند. اما دینامیک ساختاری یکسان است. قضیه «ناهار رایگان نیست»، باعث ایجاد این الگو در زیست‌شناسی نشده است، و زیست‌شناسی نیز باعث ایجاد آن در بازارها نشده است. در عوض، همه آن‌ها با یک محدودیت زیربنایی مواجه‌اند: عملکرد تحت شرایط کمبود، نیازمند تمرکز است.

آنچه قضیه به‌صورت ریاضی تثبیت می‌کند، تاریخ تکاملی به‌صورت تجربی تأیید می‌کند، بازارهای رقابتی به‌صورت نهادی نمایش می‌دهند و یادگیری ماشین به‌صورت معماری دوباره کشف می‌کند. تخصص‌گرایی یک ترجیح نیست. بلکه چیزی است که وقتی منابع متناهی با الزام به عملکرد ملاقات می‌کنند، ظهور می‌کند.

اگر در حال ارزیابی این هستید که تمرکز بر دامنه چگونه بر عملکرد هوش مصنوعی در سازمان شما تأثیر می‌گذارد — یا در حال ساختن استدلال داخلی برای یک استراتژی تخصص‌گرایی هستید — مایل هستیم درباره زمینه شما بدانیم. با Dharma AI در تماس باشید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

اثبات ریاضی: هیچ ناهار رایگانی نیست

محدودیت منابع: ریاضیات بی‌رحم

موازی‌های زیست‌شناختی و بازاری

تخصص زیست‌شناختی:

مکانیسم معاوضه (Trade-off): هیچ بهبودی در عملکرد بدون پذیرش هزینه‌ها ممکن نیست. منابعی که در یک قابلیت سرمایه‌گذاری می‌شوند، برای قابلیت دیگر در دسترس نخواهند بود. هر بهبود عملکرد در یک نیچ (Niche) خاص، هزینه‌ای در جای دیگر دارد.
فشار انتخاب (Selection Pressure): انتخاب طبیعی، طراحی‌هایی را که با شرایط محلی سازگارند، بر طراحی‌هایی که برای پوشش یکنواخت تمام محیط‌های ممکن بهینه شده‌اند، ترجیح می‌دهد.
نتیجه: موجوداتی که برای بازتولید زنده می‌مانند، نه جامع‌ترین‌ها، بلکه سازگارترین‌ها با محیط خود هستند. این منجر به ظهور متخصصانی می‌شود که در مقیاس‌های زمانی تکاملی، نیچ‌های خاصی را پر می‌کنند.

واحد انتخاب: برخلاف زیست‌شناسی، واحد انتخاب در اینجا موجود زنده نیست، بلکه سازمان، محصول یا استراتژی است.
مکانیسم: رقابت به عنوان یک مکانیسم انتخاب عمل می‌کند که استراتژی‌های مؤثر را تقویت و استراتژی‌های ناکارآمد را حذف می‌کند. این فرآیند شامل هیچ ارث و میراثی نیست، جهشی ندارد و نیازی به مقیاس‌های زمانی تکاملی ندارد.
فشار ساختاری: علیرغم نبود ارث یا جهش، بازارها با همان فشار مواجه‌اند: منابع محدود و الزامات عملکردی.

تخصص «داخلی» در یادگیری ماشین

فرآیند MoE: سیستم به جای استفاده از تمام پارامترها برای هر ورودی، «خبره‌های» (Experts) متفاوتی را برای وظایف مختلف فعال می‌کند.
تفسیر: نویسندگان استدلال می‌کنند که این سیستمی است که برای جامعیت طراحی شده، اما نتایج خود را از طریق بازیابی تخصص در لایه‌های داخلی به دست می‌آورد.
استنتاج: در حالی که معماری‌های MoE برای کارایی محاسباتی طراحی شدند، موفقیت آن‌ها نشان می‌دهد که توانمندترین سیستم‌های جامع باید برای حفظ عملکرد، در طراحی خود از سیستم‌های متخصص تقلید کنند.

مورد مطالعاتی: AlphaFold

مقیاس در برابر تخصص

با این حال، مقاله سال ۲۰۲۶ استدلال می‌کند که یک خلط بحرانی بین دو مفهوم متمایز وجود دارد:

نتیجه‌گیری: همگرایی محدودیت‌ها

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

محدودیت منابع محاسباتی تخصص‌گرایی را بر جامعیت مدل‌های هوش مصنوعی ترجیح می‌دهد

اثبات ریاضی: هیچ ناهار رایگانی نیست

محدودیت منابع: ریاضیات بی‌رحم

موازی‌های زیست‌شناختی و بازاری

تخصص «داخلی» در یادگیری ماشین

مورد مطالعاتی: AlphaFold

مقیاس در برابر تخصص

نتیجه‌گیری: همگرایی محدودیت‌ها

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

محدودیت منابع محاسباتی تخصص‌گرایی را بر جامعیت مدل‌های هوش مصنوعی ترجیح می‌دهد

اثبات ریاضی: هیچ ناهار رایگانی نیست

محدودیت منابع: ریاضیات بی‌رحم

موازی‌های زیست‌شناختی و بازاری

تخصص «داخلی» در یادگیری ماشین

مورد مطالعاتی: AlphaFold

مقیاس در برابر تخصص

نتیجه‌گیری: همگرایی محدودیت‌ها

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

محدودیت منابع محاسباتی تخصص‌گرایی را بر جامعیت مدل‌های هوش مصنوعی ترجیح می‌دهد

اثبات ریاضی: هیچ ناهار رایگانی نیست

محدودیت منابع: ریاضیات بی‌رحم

موازی‌های زیست‌شناختی و بازاری

تخصص «داخلی» در یادگیری ماشین

مورد مطالعاتی: AlphaFold

مقیاس در برابر تخصص

نتیجه‌گیری: همگرایی محدودیت‌ها

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

محدودیت منابع محاسباتی تخصص‌گرایی را بر جامعیت مدل‌های هوش مصنوعی ترجیح می‌دهد

اثبات ریاضی: هیچ ناهار رایگانی نیست

محدودیت منابع: ریاضیات بی‌رحم

موازی‌های زیست‌شناختی و بازاری

تخصص «داخلی» در یادگیری ماشین

مورد مطالعاتی: AlphaFold

مقیاس در برابر تخصص

نتیجه‌گیری: همگرایی محدودیت‌ها

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران