فراتر از مدل: لایه‌ی مسیریابی چگونه جایگزین مزیت رقابتی هوش مصنوعی می‌شود؟

اگر امروز برای گردش‌کارهای اصلی شرکت خود تنها به یک کلید API تکیه می‌کنید، در واقع یک نقطه شکست (Single Point of Failure) در قلب کسب‌وکارتان ساخته‌اید. تصور کنید تمام عملیات شما به یک دکمه وابسته است که هر لحظه ممکن است از کار بیفتد.

بر اساس گزارش‌های فنی، در ۲۰ آوریل ۲۰۲۶، شرکت OpenAI دچار قطعی دو ساعته‌ای شد که باعث فلج شدن هم‌زمان ChatGPT، Codex و کل پلتفرم API آن شد. این اتفاق درست پس از آن رخ داد که در ۱۵ آوریل ۲۰۲۶، سرویس‌های Anthropic شامل Claude.ai، API مدل کلاود، Claude Code و کنسول مدیریتی آن برای سه ساعت از دسترس خارج شدند. همچنین طبق داده‌های پایش، API مدل Gemini گوگل از ۱۷ تا ۲۰ آوریل با قطعی‌های جزئی مواجه بود و AI Studio به طور مستمر از ۲ تا ۲۰ آوریل قطعی‌های جزئی را ثبت کرد.

این حوادث ثابت می‌کند که ابزارهای هوش مصنوعی از مرز «امکانات جانبی» عبور کرده و به «زیرساخت‌های حیاتی» تبدیل شده‌اند. طبق نظرسنجی جهانی مک‌کینزی در سال ۲۰۲۵، ۸۸٪ سازمان‌ها به‌طور منظم از هوش مصنوعی در حداقل یک بخش تجاری استفاده می‌کنند و نرخ استقرار هوش مصنوعی زاینده (Generative AI) — که شبیه دستیاری است که با خواندن میلیاردها متن، حالا می‌تواند محتوای جدید خلق کند — از ۳۳٪ در سال ۲۰۲۴ به ۷۲٪ رسیده است. وقتی سرعت توسعه، عوامل خدمات مشتریان یا سنتز پژوهشی شما به یک ارائه‌دهنده وابسته باشد، یک قطعی ساده دیگر یک مشکل فنی نیست، بلکه یک بحران تجاری است.

همان‌طور که در تحلیل‌های قبلی ما درباره‌ی امنیت مدل‌های بازمتن اشاره کردیم، انتخاب یک ارائه‌دهنده در گذشته منطقی بود چون تفاوت در استدلال و سبک مدل‌ها زیاد بود. شما یک مدل را به خاطر نقاط قوت خاصش انتخاب می‌کردید. اما امروز این شکاف بسته شده است. ما شاهد یک همگرایی گسترده هستیم؛ جایی که بارهای کاری سازمانی دیگر نمی‌توانند تفاوت معناداری بین مدل‌های پیشرو احساس کنند.

مکانیسم‌های همگرایی

این همگرایی تصادفی نیست، بلکه نتیجه ساختاری صنعت است. اولین عامل، «آموزش مدل‌ها روی مدل‌های دیگر» است. وقتی یک آزمایشگاه مدل قدرتمندی منتشر می‌کند، خروجی‌های آن به داده‌های آموزشی برای پژوهشگران، رقبا و خطوط تقطیر (Distillation) — که شبیه عصاره‌گیری از یک کتاب قطور برای تبدیل آن به یک دفترچه راهنمای کوچک و سریع است — تبدیل می‌شود.

به نقل از اظهارات رسمی، OpenAI صراحتاً DeepSeek را متهم کرد که از خروجی‌های API آن برای آموزش مدل رقیب استفاده کرده است. مقام مسئول هوش مصنوعی در کاخ سفید نیز تایید کرد شواهد قابل‌توجهی وجود دارد که DeepSeek دانش را از مدل‌های OpenAI استخراج کرده است. دانش کدگذاری شده در GPT-4 دیگر در حصار OpenAI نماند و در تمام داده‌های اینترنتی که محتوای تولید شده توسط AI داشتند، پخش شد.

عامل دوم، کوچک بودن حلقه متخصصان است. در سطح جهان تنها حدود ۱۲۰۰ نفر می‌دانند چگونه مدل‌های پیشرو را در مقیاس بزرگ آموزش دهند و این افراد مدام بین شرکت‌ها جابه‌جا می‌شوند.

برای مثال، پژوهشگران GPT-3 به تأسیس Anthropic کمک کردند. داریو آمودئی، دانیلا آمودئی و چندین همکار دیگر OpenAI را ترک کردند تا روی هوش مصنوعی قانون‌مند (Constitutional AI) و تفسیرپذیری مکانیکی کار کنند. طبق گزارش Fortune در ژوئن ۲۰۲۵، مهندسان OpenAI هشت برابر بیشتر احتمال داشت که به Anthropic نقل مکان کنند تا برعکس. شرکت Meta نیز در یک موج استخدام سریع، دست‌کم ۱۱ پژوهشگر را از OpenAI، DeepMind و Anthropic جذب کرد.

وقتی افراد یکسانی از مبانی نظری یکسانی در شرکت‌های مختلف استفاده می‌کنند، مدل‌های حاصل به‌طور طبیعی هم‌گرا می‌شوند. رویکردهای آموزشی هم‌راستا می‌شوند زیرا طراحان همان افرادی هستند که حالا کارت شناسایی شرکت‌های مختلف را به گردن انداخته‌اند.

ظهور زیرساخت‌های کالایی

استانداردهای زیرساختی سریع‌تر از حد انتظار در حال یکپارچگی هستند. پروتکل کانتکست مدل (MCP) را می‌توان مدرک اصلی این تغییر دانست.

مسیر تکامل MCP به این شکل بود:

نوامبر ۲۰۲۴: معرفی پروتکل کانتکست مدل توسط Anthropic.
مارس ۲۰۲۵: پذیرش این استاندارد توسط OpenAI؛ سام آلتمن اعلام کرد: «مردم MCP را می‌پسندند و ما برای افزودن پشتیبانی از آن در محصولاتمان هیجان‌زده هستیم.»
آوریل ۲۰۲۵: تایید عمومی توسط دیمیس هاسابیس، مدیرعین‌المعامل گوگل دیپ‌مایند.
می ۲۰۲۵: عرضه عمومی MCP توسط مایکروسافت در کنفرانس Build 2025.
دسامبر ۲۰۲۵: اهدا به بنیاد لینوکس. OpenAI و Block در کنار Anthropic به عنوان هم‌بنیان‌گذاران «بنیاد هوش مصنوعی عاملی» (Agentic AI Foundation) ظاهر شدند و گوگل، مایکروسافت و AWS به عنوان اعضای پشتیبان پیوستند.

این چرخش، یک استاندارد اختصاصی را به یک کالای عمومی تبدیل کرد. تعداد دانلودهای SDK برای MCP از حدود ۱۰۰ هزار مورد در ماه در زمان عرضه به ۹۷ میلیون مورد در اواخر ۲۰۲۵ رسید؛ یعنی افزایشی هزار برابری. اکنون بیش از ۱۰ هزار سرور فعال MCP وجود دارد. همان‌طور که The New Stack در مقاله «چرا پروتکل کانتکست مدل پیروز شد» اشاره کرد، وقتی رقبا یک استاندارد را با این سرعت می‌پذیرند، یعنی مشکل چنان جهانی است که هیچ‌کس از داشتن یک جایگزین اختصاصی سود نمی‌برد.

علاوه بر این، تمام آزمایشگاه‌ها روی بنچمارک‌های یکسانی مثل MMLU، HumanEval، SWE-bench و GPQA بهینه‌سازی می‌کنند. وقتی هر مدل آموزش می‌بیند تا در امتحان‌های یکسانی قبول شود، مهارت‌های یکسانی پیدا می‌کنند. تفاوت‌ها اکنون فقط در لبه‌های بسیار پیشرفته یا موارد خاص (Edge Cases) دیده می‌شود. برای بخش وسیعی از کاربردهای سازمانی، مدل‌ها اکنون از نظر عملکردی معادل هستند.

تله‌ی وابستگی به فروشنده (Vendor Lock-in)

ساخت سیستم روی یک ارائه‌دهنده، ریسک‌هایی فراتر از قطعی ساده دارد. اول، قدرت قیمت‌گذاری است. ارائه‌دهنده‌ای که جریان کار شما را در اختیار دارد، می‌تواند با اطمینان قیمت‌ها را بالا ببرد چون وابستگی شما ثابت شده است. سازمانی که می‌تواند در ۴۸ ساعت مدل خود را تغییر دهد، موقعیت مذاکراتی کاملاً متفاوتی نسبت به سازمانی دارد که برای یکپارچه‌سازی مجدد به شش ماه زمان نیاز دارد.

دوم، پدیده «کاهش کیفیت خاموش» یا AI Shrinkflation است. ارائه‌دهندگان می‌توانند برای کاهش هزینه، عمق استدلال را بی‌سروصدا کم کنند. برای مثال در آوریل ۲۰۲۶، تحلیل‌های استلا لورنزو از گروه AI شرکت AMD نشان داد که در ۶۸۵۲ جلسه کاربر، عمق استدلال مدل Claude حدود ۶۷٪ کاهش یافته است، زیرا پارامتر reasoning_effort به ۲۵ از ۱۰۰ تقلیل یافته بود. وقتی یک ارائه‌دهنده کیفیت را کاهش می‌دهد، سازمان‌های وابسته هیچ اهرمی ندارند جز اینکه در ردیت شکایت کنند.

سوم، سقف توانمندی است. هیچ مدلی در همه دسته‌ها برنده نیست. رتبه‌ها بسته به وظیفه تغییر می‌کنند: تولید کد، سنتز اسناد طولانی، استخراج داده‌های ساختاریافته، نویسندگی خلاق و استدلال‌های چندمرحله‌ای همگی پیشروهای متفاوتی دارند. وابستگی به یک تامین‌کننده یعنی شما مجبورید برای برخی وظایف از ابزاری غیربهینه استفاده کنید چون هزینه مهاجرت بسیار زیاد است.

در نهایت، مواجهه با ریسک‌های ژئوپلیتیک و رگولاتوری است. با واگرایی قوانین هوش مصنوعی در حوزه‌های مختلف و سخت‌تر شدن کنترل‌های صادراتی، سازمانی که به یک ارائه‌دهنده وابسته است، تمام ریسک‌های قانونی آن ارائه‌دهنده را به ارث می‌برد.

معماری تاب‌آور: مسیریاب مدل (Model Router)

برای بقا در این محیط، سازمان‌ها باید یک مسیریاب مدل بسازند. این کار فقط برای کنترل بودجه نیست، هرچند هزینه استنتاج (Inference) — که شبیه لحظه آشپزی واقعی است، نه دوره‌ی آموزش آشپز — می‌تواند بین ارائه‌دهندگان برای قابلیت‌های مشابه ۱۰ برابر متفاوت باشد.

یک معماری مسیریابی موثر بر چهار ستون استوار است:

جایگزینی خودکار (Failover): اگر یک ارائه‌دهنده دچار اختلال شد یا محدودیت نرخ (Rate-limit) اعمال کرد، درخواست‌ها بدون دخالت انسان به گزینه بعدی منتقل شوند. این کار از توقف کامل کسب‌وکار در حوادثی مانند قطعی‌های آوریل ۲۰۲۶ جلوگیری می‌کند.
مسیریابی کیفی: ارسال کارهای پیچیده و طولانی به مدلی که در بنچمارک آن حوزه خاص اول است و ارسال کارهای روتین استخراج و خلاصه‌سازی به ارزان‌ترین مدلی که استانداردهای کیفی را پاس کند. این کار بدون اثر بر کیفیت، بازدهی توکن‌ها را به حداکثر می‌رساند.
اعتبارسنجی متضاد: اجرای یک خروجی حساس در دو مدل مختلف و مقایسه آن‌ها. اگر هر دو موافق بودند، اعتماد بیشتر می‌شود و در صورت اختلاف، انسان بررسی می‌کند. چون مدل‌ها حالت‌های شکست و سوگیری‌های آموزشی متفاوتی دارند، این روش خطاهایی را می‌یابد که هیچ‌کدام به تنهایی متوجه آن‌ها نمی‌شدند.
قابلیت جابه‌جایی (Portability): اطمینان از اینکه جریان‌های کاری با کمترین تغییر به نقطه اتصال (Endpoint) جدید متصل شوند. این اجازه می‌دهد سیستم مدل‌ها را ثبت کرده و مسیرهای جایگزین بسازد: اگر Opus قطع بود، Sonnet را امتحان کن؛ اگر Sonnet قطع بود، ChatGPT را امتحان کن؛ و اگر باز هم شکست خورد، Gemini یا مدل‌های بازمتن محلی در Ollama را امتحان کن.

این قابلیت اکنون واقعیت است. ابزاری به نام skillporter می‌تواند مهارت‌های عامل‌های کدنویسی را بین Claude Code، Codex، Antigravity و Gemini CLI در یک مرحله جابه‌جا کند. سال پیش مدل‌های مفهومی بیش از حد متفاوت بودند، اما امروز به دلیل همگرایی پلتفرم‌ها حول الگوهای مشابه، دقت ترجمه بسیار بالاست.

خندق رقابتی جدید

در عصر مدل‌های کالایی، خودِ مدل دیگر مزیت رقابتی شما نیست. «خندق» شما اکنون جریان کار (Workflow)، داده‌های اختصاصی و دانش سازمانی شما در استخراج خروجی‌های باکیفیت است.

برای حفاظت از این ارزش، سازمان‌ها باید سه اولویت داشته باشند:

زیرساخت مسیریابی: حتی یک پیاده‌سازی ساده که بر اساس نوع پرس‌وجو ارائه‌دهنده را تغییر دهد و جایگزینی را مدیریت کند، برای افزایش قدرت چانه زنی ارزشمند است.
کتابخانه‌های پرامپت و کانتکست: پرامپت‌های دقیق تا حد زیادی مستقل از مدل هستند. تلاشی که برای تعریف دقیق «خروجی خوب» می‌کنید، هر بار که مدل زیربنایی تغییر می‌کند، سوددهی خود را حفظ می‌کند.
سیستم‌های ارزیابی (Evaluation Harnesses): عبور از حالت «به نظر درست می‌رسد» به سمت «معیارهای پذیرش تعریف شده». بدون اندازه‌گیری کمی، نمی‌توان فهمید آیا مدل جدید به اندازه مدل قدیمی عمل می‌کند یا خیر.

با مدل هوش مصنوعی خود مانند یک منطقه ابری (Cloud Region) رفتار کنید: ضروری، اما قابل جایگزینی. سازمان‌هایی که با هوش مصنوعی به عنوان یک زیرساخت کالایی رفتار کنند، تاب‌آوری‌ای خواهند داشت که شرکت‌های وابسته به یک ارائه‌دهنده در چرخه بعدی آرزوی داشتن آن را خواهند داشت.

گام بعدی شما

بررسی کنید کدام بخش از جریان کاری شما در صورت قطعی یک API به طور کامل متوقف می‌شود و برای آن یک مسیر جایگزین (Failover) تعریف کنید.
یک سیستم ارزیابی کمی برای خروجی‌های حساس خود بسازید تا بتوانید کیفیت مدل‌های مختلف را با عدد مقایسه کنید.
از ابزارهای مسیریابی برای توزیع درخواست‌ها بین مدل‌های ارزان (برای کارهای ساده) و مدل‌های پیشرو (برای استدلال پیچیده) استفاده کنید.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.