پیوستن نوآم شازیر به OpenAI؛ شکاف هماهنگی در مقیاس واقعی رخ داد

تصور کنید دانش هماهنگیِ یک تک‌فرد، ارزشمندتر از یک خوشه عظیم از پردازنده‌های گرافیکی باشد. این واقعیت تلخی است که با خروج نوآم شازیر (Noam Shazeer)، معمار کلیدی معماری ترنسفورمر (Transformer)، از گوگل دیپ‌مایند و پیوستن او به OpenAI عیان شد. طبق گزارش دنیل لیوران برای نشریه 24/7 Wall St در ۲۰ ژوئن ۲۰۲۶، این جابجایی توسط تحلیل‌گران پادکست TBPN به‌عنوان «مهم‌ترین حرکت استعدادی سال در حوزه هوش مصنوعی» توصیف شده است.

بسیاری از مدیران کسب‌وکار احتمالاً تصور می‌کنند مدل‌های زبانی بزرگ (LLM) — مثل کتابخانه‌داری که میلیاردها صفحه را خوانده و حالا با همان لحن کتاب‌ها جواب می‌دهد — تنها با افزودن سخت‌افزار بیشتر پیشرفت می‌کنند. اما همان‌طور که در تحلیل قبلی ما درباره‌ی امنیت مدل‌های بازمتن اشاره کردیم، پیچیدگی واقعی در لایه‌ی ارکستراسیون یا همان سازمان‌دهی است.

ضرر گوگل در اینجا ساختاری است. شازیر تنها یک کدنویس نبود؛ او می‌دانست چگونه مکانیزم‌های توجه (Attention)، مسیریابی پراکنده و معماری‌های ترکیب خبره‌ها (Mixture of Experts یا MoE) را در یک سیستم پایدار به هم گره بزند. او یکی از نویسندگان همکار مقالات بنیادین ترنسفورمر، T5 و Switch Transformer است. مقاله سال ۲۰۱۷ با عنوان «Attention Is All You Need» که معماری ترنسفورمر را معرفی کرد، تاکنون بیش از ۱۴۰,۰۰۰ بار ارجاع شده است و شازیر یکی از هشت نویسنده آن است. استخدام او برای OpenAI، تنها استخدام یک مهندس نیست، بلکه تصاحب یکی از گره‌های اصلی در گراف دانشِ فناوری هوش مصنوعی مدرن است.

به گزارش منابع مذکور، دین بال (Dean Ball)، متخصص سیاست‌گذاری، تنها یک روز پس از شازیر به OpenAI پیوست. بال توسط یکی از مهمانان پادکست TBPN به‌عنوان کسی توصیف شده که «واقعاً به دنبال درست انجام دادن این مسیر برای کشور است» و تقریباً نسبت به تمام شرکت‌های فعال در این حوزه منتقد بوده است. حتی جیم کرامر نیز حوالی ساعت ۳ صبح واکنش نشان داد و به OpenAI صرفاً با عنوان «AI» اشاره کرد؛ کوتاه‌نامه‌ای که میزبانان پادکست آن را قابل توجه دانستند. این موج خروج در حالی رخ می‌دهد که صنعت از چت‌بات‌های ساده به سمت گردش‌های کاری عامل‌محور (Agentic Workflows) حرکت می‌کند. دنیا اکنون وارد دورانی شده است که متخصصان آن را «شکاف هماهنگی هوش مصنوعی» می‌نامند.

تبیین شکاف هماهنگی هوش مصنوعی

شکاف هماهنگی، فاصله ساختاری بین «داشتن قطعات» — مانند مدل‌ها، GPUها، داده‌ها و عامل‌ها — و «داشتن دانش انسانی و سیستمی» است که برای به‌کارگیری مطمئن آن‌ها مورد نیاز است. در بازار فعلی، قطعات در حال تبدیل شدن به کالاهای عمومی‌اند. Anthropic، OpenAI و گوگل همگی مدل‌های پیشرو را بر اساس توکن می‌فروشند؛ Pinecone فضای ذخیره‌سازی بردار معنایی را فراهم می‌کند و LangChain کدهای سازمان‌دهی را ارائه می‌دهد.

اما دانشِ اینکه این قطعات تحت فشار عملیاتی واقعی چگونه با هم هماهنگ شوند، در هیچ کاتالوگی (SKU) فروخته نمی‌شود. به همین دلیل است که اکثر گردش‌های کاری هوش مصنوعی نه در لایه‌ی مدل، بلکه در لایه‌ی سازمان‌دهی شکست می‌خورند. این همان دلیلی است که چرا خروج یک پژوهشگر واحد می‌تواند شرکتی تریلیون دلاری را به لرزه درآورد: هماهنگی در افراد است، نه در تراشه‌ها. همان‌طور که منابع اشاره کرده‌اند، اکثر متخصصان این حوزه معتقدند شازیر نقش حیاتی در کمک به Gemini برای کاهش فاصله با رقبایی چون OpenAI و Anthropic داشت.

خروج شازیر از اوپن‌ای‌آی، شکاف هماهنگی هوش مصنوعی را نشان می‌دهد نه تهدیدی برای گوگل.

پنج لایه شکست در سامانه‌های هوش مصنوعی

برای درک اینکه چرا شازیر جایگزین‌ناپذیر است، باید ببینیم سیستم‌های هوش مصنوعی عملاً کجا می‌شکنند. هماهنگی در پنج لایه‌ی متمایز رخ می‌دهد. نکته کلیدی این است که راهکار لایه ۲ به شما در لایه ۵ کمک نمی‌کند و خطاها در هر لایه به‌صورت تجمعی به لایه‌های پایین‌دست منتقل می‌شوند:

لایه مدل (Gemini / GPT / Claude): این لایه‌ی پایه ورودی‌ها (پرامپت‌ها/بستر) و خروجی‌ها (توکن‌ها) است. شکست اصلی در اینجا «غیرقطعی بودن» (Non-determinism) است، جایی که یک پرامپت واحد جواب‌های متفاوتی می‌دهد. تأخیر (Latency) معمولاً بسته به اندازه مدل و طول بستر، بین ۲۰۰ میلی‌ثانیه تا ۴ ثانیه است.
لایه بازیابی (Pinecone / RAG): این لایه مدیریت جاسازی‌های پرس‌وجو (Query Embeddings) و اسناد top-k را بر عهده دارد. ریسک اصلی اینجا «مسمومیت بازیابی» است، جایی که اسناد نامرتبط، بستر متن مدل را مخدوش می‌کنند. هزینه‌های هماهنگی در اینجا شامل تراز کردن اندازه تکه‌های متن (Chunk size)، مدل‌های جاسازی و بازرتب‌بندی (Reranking) با پنجره بافتی لایه مدل است.
لایه ابزار/MCP (پروتکل زمینه مدل): این لایه مدیریت فراخوان‌های ابزاری ساختاریافته و نتایج API را بر عهده دارد. با استفاده از Model Context Protocol (MCP) که توسط Anthropic معرفی شد، این پیوندها به‌عنوان «USB-C اتصالات ابزاری» استاندارد شده‌اند. با این حال، تغییرات ناگهانی در طرح‌واره (Schema drift) و شکست‌های خاموش ابزارها همچنان رایج است؛ MCP تنها زمانی کار می‌کند که هر ابزار مشخصات را به‌درستی پیاده‌سازی کند.
لایه سازمان‌دهی (LangGraph / AutoGen / CrewAI): این لایه گراف‌های وضعیت و مسیریابی عامل‌ها را مدیریت می‌کند. اینجا جایی است که قابلیت اطمینان فرو می‌پاشد؛ در یک خط لوله شش‌مرحله‌ای که هر مرحله ۹۷٪ قابل اعتماد باشد، موفقیت نهایی کل سیستم تنها حدود ۸۳٪ خواهد بود (۰.۹۷ به توان ۶ $\approx$ ۰.۸۳۳). شکست‌های رایج شامل حلقه‌های بی‌نهایت، گم شدن وضعیت (State) و خطاهای تجمعی در مراحل مختلف است.
لایه هماهنگی انسانی (لایه شازیر): شامل دانش سازمانی، تصمیمات معماری و شهود عیب‌یابی است. این تنها لایه‌ای است که هیچ جایگزین نرم‌افزاری ندارد. وقتی کسی مثل شازیر می‌رود، دانش هم با او می‌رود. هیچ مقدار منطق تکرار (Retry logic) نمی‌تواند این فقدان را جبران کند.

حرکت نوآم شازیِر و شکاف هماهنگی در فناوری هوش مصنوعی

پارادوکس مالی آلفابت

با وجود این ضربه استعدادی، بنیادی‌های مالی Alphabet همچنان قدرتمند است. در سه ماهه اول سال مالی ۲۰۲۶، آلفابت رشد سود ۸۲ درصدی نسبت به سال قبل را گزارش کرد. درآمد کل (TTM) به ۴۲۲.۵ میلیارد دلار رسید، رشد درآمد ربع‌سالی ۲۱.۸٪ بود و سود هر سهم (EPS) به ۱۳.۱۰ دلار رسید.

به‌طور خاص، گوگل کلاد با رشد ۶ دلیل ۶۳ درصدی به ۲۰.۰۳ میلیارد دلار رسید و مقدار سفارشات معوق (Backlog) آن تقریباً دو برابر شده و به بیش از ۴۶۰ میلیارد دلار رسیده است. علاوه بر این، Gemini API در حال پردازش بیش از ۱۶ میلیارد توکن در دقیقه است که نشان‌دهنده رشد متوالی ۶۰ درصدی است. کاربران فعال ماهانه پولی Gemini Enterprise نیز ۴۰٪ رشد ربع‌به‌ربع داشتند.

از دیدگاه بازار، سهام GOOGL حدود ۳۶۸.۰۳ دلار معامله می‌شود که ۱۷.۷۳٪ از ابتدای سال و ۱۱۲.۹۵٪ در یک سال گذشته رشد کرده است. این سهم دارای P/E آینده ۲۶ است و هیچ تحلیل‌گری رتبه «فروش» را به آن نداده است (۱۴ خرید قوی، ۴۳ خرید، ۷ نگه دار). هدف اجماعی قیمت ۴۳۲.۸۳ دلار است و برخی مدل‌های داخلی هدفی نزدیک به ۴۵۰ دلار (+۲۲٪ سود احتمالی) را پیشنهاد می‌دهند. بازارهای پیش‌بینی در حال حاضر ۸۰٪ احتمال می‌دهند که GOOGL تا پایان ماه بالای ۳۵۰ دلار بسته شود.

واقعیت عملیاتی برای کسب‌وکارها

برای اکثر شرکت‌ها، شکاف هماهنگی در مقیاس کوچک‌تر ظاهر می‌شود: همان تک‌مهندسی است که می‌داند چرا خط لوله RAG فقط سه‌شنبه‌ها توهم می‌زند یا چرا یک عامل در یک حلقه ابدی گیر می‌کند وقتی فراخوانی ابزار با زمان‌بندی (Timeout) مواجه می‌شود. وقتی آن فرد می‌رود، سیستم به یک «جعبه سیاه» غیرقابل تعمیر تبدیل می‌شود.

بررسی تفصیلی قابلیت‌ها:

لایه مدل: آماده تولید (Production-ready). Gemini، GPT و Claude برای تولید متن و استدلال چندوجهی تست شده‌اند، هرچند فاقد وضعیت (State) داخلی هستند.
لایه بازیابی: آماده تولید. پایگاه‌های داده برداری مانند Pinecone جستجوی شباهت را با تأخیر زیر ۱۰۰ میلی‌ثانیه در مقیاس بالا انجام می‌دهند. اما اگر اسناد top-k به‌طور خاموش اشتباه باشند، سیستم‌ها با اطمینان کامل توهم می‌زنند.
لایه ابزار/MCP: در حال تکامل. دسترسی استاندارد به ابزارها از طریق MCP به‌سرعت در حال پذیرش است اما هنوز در مرحله تثبیت قرار دارد.
لایه سازمان‌دهی: ترکیبی. LangGraph برای گراف‌های وضعیت‌دار در سطح تولید است، در حالی که AutoGen و CrewAI قدرتمند هستند اما با شکاف‌های نظارتی (Observability) پیش می‌روند.
لایه انسانی: جایگزین‌ناپذیر. بدون SLA و بدون شماره نسخه. این ریسک حیاتی برای هر مدیر هوش مصنوعی است.

هزینه‌ی استقرار یک سیستم عامل‌محور در سال ۲۰۲۶ قابل توجه است. توکن‌های مدل‌های پیشرو معمولاً بین ۳ تا ۱۵ دلار به ازای هر میلیون توکن ورودی قیمت دارند. یک عامل پشتیبانی با استفاده متوسط بین ۱۰۰ تا ۸۰۰ دلار در ماه هزینه دارد. پایگاه‌های داده برداری مانند Pinecone Serverless از رایگان تا ۵۰ تا ۵۰۰ دلار در ماه برای مجموعه‌های داده متوسط متغیر هستند. ابزارهای سازمان‌دهی مانند n8n Cloud بسته به تعداد کاربر و میزان استفاده، ۲۰ تا ۵۰۰ دلار در ماه هزینه دارند.

با این حال، هزینه واقعی، همان «لایه ۵» یا استعداد انسانی است. یک عامل کسب‌وکار کوچک ممکن است در مجموع ۲۰۰ تا ۲,۰۰۰ دلار در ماه هزینه داشته باشد، اما زمان مهندسی برای حفظ هماهنگی، هزینه غالب است. یک سیستم چندعاملی سازمانی می‌تواند به‌راحتی ماهانه ۱۰ تا ۱۰۰ هزار دلار یا بیشتر، شامل دستمزد متخصصان، هزینه داشته باشد.

نوام شازیر و شکاف هماهنگی: گلوگاه واقعی فناوری هوش مصنوعی

راهکار مقابله با شکاف هماهنگی

برای کاهش این ریسک، صنعت به سمت تبدیل دانش هماهنگی به «گراف‌های کنترل‌شده با نسخه» حرکت می‌کند. با ابزارهایی مثل LangGraph، تیم‌ها می‌توانند وضعیت‌های صریح، محافظ‌های تکرار (Retry guards) و مسیرهای ارجاع را تعریف کنند تا دانش در ذهن یک نفر زندانی نشود.

به‌عنوان مثال، یک تیم می‌تواند یک عامل وضعیت‌دار با TypedDict برای AgentState بسازد که شامل موارد زیر باشد:

query: str
retrieved_docs: list
answer: str
retries: int

آن‌ها می‌توانند یک گره بازیابی (لایه ۲) و یک گره تولید (لایه ۱) با یک محافظ تکرار خاص (لایه ۴) ایجاد کنند. اگر تعداد تکرارها از حد مجاز فراتر رود (مثلاً state['retries'] > 2)، سیستم باید به‌جای شکست خاموش، با بازگرداندن ESCALATE_TO_HUMAN به‌طور واضح اعلام شکست کند. این تضمین می‌کند که منطق هماهنگی یک گراف مستند است که مهندس بعدی می‌تواند آن را بخواند.

استراتژی انتخاب ابزار سازمان‌دهی

شکاف هماهنگی با افزودن هر عامل جدید بیشتر می‌شود. بسیاری از تیم‌ها بیش از حد سازمان‌دهی می‌کنند (Over-orchestrate)، هزینه‌ی توکن را سه برابر کرده و قابلیت اطمینان را بدون هیچ سودی کاهش می‌دهند. اگر یک کار با یک فراخوانی مدل به‌علاوه RAG قابل حل است، افزودن لایه چندعاملی معمولاً قابلیت اطمینان را کاهش می‌دهد.

RAG + تک‌مدل: برای پرس‌وپاسخ ساده روی اسناد. این روش با قابلیت اطمینان بیش از ۹۵٪ و بدون سربار هماهنگی است.
LangGraph: برای پژوهش‌های چندمرحله‌ای با ابزارها، جایی که یک مسیر وضعیت‌دار، قابل مشاهده و تکرارپذیر مورد نیاز است.
CrewAI / AutoGen: برای همکاری‌های نقش‌محور که در آن عامل‌ها متخصص‌اند (مثلاً پژوهشگر، نویسنده، منتقد)، هرچند باید مراقب خطاهای تجمعی بود.
n8n: برای اتوماسیون‌های بدون کد (No-code) کسب‌وکار (مانند پردازش مرجوعی‌ها) که باید توسط غیرمهندسان قابل نگهداری باشد. یک اپراتور تجارت الکترونیک با ترکیب n8n و Claude زمان رسیدگی را ۷۰٪ کاهش داد و سالانه ۴۸ هزار دلار صرفه‌جویی کرد.
کدنویسی ساده: برای تبدیل‌های داده‌ای قطعی جهت اجتناب از «مالیات غیرقطعی بودن» مدل‌ها.

تنش‌های بازار و پیش‌بینی‌ها

OpenAI برنده مطلق این میدان است و یکی از گره‌های گراف دانش بنیادین هوش مصنوعی مدرن را تصاحب کرد. منابع اشاره می‌کنند که جنگ استعدادی اکنون متغیر رقابتی اصلی در AI است. Microsoft نیز از طریق مشارکت‌های بازسازی‌شده خود سود می‌برد و کسب‌وکار AI آن به نرخ سالانه ۳۷ میلیارد دلار رسیده است که ۱۲۳٪ رشد سالانه را نشان می‌دهد.

با این حال، مایکروسافت با فشارهای خود روبروست. سهام این شرکت از ابتدای سال ۲۱.۲٪ کاهش یافته است زیرا سرمایه‌گذاران نگران شدت هزینه‌های سرمایه‌ای هستند. یک پست ترند شده در wallstreetbets با عنوان «ساتیا و زاکربرگ در حال سوزاندن سرمایه هستند»، فضای بازار را توصیف می‌کند.

آلفابت با ریسک واقعی در روحیه کارکنان و روایت برند مواجه است. اگر پژوهشگری در سطح شازیر سازمان را ترک کند، احتمال خروج دیگران افزایش می‌یابد و ریسک حفظ استعدادها بالا می‌رود. اگر بنچ‌مارک‌های Gemini در نیمه دوم ۲۰۲۶ از Anthropic یا OpenAI عقب بمانند، این سیگنال مستقیمی خواهد بود که فقدان استعدادهای هماهنگی بسیار شدید بوده است. با این حال، Waymo به گسترش خود ادامه می‌دهد و به ۵۰۰,۰۰۰ سفر کاملاً خودران در هفته رسیده است.

پیش‌بینی‌ها برای آینده:

نیمه دوم ۲۰۲۶: حفظ استعدادها به یک شاخص سطح هیئت‌مدیره تبدیل خواهد شد. آزمایشگاه‌ها ممکن است ساختارهای «دست‌بند طلایی» (Golden-handcuff) خود را در کنار بنچ‌مارک‌های مدل افشا کنند.
نیمه دوم ۲۰۲۶: نظارت بر بنچ‌مارک‌های Gemini به‌عنوان شاخص پیشرو برای سهام GOOGL تشدید خواهد شد.
۲۰۲۷: استاندارد MCP به پیش‌فرض هماهنگی تبدیل شده و شکاف لایه ابزار (لایه ۳) را کاهش می‌دهد، اما شکاف انسانی (لایه ۵) دست‌نخورده باقی می‌ماند.
۲۰۲۷: سازمان‌دهی حول ۲ یا ۳ چارچوب غالب یکپارچه می‌شود و پراکندگی برای توسعه‌دهندگان کاهش می‌یابد.

این زمان، زمان وحشت مالی نیست، بلکه زمان سخت‌گیری مهندسی است. هدف هر مدیر AI باید انتقال منطق هماهنگی از لایه انسانی به یک سیستم شفاف و مستند باشد. هر کسب‌وکار کوچکی که با AI اتوماسیون ایجاد کرده، تنها به اندازه یک استعفا با بحران لایه ۵ فاصله دارد. هماهنگی را مستند کنید، وگرنه شما مالک سیستم نیستید—پیمانکار شماست.

گام بعدی شما

منطق هماهنگی سیستم‌های خود را از کدهای پراکنده به گراف‌های وضعیت مستند (مانند LangGraph) منتقل کنید.
برای هر عامل هوشمند، یک «مسیر شکست صریح» تعریف کنید تا وابستگی به شهود یک مهندس خاص کاهش یابد.
در انتخاب بین تک‌مدل و سامانه‌های چندعاملی، اولویت را به سادگی بدهید تا نرخ خطای تجمعی کاهش یابد.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.