صاحبان کسبوکارهایی که امروز هزینههای سرسامآوری بابت اجاره GPU پرداخت میکنند، باید به معماری سختافزاری OpenAI دقت کنند. این شرکت تصمیم گرفته است تمام لایههای زنجیره تولید را در اختیار بگیرد و با معرفی Jalapeño، دوران وابستگی مطلق به پردازندههای عمومی را به چالش بکشد.
به نقل از بیانیه مشترک در ۲۴ ژوئن ۲۰۲۶، این پردازنده نخستین «پردازنده هوش» اختصاصی OpenAI است که با همکاری شرکت Broadcom طراحی شده است. کنترل روی سیلیکون به این شرکت اجازه میدهد مدلها را سریعتر و پایدارتر اجرا کند و همزمان هزینههای جاری را بهشدت کاهش دهد. همانطور که در تحلیل قبلی ما دربارهی امنیت مدلهای بازمتن اشاره کردیم، بهینهسازی لایههای زیرین، کلید دستیابی به مقیاسهای جدید است. این حرکت در واقع تکرار روند کلی صنعت است؛ جایی که آزمایشگاههای بزرگ AI برای رهایی از محدودیتهای پردازندههای گرافیکی (GPU) — که شبیه به اجاره یک آشپزخانه صنعتی گرانقیمت برای پخت هر وعده غذاست — به سمت سختافزارهای سفارشی میروند.
بر اساس مستندات منتشرشده، تراشه Jalapeño برخلاف مدلهای اصلاحشده، از پایه برای استنتاج (Inference) — یعنی همان لحظهای که مدل واقعاً جواب تولید میکند، شبیه به خودِ آشپزی و نه دورهی آموزش آشپز — طراحی شده است. این پروژه بر پایه یک شراکت سهجانبه پیش میرود:
- OpenAI: مسئولیت طراحی هسته تراشه را بر عهده دارد و برای تسریع این مسیر، از مدلهای خود استفاده کرده است.
- Broadcom: خدمات تولید سیلیکون و فناوری شبکه Tomahawk را فراهم میکند.
- Celestica: مدیریت بردها، رکها و یکپارچهسازی سیستم را بر عهده دارد.
طبق اعلام OpenAI، چرخه «طراحی تا تولید» تنها ۹ ماه زمان برده است. اگرچه اعداد رسمی تأیید نشدهاند، اما تستهای داخلی نشان میدهد بازدهی هر وات در این تراشه بهطور قابلتوجهی بهتر از سختافزارهای فعلی است. در حال حاضر نمونههای مهندسی در حال اجرای عملیاتی مدل GPT-5.3-Codex-Spark هستند که پیشتر بر روی سختافزارهای Cerebras اجرا میشد.
این چرخش به سمت یکپارچگی عمودی نشان میدهد که OpenAI کارایی را مرز اصلی برای نسل بعدی عاملها میبیند. با بهینهسازی جابهجایی دادهها، این شرکت میکوشد وابستگی به شتابدهندههای شخص ثالث را به کلی قطع کند.
به گزارش منابع صنعتی، هاک تان، مدیرعامل Broadcom، پیشبینی میکند نخستین استقرار در مقیاس گیگاوات تا اواخر سال ۲۰۲۶ رخ دهد. گفته میشود در این مسیر، Broadcom از مایکروسافت خواسته است تا برای تضمین فاز اول پروژه، خرید ۴۰ درصد از این تراشهها را تضمین کند.
گام بعدی شما
- تحلیل کنید که آیا کاهش هزینه استنتاج میتواند قیمت اشتراکهای سازمانی مدلهای OpenAI را پایین بیاورد؟
- روند تغییرات سختافزاری از GPUهای عمومی به ASICهای اختصاصی را در نقشهراه سال ۲۰۲۶ دنبال کنید.
- بررسی کنید که آیا کاهش تأخیر سختافزاری، امکان اجرای عاملهای پیچیدهتر را در زمان واقعی فراهم میکند یا خیر.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.




گفتگو