اگر از رابط کاربری OpenAI Codex CLI خوشتان میآید اما استدلالهای Claude 3.5 Sonnet را ترجیح میدهید، یک راهکار ساده پیدا شده است. تصور کنید بتوانید بهترین ابزار مدیریت کد را داشته باشید، اما مغز متفکر آن را هر لحظه عوض کنید.
تا فوریه ۲۰۲۶، Codex CLI تنها به APIهای اختصاصی OpenAI متصل بود. این یعنی شما در یک زندان نرمافزاری بودید و نمیتوانستید از مدلهای رقیب استفاده کنید. این محدودیتها در حالی است که OpenAI همواره سعی کرده است کنترل محیطهای توسعه را در دست داشته باشد؛ همانطور که در تلاش برای انتقال کنترل محیط کدنویسی دسکتاپ به اپلیکیشن موبایل مشاهده شد، هدف اصلی حفظ یکپارچگی اکوسیستم در دست خود شرکت است. همانطور که در تحلیلهای قبلی ما دربارهی مدلهای وزنهای باز (Open Weights) — یعنی مدلهایی که «دستور پخت» آنها علناً منتشر شده و نه فقط غذای آماده — اشاره کردیم، آزادی در انتخاب مدل برای برنامهنویسان حیاتی است. در این وضعیت، مدل زبانی بزرگ (LLM) — مثل کتابخانهداری که میلیاردها صفحه را خوانده و حالا با همان لحن جواب میدهد — باید در دسترسترین حالت ممکن باشد.
طبق گزارش وبسایت dev.to، این راهکار از Cadenza.Agent استفاده میکند. این ابزار یک SDK برای .NET 10 است که یک فایل ساده را به یک سرور فعال تبدیل میکند. اجزای کلیدی این سیستم عبارتند از:
- OpenRouter: به عنوان واسط برای دسترسی به مدلهای Claude 3.5 Sonnet یا Llama.
- CODEX_HOME: متغیری که اجازه میدهد تنظیمات محلی بدون تغییر در سیستم کلی اعمال شود.
- model_catalog_json: فایلی برای تعریف متادیتای مدلها تا Codex خطای عدم شناسایی ندهد.

به باور تحلیلگران، این روش باعث جداسازی کامل رابط کاربری از مدل میشود. شما دیگر مجبور نیستید بین یک محیط کاربری عالی و یک مدل هوشمند انتخاب کنید. با کنترل این پروکسی، میتوانید حتی بین یک مدل محلی در Ollama و یک مدل ابری جابهجا شوید تا هزینه استنتاج (Inference) — یعنی همان لحظهی تولید جواب که شبیه به خودِ آشپزی است و نه دورهی آموزش — را مدیریت کنید. این رویکردِ استفاده از زیرساختهای محلی، یادآور استراتژی OpenAI برای استقرار Codex در سرورهای محلی Dell است که سعی داشت تعادلی میان قدرت پردازش ابری و امنیت سرورهای داخلی ایجاد کند.
گام بعدی شما
- محیط .NET 10 را نصب کنید تا بتوانید از قابلیتهای جدید SDK بهره ببرید.
- قالبهای Cadenza را برای استقرار بکاندهای شخصیسازی شده امتحان کنید.
- مدلهای محلی خود را از طریق Ollama به این پل ارتباطی متصل کنید.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است؛ اثر این مدلهای سبک بر مصرف GPU را در گزارش بعدی بررسی خواهیم کرد.
گفتگو