اگر روی کدهای حساس شرکت کار میکنید، هر پرامپتی که به مدلهای ابری میفرستید یک ریسک امنیتی است. تصور کنید تمام قدرت یک مدل پیشرفته را داشته باشید، اما هیچ دادهای از کامپیوتر شما خارج نشود.
این رویکرد، فلسفه «اول محلی» را مستقیماً به محیط کدنویسی میآورد. همانطور که در تحلیل قبلی ما دربارهی رایانش لبه (Edge Computing) اشاره کردیم، هدف این است که کامپیوتر شما از یک کلاینت ساده به یک گره محاسباتی حاکمیتی تبدیل شود. برای این کار باید از مدل زبانی بزرگ (LLM) استفاده کنید؛ یعنی ابزاری مثل کتابخانهداری که میلیاردها صفحه را خوانده و حالا با همان لحن کتابها جواب میدهد.
مرکز این راهکار، اجرای مدل qwen3-coder:30b روی پلتفرم Ollama است. به نقل از راهنمای منتشر شده در dev.to در ۷ ژوئن ۲۰۲۶، این مدل از معماری «ترکیب خبرگان» (MoE) استفاده میکند و برای هر توکن تنها ۳.۳ میلیارد پارامتر فعال دارد. این مدل پنجره متنی (Context Window) عظیم ۲۵۶ هزار توکنی را پشتیبانی میکند و بر اساس دادههای HumanEval، عملکردی بهتر از GPT-4o دارد.

بزرگترین چالش فعلی، سختافزار است. برای اجرای مدل ۳۰ میلیاردی، یک دستگاه Apple M4 Pro با ۴۸ گیگابایت حافظه یکپارچه توصیه میشود. نیاز به رم بر اساس اندازه مدل تغییر میکند:
- ۱۶ گیگابایت رم: مدلهای ۷ تا ۸ میلیاردی (مثل Llama 3.2)
- ۳۲ گیگابایت رم: مدلهای ۱۴ تا ۲۰ میلیاردی (مثل GPT-OSS)
- ۴۸ گیگابایت رم: مدلهای ۳۰ تا ۳۵ میلیاردی (مثل Qwen3-Coder)
طبق مستندات، این سیستم با ابزارهای مختلف سازگار است. برای Claude Code باید متغیر محیطی ANTHROPIC_BASE_URL را تغییر دهید. کاربران Cursor میتوانند گزینه "Override OpenAI Base URL" را فعال کنند و در Pi (pi.dev) مدیریت نقاط اتصال محلی از طریق فایل models.json انجام میشود.
این تغییر، تعریف «عملکرد پیشرو» را عوض میکند. اگرچه مدلهای ابری هنوز در معماریهای پیچیده برترند، اما مدلهای محلی اکنون ۸۰٪ کارهای روزمره را پوشش میدهند. شما در واقع کمی از قدرت استدلال سطح بالا میبخشید تا در عوض، حاکمیت کامل بر محاسبات و حذف محدودیتهای نرخ پاسخ (Rate Limits) را به دست آورید. در این حالت، استنتاج (Inference) — یعنی همان لحظهای که مدل واقعاً جواب تولید میکند، شبیه خودِ آشپزی است، نه دورهی آموزش آشپز؛ چون تمام مواد اولیه در سیستم شماست.
گام بعدی شما
- بررسی کنید آیا رم سیستم شما به آستانه ۳۲ یا ۴۸ گیگابایت میرسد یا خیر.
- اگر ۶۴ گیگابایت رم دارید، مدل deepseek-r1:70b را امتحان کنید تا ببینید آیا مدل استدلالی (Reasoning Model) — مثل شطرنجبازی که چند حرکت جلوتر را میبیند — میتواند جایگزین کامل ابزارهای ابری شما شود.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.

گفتگو