چرا اجرای محلی، عملیترین مسیر برای کاربرِ ایرانی است
سرویسهای ابریِ هوش مصنوعی مثلِ ChatGPT و Claude از ایران مسدودند و نسخهٔ کاملشان پرداختِ بینالمللی میخواهد. اما یک راهِ سوم هست که هر دو مانع را دور میزند: اجرای مدل روی کامپیوترِ خودتان. مدلهای «متنباز» (open-weight) را میتوان دانلود کرد و بهصورتِ کاملاً محلی اجرا کرد — بدونِ اینترنتِ خارجی، بدونِ پرداخت، و با حفظِ کاملِ حریمِ خصوصی، چون هیچ دادهای از سیستمِ شما بیرون نمیرود. این راهنما نشان میدهد چطور شروع کنید.
چه چیزی لازم دارید
برای شروع به سختافزارِ خیلی خاصی نیاز ندارید. یک مدلِ کوچک (حدودِ ۷ تا ۸ میلیارد پارامتر) روی سیستمی با حدودِ ۸ گیگابایت رم اجرا میشود؛ روی پردازندهٔ معمولی کندتر است و با کارتِ گرافیک بهمراتب سریعتر. هرچه رم و کارتِ گرافیکِ قویتری داشته باشید، مدلهای بزرگتر و باکیفیتتر را هم میتوانید اجرا کنید. نکتهٔ مهم این است: لازم نیست بهترین سختافزار را داشته باشید تا شروع کنید.
سادهترین راه: Ollama
راحتترین نقطهٔ شروع، ابزارِ رایگانی به نامِ Ollama است. آن را نصب میکنید و با یک فرمانِ ساده، مدلِ دلخواه را دانلود و اجرا میکنید — مثلِ ollama run llama3. اگر با خطِ فرمان راحت نیستید، LM Studio یک گزینهٔ گرافیکی است که همان کار را با چند کلیک انجام میدهد. هر دو رایگاناند و کاملاً محلی کار میکنند؛ هیچچیز به سرورِ خارجی فرستاده نمیشود.
از کدام مدل شروع کنیم
برای شروع، یک مدلِ کوچک و متعادل انتخاب کنید: Llama (نسخهٔ ۸ میلیاردی) یا Qwen گزینههای خوبیاند که هم کیفیتِ قابلِقبولی دارند و هم روی سیستمِ معمولی اجرا میشوند. برای کارِ فارسی، Qwen معمولاً از بقیه روانتر است. اگر سختافزارِ قویتری دارید، میتوانید سراغِ نسخههای بزرگترِ همین مدلها بروید که کیفیتِ بالاتری دارند. DeepSeek هم اگر تمرکزتان استدلال و محاسبه است گزینهٔ خوبی است.
چه انتظاری داشته باشید
صادقانه بگوییم: کیفیتِ این مدلها معمولاً یک پله پایینترِ از پیشروهای بسته مثلِ ChatGPT است — نزدیک، ولی نه دقیقاً برابر. سرعت هم به سختافزارِ شما بستگی دارد؛ با کارتِ گرافیک روان است و روی پردازندهٔ معمولی صبر میخواهد. در عوض، سه چیز را بهدست میآورید که در مسیرِ ابری ندارید: رایگانبودن، استقلال از مسدودسازی، و حریمِ خصوصیِ کامل. برای بیشترِ کارهای روزمره — نوشتن، ترجمه، خلاصهسازی، کدنویسیِ ساده — همین کافی است.
جمعبندی
برای کاربرِ ایرانی، اجرای محلیِ مدلهای متنباز پایدارترین مسیر است: نه مسدود میشود، نه پولی میخواهد، و دادهتان پیشِ خودتان میماند. از کوچک شروع کنید — Ollama را نصب کنید و یک مدلِ ۸ میلیاردیِ Llama یا Qwen را امتحان کنید — و هرچه جلوتر رفتید و سختافزارتان اجازه داد، به مدلهای بزرگتر ارتقا دهید. مهم این است که همین امروز، با همان سیستمی که دارید، میتوانید شروع کنید.



گفتگو