از ویرایش تکه‌ای به مدیریت کل پروژه؛ سازوکار یک میلیون توکنی GLM-5.2

اگر یک مخزن نرم‌افزاری متوسط را مدیریت می‌کنید، حالا می‌توانید تمام کدها، شامل فایل‌های منبع، تست‌ها و تنظیمات را یک‌باره در یک جلسه فعال بارگذاری کنید. این همان تغییر کاربردی است که Z.ai با عرضه مدل GLM-5.2 در ۱۳ ژوئن ۲۰۲۶ به ارمغان آورده است.

برای اکثر برنامه‌نویسان، پنجره متنی (Context Window) — شبیه میز کاری است که جا برای چند ورق دارد و نه برای کل کتابخانه — همیشه یک گلوگاه بوده است. این محدودیت باعث می‌شد عامل‌های هوشمند مجبور شوند مدام بخش‌های قدیمی گفتگو را فراموش یا خلاصه کنند. تصور کنید یک معمار دیجیتال دیگر نیاز نداشته باشد مدام صفحات نقشه‌ها را ورق بزند، چون کل پروژه روی یک میز غول‌پیکر پیش روی او گسترده شده است. این به‌روزرسانی دقیقاً برای رفع همین اصطکاک در کدنویسی عامل‌محور طراحی شده است.

زمینه و زمان‌بندی عرضه

همان‌طور که در تحلیل‌های قبلی ما درباره‌ی تکامل عامل‌های کدنویسی اشاره کردیم، مدیریت حافظه کلید بهره‌وری است. طبق گزارش Marktechpost، مدل GLM-5.2 چهارمین عرضه پرچم‌دار این شرکت در چهار ماه اخیر است. این چرخه سریع استقرار با عرضه GLM-5 در ۱۱ فوریه آغاز شد و در ادامه، GLM-5-Turbo در ۱۵ مارس و GLM-5.1 در ۷ آوریل منتشر شدند.

بر اساس مستندات فنی، ویژگی برجسته این نسخه، پنجره ورودی یک میلیون توکنی است که در پیکربندی Z.ai با نام glm-5.2[1m] شناخته می‌شود. این مقدار نشان‌دهنده افزایش ۵ برابری نسبت به پنجره ۲۰۰ هزار توکنی موجود در GLM-5.1 است. با نگه داشتن کل یک مخزن در حافظه فعال، مدل از خلاصه‌سازی‌های مکرری که پنجره‌های کوچک‌تر تحمیل می‌کردند، رها می‌شود.

جزئیات و مشخصات فنی

جزئیات فنی این مدل به شرح زیر است:

پنجره متنی: ۱,۰۰۰,۰۰۰ توکن ورودی (glm-5.2[1m]).
ظرفیت خروجی: حداکثر ۱۳۱,۰۷۲ توکن خروجی در هر پاسخ.
حالت‌های استدلال: دو سطح تلاش برای تفکر شامل 'High' و 'Max'. شرکت Z.ai حالت Max را برای کارهای پیچیده و چندمرحله‌ای کدنویسی توصیه می‌کند.
معماری: اگرچه در زمان عرضه به‌طور رسمی مشخص نشد، اما یادداشت‌های جامعه توسعه‌دهندگان حاکی از یک ستون فقرات ترکیب خبرگان (MoE) با ۷۴۴ میلیارد پارامتر است که در هر توکن ۴۰ میلیارد پارامتر را فعال می‌کند. مدل GLM-5.1 نیز از همین ستون فقرات با بازآموزی (post-training) هدفمند استفاده می‌کرد.
لایسنس: مجوز MIT (وزن‌های مدل هفته آینده منتشر می‌شوند).
سازگاری با ابزارها: پشتیبانی از ۸ ابزار عامل‌محور از روز اول، از جمله Claude Code، Cline، OpenCode و OpenClaw.

ادغام و راه‌اندازی

برای استفاده از این مدل در Claude Code، توسعه‌دهندگان باید فایل ~/.claude/settings.json را ویرایش کنند. کاربران باید اسلات‌های Sonnet و Opus را به glm-5.2[1m] تغییر دهند و مقدار ANTHROPIC_DEFAULT_HAIKU_MODEL را روی glm-4.5-air تنظیم کنند. نکته حیاتی این است که کاربران باید مقدار CLAUDE_CODE_AUTO_COMPACT_WINDOW را به ۱,۰۰۰,۰۰۰ افزایش دهند تا از بریدن زودهنگام متن توسط عامل جلوگیری شود.

در یک جلسه فعال، دستور /effort سطح استدلال را کنترل می‌کند. گزینه‌های xhigh ،max و ultracode همگی به سطح Max در GLM-5.2 متصل هستند. پس از پیکربندی، کاربران می‌توانند دستور /status را اجرا کنند تا فعال بودن glm-5.2[1m] را تأیید نمایند.

برای کسانی که از Cline استفاده می‌کنند، راه‌اندازی نیازمند ارائه‌دهنده OpenAI Compatible با آدرس پایه https://api.z.ai/api/coding/paas/v4 است. به‌طور جایگزین، می‌توان از متغیرهای محیطی برای تنظیم ANTHROPIC_BASE_URL روی https://api.z.ai/api/anthropic استفاده کرد تا جایگزینی مستقیم برای آدرس پایه و شناسه مدل صورت گیرد.

پرسش درباره بنچمارک‌ها

یک شکاف بزرگ در این عرضه وجود دارد: Z.ai هیچ نمره بنچمارکی را منتشر نکرد. در حال حاضر هیچ عددی برای آزمون‌های SWE-bench، Terminal-Bench یا Code Arena ارائه نشده تا ثابت کند کیفیت استدلال در کنار افزایش حجم پنجره متنی بهبود یافته است. برای مقایسه، نسخه GLM-5.1 نمره ۵۸.۴ در SWE-bench Pro داشت.

این تصمیم نشان‌دهنده چرخش از بنچمارک‌های «هوش» به سمت بنچمارک‌های «کاربردی» است. Z.ai شرط‌بندی کرده که توانایی ردیابی وابستگی‌های بین‌فایلی — مثلاً بازسازی یک خط لوله داده پایتون در ۴۰ فایل مختلف در یک جلسه — ارزشمندتر از رتبه‌بندی در جدول‌های رقابتی است.

برای کاربر نهایی، این یعنی چرخه «برنامه‌ریزی-اجرا-تست-اصلاح» می‌تواند برای مدت بسیار طولانی‌تری اجرا شود. در حالی که GLM-5.1 حدود ۱,۷۰۰ گام عامل را در ۸ ساعت پشتیبانی می‌کرد، GLM-5.2 برای گسترش این مسیر طراحی شده است. این قابلیت به‌ویژه برای تحلیل اسناد حجیم، مشخصات فنی طولانی، لاگ‌ها یا متن‌های پیاده‌شده‌ای که از ۲۰۰ هزار توکن فراتر می‌روند، مفید است.

توسعه‌دهندگان در حال حاضر می‌توانند از طریق تمامی سطوح طرح کدنویسی GLM، شامل Lite، Pro، Max و Team به این مدل دسترسی داشته باشند.

گام بعدی شما

اگر از ابزار Cline یا Claude Code استفاده می‌کنید، تنظیمات پنجره متنی را به ۱ میلیون توکن تغییر دهید تا از بریدگی کدها جلوگیری کنید.
برای پروژه‌هایی با بیش از ۲۰ فایل وابسته، حالت استدلال را روی Max قرار دهید تا وابستگی‌های متقاطع به‌درستی شناسایی شوند.
در صورت عدم دسترسی به API، منتظر انتشار وزن‌های مدل در هفته آینده باشید تا آن را به‌صورت محلی اجرا کنید.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

زمینه و زمان‌بندی عرضه

جزئیات و مشخصات فنی

جزئیات فنی این مدل به شرح زیر است:

پنجره متنی: ۱,۰۰۰,۰۰۰ توکن ورودی (glm-5.2[1m]).
ظرفیت خروجی: حداکثر ۱۳۱,۰۷۲ توکن خروجی در هر پاسخ.
حالت‌های استدلال: دو سطح تلاش برای تفکر شامل 'High' و 'Max'. شرکت Z.ai حالت Max را برای کارهای پیچیده و چندمرحله‌ای کدنویسی توصیه می‌کند.
معماری: اگرچه در زمان عرضه به‌طور رسمی مشخص نشد، اما یادداشت‌های جامعه توسعه‌دهندگان حاکی از یک ستون فقرات ترکیب خبرگان (MoE) با ۷۴۴ میلیارد پارامتر است که در هر توکن ۴۰ میلیارد پارامتر را فعال می‌کند. مدل GLM-5.1 نیز از همین ستون فقرات با بازآموزی (post-training) هدفمند استفاده می‌کرد.
لایسنس: مجوز MIT (وزن‌های مدل هفته آینده منتشر می‌شوند).
سازگاری با ابزارها: پشتیبانی از ۸ ابزار عامل‌محور از روز اول، از جمله Claude Code، Cline، OpenCode و OpenClaw.

ادغام و راه‌اندازی

پرسش درباره بنچمارک‌ها

گام بعدی شما

اگر از ابزار Cline یا Claude Code استفاده می‌کنید، تنظیمات پنجره متنی را به ۱ میلیون توکن تغییر دهید تا از بریدگی کدها جلوگیری کنید.
برای پروژه‌هایی با بیش از ۲۰ فایل وابسته، حالت استدلال را روی Max قرار دهید تا وابستگی‌های متقاطع به‌درستی شناسایی شوند.
در صورت عدم دسترسی به API، منتظر انتشار وزن‌های مدل در هفته آینده باشید تا آن را به‌صورت محلی اجرا کنید.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

از ویرایش تکه‌ای به مدیریت کل پروژه؛ سازوکار یک میلیون توکنی GLM-5.2

زمینه و زمان‌بندی عرضه

جزئیات و مشخصات فنی

ادغام و راه‌اندازی

پرسش درباره بنچمارک‌ها

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

از ویرایش تکه‌ای به مدیریت کل پروژه؛ سازوکار یک میلیون توکنی GLM-5.2

زمینه و زمان‌بندی عرضه

جزئیات و مشخصات فنی

ادغام و راه‌اندازی

پرسش درباره بنچمارک‌ها

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

از ویرایش تکه‌ای به مدیریت کل پروژه؛ سازوکار یک میلیون توکنی GLM-5.2

زمینه و زمان‌بندی عرضه

جزئیات و مشخصات فنی

ادغام و راه‌اندازی

پرسش درباره بنچمارک‌ها

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

از ویرایش تکه‌ای به مدیریت کل پروژه؛ سازوکار یک میلیون توکنی GLM-5.2

زمینه و زمان‌بندی عرضه

جزئیات و مشخصات فنی

ادغام و راه‌اندازی

پرسش درباره بنچمارک‌ها

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران