مدل GLM-5.2 با پنجرهٔ زمینه یک میلیون توکنی و مجوز MIT منتشر شد

اگر برای مدیریت مخازن عظیم کد در حال توسعهٔ عامل‌های هوشمند هستید، اکنون یک گزینهٔ قدرتمند با وزن‌های باز در اختیار دارید. در ۲۰ ژوئن ۲۰۲۶، شرکت Z.ai از مدل GLM-5.2 پرده‌برداری کرد؛ مدل پرچمی که به‌طور خاص برای مأموریت‌های طولانی‌مدت و جلسات پیچیدهٔ عیب‌یابی مهندسی شده است.

بسیاری از مدل‌های پیشرفتهٔ برنامه‌نویسی پشت مجوزهای محدود یا APIهای بسته پنهان شده‌اند. انتشار این مدل با مجوز MIT، موانع قانونی را برای شرکت‌های تجاری که قصد تنظیم دقیق (Fine-tuning) — مثل وقتی به یک پزشک عمومی، تخصص پوست می‌دهیم تا روی یک حوزه دقیق شود — یا استقرار عامل‌های محلی را دارند، به‌شدت کاهش می‌دهد. تصور کنید برنامه‌نویسی در یک شرکت کوچک نرم‌افزاری حالا می‌تواند مدلی در سطح مدل‌های پیشرو را روی سخت‌افزار خودش اجرا کند، بدون اینکه نگران شرایط محدودکنندهٔ «فقط برای پژوهش» باشد. در این راستا، ابزارهایی مانند OpenEnv تلاش می‌کنند تا فاصلهٔ کارایی بین این مدل‌های متن‌باز و جایگزین‌های تجاری را پر کنند.

زمینه و قابلیت‌ها

شرکت Z.ai مدل GLM-5.2 را نه صرفاً به عنوان یک مدل چت، بلکه به عنوان ابزاری جدی برای کارهای طولانی‌مدت عامل‌های برنامه‌نویسی معرفی کرده است. این کاربردها شامل نیازمندی‌های مربوط به مخازن کد بزرگ، اجرای پژوهش‌های عمیق و عیب‌یابی‌های پیچیده است.

بر اساس مستندات Z.ai، این مدل صرفاً یک چت‌بات نیست، بلکه ابزاری جدی برای گردش‌های کاری طولانی است. همان‌طور که در تحلیل‌های پیشین ما درباره‌ی امنیت مدل‌های بازمتن اشاره کردیم، کنترل روی لایه‌های استقرار در مدل‌های محلی، امنیت داده‌های حساس کد را تضمین می‌کند. این مدل برای تحلیل مخازن بزرگ و پژوهش‌های عمیق طراحی شده است.

به نقل از وبلاگ رسمی Z.ai، این مدل برای مدیریت یک پنجرهٔ زمینه (Context Window) — شبیه میز کاری که جا برای چند ورق دارد، نه برای کل کتابخانه — با ظرفیت ۱ میلیون توکن (Token) ساخته شده است. این ظرفیت اجازه می‌دهد یک عامل (Agent) تمام کدهای یک پروژه یا تاریخچهٔ طولانی وظایف را در میدان دید خود نگه دارد و نیاز به تکه‌بندی شدید داده‌ها در خط لوله‌های بازیابی (Retrieval Pipelines) را به‌شدت کاهش دهد. این قابلیت تحولی در نحوه مدیریت کل پروژه به‌جای ویرایش‌های تکه‌ای است. بستهٔ ارائه‌شده شامل وزن‌های باز در Hugging Face (تحت zai-org/GLM-5.2) و یک نسخهٔ FP8 برای بهینه‌سازی عملکرد است.

مشخصات فنی و بنچمارک‌ها

Z.ai گزارش می‌دهد که در عملکرد عامل‌محور (Agentic Performance)، جهشی قابل‌توجه نسبت به نسخه ۵.۱ داشته است. نمرات گزارش‌شده توسط فروشنده به شرح زیر است:

SWE-bench Pro: ۶۲.۱
Terminal Bench 2.1: ۸۱.۰
Terminal Bench (بهترین حالت گزارش‌شده): ۸۲.۷
MCP-Atlas (مجموعه عمومی): ۷۶.۸

این نتایج را می‌توان در کنار مقایسه‌های مستقیم GLM-5.2 با GPT-5.5 در کدنویسی بلندمدت تحلیل کرد تا برتری این مدل در محیط‌های باز مشخص شود.

استقرار و یکپارچه‌سازی

برای تضمین پذیرش سریع، این مدل از چندین استک استنتاج اصلی پشتیبانی می‌کند. مسیرهای سرویس‌دهی محلی در حال حاضر برای vLLM، SGLang، Transformers، KTransformers، Unsloth و استقرار روی Ascend NPU آماده است. حتی llama.cpp در همان روز به‌روزرسانی b9736 را منتشر کرد تا باگی را برطرف کند که در آن نبود تانسورهای ایندکس‌کنندهٔ DSA باعث شکست در بارگذاری فایل‌های GGUF مدل GLM-5.2 می‌شد.

علاوه بر این، Z.ai یک صفحهٔ رسمی مستندات توسعه‌دهندگان را برای کسانی که به‌جای میزبانی محلی، دسترسی به API از طریق پلتفرم آن‌ها را ترجیح می‌دهند، فراهم کرده است.

برای یک توسعه‌دهندهٔ کاربردی، این اتفاق گلوگاه را از «کدام مدل در دسترس است» به «چقدر VRAM (حافظهٔ ویدیایی) دارم» تغییر می‌دهد. در حالی که پنجرهٔ ۱ میلیونی یک ویژگی تغییردهنده در محصول است، اما فشار حافظه‌ای عظیم، مشکلات مربوط به نرخ انتقال داده (Throughput) و پیچیدگی‌های زمان‌بندی ایجاد می‌کند. به باور ما، منطقی است که پیش از اقدام برای مهاجرت کامل به تولید محلی، ابتدا با استفاده از APIهای میزبان شروع کنید.

این عرضه، رقابت در فضای مدل‌های با وزن‌های باز را شعله‌ور می‌کند. GLM-5.2 اکنون مستقیماً با خانواده‌های Llama، Mistral، Qwen و DeepSeek رقابت می‌کند و به‌جای چت ساده، به‌طور خاص روی «مسیرهای عملیاتی عامل‌ها» (Agent Trajectories) تمرکز دارد. اثر ثانویهٔ این اتفاق، کالایی شدن سریع‌تر استدلال‌های با زمینهٔ طولانی برای مهندسی نرم‌افزار است.

گام بعدی شما

اگر قصد استقرار این مدل را دارید، به‌جای تکیه صرف بر بنچمارک‌های عمومی، ارزیابی‌های خود را روی مخازن کد واقعی اجرا کنید. ابتدا پنجره‌های زمینهٔ کوچک‌تر را تست کنید تا تأخیر (Latency) را بسنجید و سپس به مرز ۱ میلیون توکن بروید. تا زمان تثبیت استک سرویس‌دهی شما، یک مدل جایگزین (Fallback) را در محیط تولید نگه دارید.

اما تأثیر این دسترسی باز بر هزینهٔ عملیاتی تیم‌های توسعه حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی بهینه‌سازی هزینه استنتاج مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

مدل GLM-5.2 با پنجرهٔ زمینه یک میلیون توکنی و مجوز MIT منتشر شد

زمینه و قابلیت‌ها

مشخصات فنی و بنچمارک‌ها

استقرار و یکپارچه‌سازی

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

مدل GLM-5.2 با پنجرهٔ زمینه یک میلیون توکنی و مجوز MIT منتشر شد

زمینه و قابلیت‌ها

مشخصات فنی و بنچمارک‌ها

استقرار و یکپارچه‌سازی

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

مدل GLM-5.2 با پنجرهٔ زمینه یک میلیون توکنی و مجوز MIT منتشر شد

زمینه و قابلیت‌ها

مشخصات فنی و بنچمارک‌ها

استقرار و یکپارچه‌سازی

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

مدل GLM-5.2 با پنجرهٔ زمینه یک میلیون توکنی و مجوز MIT منتشر شد

زمینه و قابلیت‌ها

مشخصات فنی و بنچمارک‌ها

استقرار و یکپارچه‌سازی

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

راهنمای فارسی هوش مصنوعی — با نگاه به ایران