چرا TRiP برای ساخت موتور ترنسفورمر، پایتون را به کل کنار گذاشت؟

اگر تصور می‌کنید با استفاده از PyTorch ساختار ترنسفورمرها را می‌شناسید، احتمالاً فقط یک توهم زیبا را دنبال می‌کنید. حقیقت این است که لایه‌های انتزاعی مدرن، شما را از درک واقعی ریاضیات پشت پرده‌ی هوش مصنوعی زاینده (Generative AI) دور می‌کنند.

پروژه‌ی TRiP (TRansformer in Progress) با یک هدف جسورانه متولد شد: حذف کامل پایتون و بازگشت به ریشه‌های جبر خطی روی آرایه‌های اعشاری. طبق اعلام توسعه‌دهنده در مخزن گیت‌هاب این پروژه، TRiP بین مارس ۲۰۲۴ تا آگوست ۲۰۲۵ توسعه یافته تا «درک کامل از تمام لایه‌ها» (Full-stack understanding) را از ضرب ماتریس‌ها به بالا به برنامه‌نویسان بازگرداند.

بر اساس مستندات TRiP، این موتور سبک‌وزن قابلیت‌های زیر را ارائه می‌دهد:

پشتیبانی از معماری‌ها: مدل‌های Llama 2، Gemma 1.0/1.1، مدل چندوجهی (Multimodal) PaliGemma 1 و GPT-2.
قابلیت آموزش: پیاده‌سازی کامل پس‌انتشار (Backpropagation) با استفاده از بهینه‌ساز AdamW، نرخ یادگیری با کاهش کسینوسی (Cosine Annealing) و برش گرادیان (Gradient Clipping).
مدیریت حافظه: استفاده از حالت بهینه‌شده‌ی RAM از طریق mmap که اجازه می‌دهد مدل‌های بزرگ روی سخت‌افزارهای محدود اجرا شوند.
فرمت‌های سازگار: پشتیبانی از SafeTensors (HuggingFace) و فرمت‌های Karpathy.

یک یافته‌ی فنی غافلگیرکننده در این پروژه این است که در پردازنده‌های مرکزی (CPU)، فرمت float32 به‌طور مداوم عملکرد بهتری نسبت به bfloat16 و float16 دارد؛ چرا که CPUهای مصرف‌کننده فعلی برای عملیات ممیز شناور خاص این فرمت‌ها بهینه نشده‌اند.

همان‌طور که در تحلیل‌های پیشین ما درباره‌ی بهینه‌سازی‌های سطح پایین (Low-level) در مدل‌های زبانی اشاره کردیم، حذف لایه‌های میانی منجر به کنترل مطلق بر مصرف منابع می‌شود. TRiP قصد رقابت با کتابخانه‌های فوق‌سریع مثل llama.cpp را ندارد، بلکه مانند یک «کتاب درسی» زنده عمل می‌کند تا توسعه‌دهندگان دقیقاً ببینند گرادیان‌ها چگونه در طول آموزش در شبکه جریان می‌یابند.

این رویکرد بازگشت به «سخت‌افزار عریان» (Bare-metal) می‌تواند تعریف ما از بهینه‌سازی برای نسل بعدی رایانش لبه (Edge Computing) را تغییر دهد. اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

گام بعدی شما

مخزن گیت‌هاب TRiP را بررسی کنید تا نحوه پیاده‌سازی عملیات ریاضی بدون کتابخانه را ببینید.
تفاوت عملکرد float32 و bfloat16 را روی CPU خود تست کنید.
سعی کنید یک مدل کوچک GPT-2 را با این موتور آموزش دهید تا جریان گرادیان‌ها را ردیابی کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

بر اساس مستندات TRiP، این موتور سبک‌وزن قابلیت‌های زیر را ارائه می‌دهد:

پشتیبانی از معماری‌ها: مدل‌های Llama 2، Gemma 1.0/1.1، مدل چندوجهی (Multimodal) PaliGemma 1 و GPT-2.
قابلیت آموزش: پیاده‌سازی کامل پس‌انتشار (Backpropagation) با استفاده از بهینه‌ساز AdamW، نرخ یادگیری با کاهش کسینوسی (Cosine Annealing) و برش گرادیان (Gradient Clipping).
مدیریت حافظه: استفاده از حالت بهینه‌شده‌ی RAM از طریق mmap که اجازه می‌دهد مدل‌های بزرگ روی سخت‌افزارهای محدود اجرا شوند.
فرمت‌های سازگار: پشتیبانی از SafeTensors (HuggingFace) و فرمت‌های Karpathy.

گام بعدی شما

مخزن گیت‌هاب TRiP را بررسی کنید تا نحوه پیاده‌سازی عملیات ریاضی بدون کتابخانه را ببینید.
تفاوت عملکرد float32 و bfloat16 را روی CPU خود تست کنید.
سعی کنید یک مدل کوچک GPT-2 را با این موتور آموزش دهید تا جریان گرادیان‌ها را ردیابی کنید.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چرا TRiP برای ساخت موتور ترنسفورمر، پایتون را به کل کنار گذاشت؟

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چرا TRiP برای ساخت موتور ترنسفورمر، پایتون را به کل کنار گذاشت؟

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چرا TRiP برای ساخت موتور ترنسفورمر، پایتون را به کل کنار گذاشت؟

گام بعدی شما

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چرا TRiP برای ساخت موتور ترنسفورمر، پایتون را به کل کنار گذاشت؟

گام بعدی شما

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران