ساخت داور تعصبات با Gemma 4: هزینه ۳۰ دلاری در برابر دقت API

باید بدانید که ساخت یک داور دقیق برای شناسایی تعصبات هوش مصنوعی، دیگر نیازی به بودجه‌های میلیونی یا دسترسی به مدل‌های بسته ندارد. تصور کنید تنها با ۳۰ دلار بتوان ابزاری ساخت که عملکرد مدل‌های غول‌پیکر را در تشخیص کلیشه‌های اجتماعی به چالش بکشد.

ارزیابی تعصبات معمولاً یا به مدل‌های پیشرو (Frontier Models) گران‌قیمت نیاز دارد یا به بازبینی دستی انسان‌ها. همان‌طور که در تحلیل‌های پیشین ما درباره‌ی همراستاسازی مدل‌های زبانی اشاره کردیم، کنترل خروجی‌های مدل‌ها یکی از سخت‌ترین چالش‌های فعلی است. برای ساده‌تر شدن موضوع، مدل زبانی بزرگ (LLM) — تشبیه روزمره: مثل کتابخانه‌داری که میلیاردها صفحه را خوانده و حالا با همان لحن کتاب‌ها جواب می‌دهد — باید یاد بگیرد چه چیزهایی «تعصب» محسوب می‌شوند.

طبق گزارش منتشر شده در dev.to، در ۹ می ۲۰۲۶، یک توسعه‌دهنده خط لوله‌ای (Pipeline) را معرفی کرد که مدل Gemma 4 E4B را به یک ارزیاب با دقت بالا تبدیل می‌کند. این مدل از طریق Ollama اجرا می‌شود و طبق ادعای سازنده، ۳۲ برابر ارزان‌تر از داوران مبتنی بر API است.

این پروژه به جای تمرکز بر تنظیمات پیچیده، بر «طراحی برنامه آموزشی» متمرکز شده است. بر اساس مستندات این پروژه، فرآیند آموزش شامل موارد زیر بود:

تنظیم دقیق نظارتی (SFT) — تشبیه روزمره: مثل وقتی دانش‌آموزی پاسخ‌های درست را از روی کتاب می‌نویسد تا یاد بگیرد — با ۳٬۸۴۴ ردیف داده و استفاده از کوانتایزیشن لورا (QLoRA) — تشبیه روزمره: مثل یادداشت‌برداری خلاصه در حاشیه کتاب به جای بازنویسی کل متن — روی یک پردازنده A100 در ۸۸ دقیقه.
بهینه‌سازی مستقیم ترجیحات (DPO) — تشبیه روزمره: مثل وقتی معلم دو جواب را به شاگرد نشان می‌دهد و می‌گوید «این یکی بهتر است»، تا سلیقه درست را یاد بگیرد — با ۲٬۲۰۰ ردیف داده در ۲۰ دقیقه.
برچسب‌گذاری داده‌ها از طریق تطبیق نظرات سه مدل Claude Sonnet 4.6، GPT-5.4 و Qwen 3 235B.

Bar chart comparing Cohen's κ (agreement with human labels) across three models: Baseline, After SFT, and After SFT+DPO. On in-distribution data, performance improves steadily (0.481 → 0.647 → 0.682). On out-of-distribution religion data, SFT improves over baseline (0.542 → 0.695) but DPO regresses (0.695 → 0.643) — the opposite of the expected pattern.

تحلیل داده‌ها نشان می‌دهد که ترکیب SFT و DPO لزوماً یک ارتقای تضمینی نیست. در حالی که DPO دقت در شناسایی تعصبات ظریف را افزایش داد (ضریب کاپا از ۰٫۷۴۳ به ۰٫۸۹۰ رسید)، اما باعث شد عملکرد مدل در شناسایی تعصبات مذهبی (که در داده‌های آموزشی نبودند) از ۰٫۶۹۵ به ۰٫۶۴۳ سقوط کند. این یعنی مدل به جای درک کلی تعصب، صرفاً الگوهای خاص مجموعه آموزشی را حفظ کرده است.

گام بعدی شما

اگر از مدل‌های محلی استفاده می‌کنید، دستور ollama run hf.co/krishnakartik/gemma4-social-bias-judge-gguf:Q8_0 را اجرا کنید تا خروجی‌های مدل خود را با این داور بسنجید.
در پروژه‌های تنظیم دقیق (Fine-tuning) — تشبیه روزمره: مثل وقتی به یک پزشک عمومی، تخصص پوست می‌دهیم — مراقب باشید که DPO باعث کاهش قدرت تعمیم مدل نشود.
اولویت خود را از تغییر هایپرپارامترها به پاک‌سازی و دسته‌بندی دقیق داده‌ها تغییر دهید.

اما این هزینه پایین، تنها بخشی از ماجراست؛ برای درک اینکه چگونه مدل‌های کوچک‌تر در حال بلعیدن بازار مدل‌های غول‌پیکر می‌شوند، تحلیل ما درباره‌ی SLMها را بخوانید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

تنظیم دقیق نظارتی (SFT) — تشبیه روزمره: مثل وقتی دانش‌آموزی پاسخ‌های درست را از روی کتاب می‌نویسد تا یاد بگیرد — با ۳٬۸۴۴ ردیف داده و استفاده از کوانتایزیشن لورا (QLoRA) — تشبیه روزمره: مثل یادداشت‌برداری خلاصه در حاشیه کتاب به جای بازنویسی کل متن — روی یک پردازنده A100 در ۸۸ دقیقه.
بهینه‌سازی مستقیم ترجیحات (DPO) — تشبیه روزمره: مثل وقتی معلم دو جواب را به شاگرد نشان می‌دهد و می‌گوید «این یکی بهتر است»، تا سلیقه درست را یاد بگیرد — با ۲٬۲۰۰ ردیف داده در ۲۰ دقیقه.
برچسب‌گذاری داده‌ها از طریق تطبیق نظرات سه مدل Claude Sonnet 4.6، GPT-5.4 و Qwen 3 235B.

گام بعدی شما

اگر از مدل‌های محلی استفاده می‌کنید، دستور ollama run hf.co/krishnakartik/gemma4-social-bias-judge-gguf:Q8_0 را اجرا کنید تا خروجی‌های مدل خود را با این داور بسنجید.
در پروژه‌های تنظیم دقیق (Fine-tuning) — تشبیه روزمره: مثل وقتی به یک پزشک عمومی، تخصص پوست می‌دهیم — مراقب باشید که DPO باعث کاهش قدرت تعمیم مدل نشود.
اولویت خود را از تغییر هایپرپارامترها به پاک‌سازی و دسته‌بندی دقیق داده‌ها تغییر دهید.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

ساخت داور تعصبات با Gemma 4: هزینه ۳۰ دلاری در برابر دقت API

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

ساخت داور تعصبات با Gemma 4: هزینه ۳۰ دلاری در برابر دقت API

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

ساخت داور تعصبات با Gemma 4: هزینه ۳۰ دلاری در برابر دقت API

گام بعدی شما

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

ساخت داور تعصبات با Gemma 4: هزینه ۳۰ دلاری در برابر دقت API

گام بعدی شما

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران