سازوکار NutriMLLM: عبور از بن‌بست داده با ۱.۱ میلیون تصویر مصنوعی

باید بدانید که تخمین دقیق ۶۵ ریزمغذی مختلف از روی یک تصویر غذا، از یک مسئله‌ی بالینی «ناممکن» به یک چالش مهندسی تبدیل شده است. این پیشرفت به معنای آن است که مدل‌های بینایی-زبانی اکنون می‌توانند با دقتی بی‌سابقه، پروفایل‌های تغذیه‌ای پیچیده را تنها با یک نگاه تحلیل کنند.

دسترسی به داده‌های باکیفیت در تغذیه همیشه با یک «صحرا یا خلأ داده‌ای» روبرو بوده است؛ یعنی فقدان تصاویری که با پروفایل‌های دقیق آزمایشگاهی جفت شده باشند. در پوشش پیشین ما از چالش‌های استخراج داده‌های ساختاریافته در مدل‌های زبانی، دیدیم که فقدان داده‌های برچسب‌دار چگونه رشد مدل‌های تخصصی را متوقف می‌کند و همین مشکل، مانع اصلی در توسعه ابزارهای ردیابی تغذیه بود.

برای عبور از این بن‌بست، تیم پژوهشی از داده‌های مربوط به یادآوری‌های رژیم غذایی ۲۴ ساعته در مقیاس جمعیت طی یک دهه اخیر استفاده کردند تا پرامپت‌هایی برای تولید تصویر بسازند. طبق گزارش ۹ ژوئن ۲۰۲۶ در arxiv.org، این خط لوله منجر به تولید یک مجموعه داده‌ی مصنوعی شامل ۱.۱ میلیون «تریپلت» (سه-تایی) از تصویر، توصیف و مقدار ریزمغذی شد. بر اساس مستندات پروژه، تیم سازنده با تنظیم دقیق (Fine-tuning) مدل‌های Qwen3-VL (در نسخه‌های ۲ تا ۳۰ میلیارد پارامتری) و GLM-4.6V-Flash، خانواده‌ی NutriMLLM را خلق کردند. نتایج نشان می‌دهد که بزرگ‌ترین نسخه‌ی این مدل، در اکثر ریزمغذی‌ها با دقت مدل‌های GPT-5، Gemini 3 و Claude Sonnet 4.5 برابری کرده یا حتی از آن‌ها پیشی گرفته است.

این نتیجه ثابت می‌کند که نظارت مصنوعیِ مبتنی بر داده‌های تاریخی می‌تواند وظایف بالینی سخت را به مسئله‌های قابل حل مهندسی تبدیل کند. با حذف نیاز به برچسب‌گذاری دستی توسط متخصصان، این رویکرد یک نقشه راه برای سایر حوزه‌های پزشکی ایجاد می‌کند که در آن‌ها برچسب‌های آموزشی دقیق، کمیاب هستند.

گام بعدی شما

رصد زمان انتشار عمومی مجموعه داده ۱.۱ میلیون تصویری برای آموزش مدل‌های تخصصی‌تر.
بررسی امکان تعمیم این استراتژی تولید داده‌ی مصنوعی به سایر تشخیص‌های کلینیکی غیرتغذیه‌ای.
تحلیل اثرات ادغام این مدل‌ها در گجت‌های پوشیدنی برای پایش لحظه‌ای سلامت.

این تنها آغاز ماجراست؛ اثر موج‌گونه‌ی این استراتژی بر سایر تشخیص‌های پزشکی را در گزارش بعدی بررسی خواهیم کرد.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

گام بعدی شما

رصد زمان انتشار عمومی مجموعه داده ۱.۱ میلیون تصویری برای آموزش مدل‌های تخصصی‌تر.
بررسی امکان تعمیم این استراتژی تولید داده‌ی مصنوعی به سایر تشخیص‌های کلینیکی غیرتغذیه‌ای.
تحلیل اثرات ادغام این مدل‌ها در گجت‌های پوشیدنی برای پایش لحظه‌ای سلامت.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

سازوکار NutriMLLM: عبور از بن‌بست داده با ۱.۱ میلیون تصویر مصنوعی

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

سازوکار NutriMLLM: عبور از بن‌بست داده با ۱.۱ میلیون تصویر مصنوعی

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

سازوکار NutriMLLM: عبور از بن‌بست داده با ۱.۱ میلیون تصویر مصنوعی

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

سازوکار NutriMLLM: عبور از بن‌بست داده با ۱.۱ میلیون تصویر مصنوعی

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران