سیستم‌های توصیه‌گر سبک با مدل‌های زبانی بدون نیاز به خط لوله بردار معنایی

تصور کنید یک توسعه‌دهنده هستید که می‌خواهد برای فروشگاه آنلاینش سیستم توصیه‌ای بسازد، اما بودجه‌ای برای استخدام تیم داده‌کاوی ندارد. شما می‌توانید با ترکیب یک پرامپت سیستمی سخت‌گیرانه و یک فیلتر ساده پایتونی، پیشنهاداتی دقیق، ارزان و به‌ویژه «توضیح‌پذیر» تولید کنید که کاربر دقیقاً بداند چرا یک کالای خاص به او پیشنهاد شده است.

این تغییر رویکرد در حالی رخ می‌دهد که تیم‌های فنی به‌دنبال جایگزینی برای روش‌های سنتی «فیلترینگ مشارکتی» هستند؛ روش‌هایی که اغلب شبیه به یک جعبه سیاه عمل می‌کنند و دلیل پیشنهاد هر کالا در آن‌ها نامشخص است. همان‌طور که در تحلیل قبلی ما درباره‌ی کنترل هزینه‌های استنتاج عامل‌های هوش مصنوعی اشاره کردیم، اولویت فعلاً با متدهایی است که مصرف توکن را پیش‌بینی‌پذیر کرده و هزینه‌های عملیاتی را ثابت نگه دارند.

به نقل از راهنمای منتشرشده در ۲۳ ژوئن ۲۰۲۶ در وب‌سایت dev.to، این معماری از یک مکانیسم پنج‌مرحله‌ای دقیق پیروی می‌کند:

زمینه و نیازمندی‌ها

برای پیاده‌سازی این سیستم، توسعه‌دهندگان به پایتون ۳.۱۰ یا نسخه‌های جدیدتر، SDK شرکت OpenAI و یک کلید API از پلتفرم Oxlo.ai نیاز دارند. پیاده‌سازی با تعریف یک کاتالوگ سخت‌افزاری و پروفایل کاربر در قالب دیکشنری‌های ساده پایتون آغاز می‌شود تا انتقال داده‌ها به پایگاه‌های داده اختصاصی در آینده راحت‌تر باشد.

جزئیات پیاده‌سازی

مجموعه داده: کاتالوگ شامل اقطامی مانند هدفون سونی WH-1000XM5 (۳۴۸ دلار)، ایرپادز اپل نسل ۲ (۲۴۹ دلار) و ماوس لوگیتک MX Master 3S (۹۹ دلار) است. پروفایل کاربر نیز مواردی مثل بازدیدهای اخیر، خریدهای ماه گذشته و بودجه مورد نظر (مثلاً زیر ۳۰۰ دلار) را ردیابی می‌کند.
لایه بازیابی (Retrieval) — شبیه به این است که ابتدا فقط قفسه‌های مرتبط با نیاز کاربر را در یک فروشگاه بزرگ بررسی کنیم و بقیه را نادیده بگیریم — از طریق یک تابع ساده پایتونی (retrieve_candidates) عمل می‌کند. این لایه برای کاهش مصرف توکن، کالاها را بر اساس قیمت مرتب کرده و حداکثر ۸ مورد را برمی‌گرداند.
پرامپت سیستمی (System Prompt): یک دستورالعمل سخت‌گیرانه بر پایه JSON است که مدل را مجبور می‌کند ۳ محصول برتر را رتبه‌بندی کند. در این دستور، پیشنهاد کالاهایی که قبلاً خریداری شده‌اند ممنوع است و برای هر رتبه باید یک توضیح تک‌جمله‌ای ارائه شود.
استنتاج (Inference) — همان لحظه‌ای که مدل واقعاً جواب تولید می‌کند و شبیه به خودِ آشپزی است، نه دوره‌ی آموزش آشپز — در این سیستم توسط مدل llama-3.3-70b از طریق API سایت Oxlo.ai با دمای (Temperature) ۰.۲ انجام می‌شود.
حافظه گفتگو: این ساختار از گفتگوهای چندمرحله‌ای پشتیبانی می‌کند. با الحاق پاسخ‌های قبلی به تاریخچه، کاربر می‌تواند بدون تأخیر در راه‌اندازی سرد (Cold Start)، سوالات تکمیلی بپرسد؛ مثلاً: «می‌شود گزینه‌ی ارزان‌تری پیشنهاد دهی؟ بودجه‌ام کمتر شده است».

طبق گزارش این منبع، به دلیل اینکه Oxlo.ai از قیمت‌گذاری ثابت به ازای هر درخواست استفاده می‌کند، افزودن توضیحات کامل محصولات به پرامپت باعث انفجار هزینه‌ها نمی‌شود؛ مزیتی که در مدل‌های پرداخت به‌ازای توکن دیده نمی‌شود.

برای یک توسعه‌دهنده، این یعنی «جعبه سیاه» سیستم‌های توصیه‌گر از بین رفته است. به‌جای یک امتیاز ریاضی مرموز، سیستم دلیلی انسانی ارائه می‌دهد. مثلاً توضیح می‌دهد که یک هدفون خاص هم با اولویت حذف صدا (Noise-canceling) کاربر سازگار است و هم زیر ۳۰۰ دلار قیمت دارد.

این رویکرد فرض‌های قبلی درباره «سد ورود» به دنیای شخصی‌سازی را تغییر می‌دهد. دیگر نیازی به تیم‌های تخصصی داده برای آموزش مدل نیست؛ یک پرامپت ساختاریافته و یک فیلتر کلیدواژه‌ای ساده، نقطه‌ی شروعی عملی برای اکثر کاتالوگ‌های تجارت الکترونیک است.

بر اساس بررسی‌های فنی، برای مقیاس‌پذیری بیشتر می‌توان فیلتر کلیدواژه‌ای را با جست‌وجوی معنایی (Semantic Search) — مثل پیدا کردن کلماتی که معنایشان یکی است اما شکلشان متفاوت است — با استفاده از بردار معنایی (Embedding) مدل‌های bge-large یا e5-large جایگزین کرد.

گام بعدی شما

اگر فروشگاه کوچکی دارید، به جای خرید دیتابیس‌های برداری گران‌قیمت، ابتدا با یک لایه فیلتر پایتونی و مدل Llama-3.3 تست کنید.
برای افزایش دقت، فیلد بازخوردهای «لایک/دیس‌لایک» را مستقیماً به JSON پروفایل کاربر اضافه کنید تا مدل بدون نیاز به بازآموزی، سلیقه کاربر را یاد بگیرد.
ساختار خروجی مدل را روی JSON سخت‌گیرانه تنظیم کنید تا بتوانید نتایج را مستقیماً در رابط کاربری (UI) نمایش دهید.

اما برای کسانی که با حجم داده‌های میلیونی سر و کار دارند، داستان استفاده از دیتابیس‌های برداری متفاوت است — به تحلیل ما درباره‌ی بهینه‌سازی Vector Database مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

زمینه و نیازمندی‌ها

جزئیات پیاده‌سازی

مجموعه داده: کاتالوگ شامل اقطامی مانند هدفون سونی WH-1000XM5 (۳۴۸ دلار)، ایرپادز اپل نسل ۲ (۲۴۹ دلار) و ماوس لوگیتک MX Master 3S (۹۹ دلار) است. پروفایل کاربر نیز مواردی مثل بازدیدهای اخیر، خریدهای ماه گذشته و بودجه مورد نظر (مثلاً زیر ۳۰۰ دلار) را ردیابی می‌کند.
لایه بازیابی (Retrieval) — شبیه به این است که ابتدا فقط قفسه‌های مرتبط با نیاز کاربر را در یک فروشگاه بزرگ بررسی کنیم و بقیه را نادیده بگیریم — از طریق یک تابع ساده پایتونی (retrieve_candidates) عمل می‌کند. این لایه برای کاهش مصرف توکن، کالاها را بر اساس قیمت مرتب کرده و حداکثر ۸ مورد را برمی‌گرداند.
پرامپت سیستمی (System Prompt): یک دستورالعمل سخت‌گیرانه بر پایه JSON است که مدل را مجبور می‌کند ۳ محصول برتر را رتبه‌بندی کند. در این دستور، پیشنهاد کالاهایی که قبلاً خریداری شده‌اند ممنوع است و برای هر رتبه باید یک توضیح تک‌جمله‌ای ارائه شود.
استنتاج (Inference) — همان لحظه‌ای که مدل واقعاً جواب تولید می‌کند و شبیه به خودِ آشپزی است، نه دوره‌ی آموزش آشپز — در این سیستم توسط مدل llama-3.3-70b از طریق API سایت Oxlo.ai با دمای (Temperature) ۰.۲ انجام می‌شود.
حافظه گفتگو: این ساختار از گفتگوهای چندمرحله‌ای پشتیبانی می‌کند. با الحاق پاسخ‌های قبلی به تاریخچه، کاربر می‌تواند بدون تأخیر در راه‌اندازی سرد (Cold Start)، سوالات تکمیلی بپرسد؛ مثلاً: «می‌شود گزینه‌ی ارزان‌تری پیشنهاد دهی؟ بودجه‌ام کمتر شده است».

گام بعدی شما

اگر فروشگاه کوچکی دارید، به جای خرید دیتابیس‌های برداری گران‌قیمت، ابتدا با یک لایه فیلتر پایتونی و مدل Llama-3.3 تست کنید.
برای افزایش دقت، فیلد بازخوردهای «لایک/دیس‌لایک» را مستقیماً به JSON پروفایل کاربر اضافه کنید تا مدل بدون نیاز به بازآموزی، سلیقه کاربر را یاد بگیرد.
ساختار خروجی مدل را روی JSON سخت‌گیرانه تنظیم کنید تا بتوانید نتایج را مستقیماً در رابط کاربری (UI) نمایش دهید.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

سیستم‌های توصیه‌گر سبک با مدل‌های زبانی بدون نیاز به خط لوله بردار معنایی

زمینه و نیازمندی‌ها

جزئیات پیاده‌سازی

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

سیستم‌های توصیه‌گر سبک با مدل‌های زبانی بدون نیاز به خط لوله بردار معنایی

زمینه و نیازمندی‌ها

جزئیات پیاده‌سازی

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

سیستم‌های توصیه‌گر سبک با مدل‌های زبانی بدون نیاز به خط لوله بردار معنایی

زمینه و نیازمندی‌ها

جزئیات پیاده‌سازی

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

Z.ai: برتری GLM-5.2 بر GPT-5.5 در کدنویسی بلندمدت

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

سیستم‌های توصیه‌گر سبک با مدل‌های زبانی بدون نیاز به خط لوله بردار معنایی

زمینه و نیازمندی‌ها

جزئیات پیاده‌سازی

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

Z.ai: برتری GLM-5.2 بر GPT-5.5 در کدنویسی بلندمدت

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

راهنمای فارسی هوش مصنوعی — با نگاه به ایران