تصور کنید یک توسعهدهنده هستید که میخواهد برای فروشگاه آنلاینش سیستم توصیهای بسازد، اما بودجهای برای استخدام تیم دادهکاوی ندارد. شما میتوانید با ترکیب یک پرامپت سیستمی سختگیرانه و یک فیلتر ساده پایتونی، پیشنهاداتی دقیق، ارزان و بهویژه «توضیحپذیر» تولید کنید که کاربر دقیقاً بداند چرا یک کالای خاص به او پیشنهاد شده است.
این تغییر رویکرد در حالی رخ میدهد که تیمهای فنی بهدنبال جایگزینی برای روشهای سنتی «فیلترینگ مشارکتی» هستند؛ روشهایی که اغلب شبیه به یک جعبه سیاه عمل میکنند و دلیل پیشنهاد هر کالا در آنها نامشخص است. همانطور که در تحلیل قبلی ما دربارهی کنترل هزینههای استنتاج عاملهای هوش مصنوعی اشاره کردیم، اولویت فعلاً با متدهایی است که مصرف توکن را پیشبینیپذیر کرده و هزینههای عملیاتی را ثابت نگه دارند.
به نقل از راهنمای منتشرشده در ۲۳ ژوئن ۲۰۲۶ در وبسایت dev.to، این معماری از یک مکانیسم پنجمرحلهای دقیق پیروی میکند:
زمینه و نیازمندیها
برای پیادهسازی این سیستم، توسعهدهندگان به پایتون ۳.۱۰ یا نسخههای جدیدتر، SDK شرکت OpenAI و یک کلید API از پلتفرم Oxlo.ai نیاز دارند. پیادهسازی با تعریف یک کاتالوگ سختافزاری و پروفایل کاربر در قالب دیکشنریهای ساده پایتون آغاز میشود تا انتقال دادهها به پایگاههای داده اختصاصی در آینده راحتتر باشد.
جزئیات پیادهسازی
- مجموعه داده: کاتالوگ شامل اقطامی مانند هدفون سونی WH-1000XM5 (۳۴۸ دلار)، ایرپادز اپل نسل ۲ (۲۴۹ دلار) و ماوس لوگیتک MX Master 3S (۹۹ دلار) است. پروفایل کاربر نیز مواردی مثل بازدیدهای اخیر، خریدهای ماه گذشته و بودجه مورد نظر (مثلاً زیر ۳۰۰ دلار) را ردیابی میکند.
- لایه بازیابی (Retrieval) — شبیه به این است که ابتدا فقط قفسههای مرتبط با نیاز کاربر را در یک فروشگاه بزرگ بررسی کنیم و بقیه را نادیده بگیریم — از طریق یک تابع ساده پایتونی (
retrieve_candidates) عمل میکند. این لایه برای کاهش مصرف توکن، کالاها را بر اساس قیمت مرتب کرده و حداکثر ۸ مورد را برمیگرداند. - پرامپت سیستمی (System Prompt): یک دستورالعمل سختگیرانه بر پایه JSON است که مدل را مجبور میکند ۳ محصول برتر را رتبهبندی کند. در این دستور، پیشنهاد کالاهایی که قبلاً خریداری شدهاند ممنوع است و برای هر رتبه باید یک توضیح تکجملهای ارائه شود.
- استنتاج (Inference) — همان لحظهای که مدل واقعاً جواب تولید میکند و شبیه به خودِ آشپزی است، نه دورهی آموزش آشپز — در این سیستم توسط مدل llama-3.3-70b از طریق API سایت Oxlo.ai با دمای (Temperature) ۰.۲ انجام میشود.
- حافظه گفتگو: این ساختار از گفتگوهای چندمرحلهای پشتیبانی میکند. با الحاق پاسخهای قبلی به تاریخچه، کاربر میتواند بدون تأخیر در راهاندازی سرد (Cold Start)، سوالات تکمیلی بپرسد؛ مثلاً: «میشود گزینهی ارزانتری پیشنهاد دهی؟ بودجهام کمتر شده است».
طبق گزارش این منبع، به دلیل اینکه Oxlo.ai از قیمتگذاری ثابت به ازای هر درخواست استفاده میکند، افزودن توضیحات کامل محصولات به پرامپت باعث انفجار هزینهها نمیشود؛ مزیتی که در مدلهای پرداخت بهازای توکن دیده نمیشود.
برای یک توسعهدهنده، این یعنی «جعبه سیاه» سیستمهای توصیهگر از بین رفته است. بهجای یک امتیاز ریاضی مرموز، سیستم دلیلی انسانی ارائه میدهد. مثلاً توضیح میدهد که یک هدفون خاص هم با اولویت حذف صدا (Noise-canceling) کاربر سازگار است و هم زیر ۳۰۰ دلار قیمت دارد.
این رویکرد فرضهای قبلی درباره «سد ورود» به دنیای شخصیسازی را تغییر میدهد. دیگر نیازی به تیمهای تخصصی داده برای آموزش مدل نیست؛ یک پرامپت ساختاریافته و یک فیلتر کلیدواژهای ساده، نقطهی شروعی عملی برای اکثر کاتالوگهای تجارت الکترونیک است.
بر اساس بررسیهای فنی، برای مقیاسپذیری بیشتر میتوان فیلتر کلیدواژهای را با جستوجوی معنایی (Semantic Search) — مثل پیدا کردن کلماتی که معنایشان یکی است اما شکلشان متفاوت است — با استفاده از بردار معنایی (Embedding) مدلهای bge-large یا e5-large جایگزین کرد.
گام بعدی شما
- اگر فروشگاه کوچکی دارید، به جای خرید دیتابیسهای برداری گرانقیمت، ابتدا با یک لایه فیلتر پایتونی و مدل Llama-3.3 تست کنید.
- برای افزایش دقت، فیلد بازخوردهای «لایک/دیسلایک» را مستقیماً به JSON پروفایل کاربر اضافه کنید تا مدل بدون نیاز به بازآموزی، سلیقه کاربر را یاد بگیرد.
- ساختار خروجی مدل را روی JSON سختگیرانه تنظیم کنید تا بتوانید نتایج را مستقیماً در رابط کاربری (UI) نمایش دهید.
اما برای کسانی که با حجم دادههای میلیونی سر و کار دارند، داستان استفاده از دیتابیسهای برداری متفاوت است — به تحلیل ما دربارهی بهینهسازی Vector Database مراجعه کنید.




گفتگو