چرا مدل‌های استدلالی در طبقه‌بندی گمرکی شکست می‌خورند؟

اگر در صنعت لجستیک فعالیت می‌کنید، می‌دانید که یک اشتباه کوچک در کد ۱۰ رقمی گمرک می‌تواند منجر به جریمه‌های سنگین یا توقیف محموله‌ها شود. تصور کنید سیستمی داشته باشید که نه تنها کد را حدس نمی‌زند، بلکه دلیل قانونی آن را هم ثابت می‌کند.

به نقل از تحلیل فنی منتشر شده در arxiv.org در تاریخ ۱۶ ژوئن ۲۰۲۶، دقت پیش‌بینی مدل‌های زبانی بزرگ (LLM) با عبور از دسته‌بندی‌های کلی و رسیدن به پسوندهای آماری دقیق، به‌شدت افت می‌کند. این یعنی مدل‌ها در سطح کلی خوب عمل می‌کنند، اما در جزئیات فنی گمرک، شکست می‌خورند.

همان‌طور که در تحلیل‌های قبلی ما درباره‌ی توهم در مدل‌های زبانی اشاره کردیم، تکیه بر خروجی مستقیم مدل در محیط‌های حساس قانونی ریسک بالایی دارد. به همین دلیل، پژوهشگران یک چارچوب عامل‌محور مدل زبانی بزرگ (Agentic LLM Framework) مبتنی بر اجماع طراحی کرده‌اند.

طبق مستندات این مقاله، این سیستم از یک خط‌لوله چندمرحله‌ای تشکیل شده است:

بازیابی چندعاملی: جستجوهای بردار معنایی (Embedding) در اسناد رسمی تعرفه‌ها برای مبنی‌سازی (Grounding) مدل بر اساس یادداشت‌های قانونی.
رای‌گیری جزء‌به‌جزء: یک مکانیسم اجماع که هر بخش از کد سلسله‌مراتبی را به‌طور جداگانه تأیید می‌کند.
تخمین اطمینان: سیستمی برای امتیازدهی که در صورت بالا رفتن عدم قطعیت، مورد را برای بازبینی انسانی ارجاع می‌دهد.

این مدل روی مجموعه‌داده‌ای شامل ۳۳۰۰ رکورد محصول که توسط متخصصان لجستیک برچسب‌گذاری شده بود، آزمایش شد.

تحلیل فنی این داده‌ها نشان می‌دهد که صنعت در حال فاصله گرفتن از وسواس «خودکارسازی کامل» است. برای متخصصان، گردش‌کارهای عامل‌محور که شواهد قابل تفسیر ارائه می‌دهند، بسیار ارزشمندتر از پیش‌بینی‌های «جعبه‌سیاه» هستند. در واقع، این رویکرد دوباره ضرورت حضور متخصصان انسانی را به‌عنوان لایه‌ی نهایی تأیید در AI‌های نظارتی تثبیت می‌کند.

گام بعدی شما

بررسی نحوه پیاده‌سازی مکانیزم‌های رای‌گیری (Voting) در عامل‌های استدلالی برای کاهش نرخ خطا.
مطالعه متون قانونی مربوط به گمرکات اتحادیه اروپا و آمریکا برای ارزیابی قابلیت تعمیم این چارچوب.
تست ابزارهای RAG برای بازیابی دقیق متون قانونی پیش از ارسال پرامپت نهایی.

اما چالش واقعی در اینجا نه مدل، بلکه کیفیت داده‌های ورودی گمرک است — به تحلیل ما درباره‌ی پاک‌سازی داده‌های ساختاریافته مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

طبق مستندات این مقاله، این سیستم از یک خط‌لوله چندمرحله‌ای تشکیل شده است:

بازیابی چندعاملی: جستجوهای بردار معنایی (Embedding) در اسناد رسمی تعرفه‌ها برای مبنی‌سازی (Grounding) مدل بر اساس یادداشت‌های قانونی.
رای‌گیری جزء‌به‌جزء: یک مکانیسم اجماع که هر بخش از کد سلسله‌مراتبی را به‌طور جداگانه تأیید می‌کند.
تخمین اطمینان: سیستمی برای امتیازدهی که در صورت بالا رفتن عدم قطعیت، مورد را برای بازبینی انسانی ارجاع می‌دهد.

این مدل روی مجموعه‌داده‌ای شامل ۳۳۰۰ رکورد محصول که توسط متخصصان لجستیک برچسب‌گذاری شده بود، آزمایش شد.

گام بعدی شما

بررسی نحوه پیاده‌سازی مکانیزم‌های رای‌گیری (Voting) در عامل‌های استدلالی برای کاهش نرخ خطا.
مطالعه متون قانونی مربوط به گمرکات اتحادیه اروپا و آمریکا برای ارزیابی قابلیت تعمیم این چارچوب.
تست ابزارهای RAG برای بازیابی دقیق متون قانونی پیش از ارسال پرامپت نهایی.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چرا مدل‌های استدلالی در طبقه‌بندی گمرکی شکست می‌خورند؟

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چرا مدل‌های استدلالی در طبقه‌بندی گمرکی شکست می‌خورند؟

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چرا مدل‌های استدلالی در طبقه‌بندی گمرکی شکست می‌خورند؟

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چرا مدل‌های استدلالی در طبقه‌بندی گمرکی شکست می‌خورند؟

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران