اگر در صنعت لجستیک فعالیت میکنید، میدانید که یک اشتباه کوچک در کد ۱۰ رقمی گمرک میتواند منجر به جریمههای سنگین یا توقیف محمولهها شود. تصور کنید سیستمی داشته باشید که نه تنها کد را حدس نمیزند، بلکه دلیل قانونی آن را هم ثابت میکند.
به نقل از تحلیل فنی منتشر شده در arxiv.org در تاریخ ۱۶ ژوئن ۲۰۲۶، دقت پیشبینی مدلهای زبانی بزرگ (LLM) با عبور از دستهبندیهای کلی و رسیدن به پسوندهای آماری دقیق، بهشدت افت میکند. این یعنی مدلها در سطح کلی خوب عمل میکنند، اما در جزئیات فنی گمرک، شکست میخورند.
همانطور که در تحلیلهای قبلی ما دربارهی توهم در مدلهای زبانی اشاره کردیم، تکیه بر خروجی مستقیم مدل در محیطهای حساس قانونی ریسک بالایی دارد. به همین دلیل، پژوهشگران یک چارچوب عاملمحور مدل زبانی بزرگ (Agentic LLM Framework) مبتنی بر اجماع طراحی کردهاند.
طبق مستندات این مقاله، این سیستم از یک خطلوله چندمرحلهای تشکیل شده است:
- بازیابی چندعاملی: جستجوهای بردار معنایی (Embedding) در اسناد رسمی تعرفهها برای مبنیسازی (Grounding) مدل بر اساس یادداشتهای قانونی.
- رایگیری جزءبهجزء: یک مکانیسم اجماع که هر بخش از کد سلسلهمراتبی را بهطور جداگانه تأیید میکند.
- تخمین اطمینان: سیستمی برای امتیازدهی که در صورت بالا رفتن عدم قطعیت، مورد را برای بازبینی انسانی ارجاع میدهد.
این مدل روی مجموعهدادهای شامل ۳۳۰۰ رکورد محصول که توسط متخصصان لجستیک برچسبگذاری شده بود، آزمایش شد.
تحلیل فنی این دادهها نشان میدهد که صنعت در حال فاصله گرفتن از وسواس «خودکارسازی کامل» است. برای متخصصان، گردشکارهای عاملمحور که شواهد قابل تفسیر ارائه میدهند، بسیار ارزشمندتر از پیشبینیهای «جعبهسیاه» هستند. در واقع، این رویکرد دوباره ضرورت حضور متخصصان انسانی را بهعنوان لایهی نهایی تأیید در AIهای نظارتی تثبیت میکند.
گام بعدی شما
- بررسی نحوه پیادهسازی مکانیزمهای رایگیری (Voting) در عاملهای استدلالی برای کاهش نرخ خطا.
- مطالعه متون قانونی مربوط به گمرکات اتحادیه اروپا و آمریکا برای ارزیابی قابلیت تعمیم این چارچوب.
- تست ابزارهای RAG برای بازیابی دقیق متون قانونی پیش از ارسال پرامپت نهایی.
اما چالش واقعی در اینجا نه مدل، بلکه کیفیت دادههای ورودی گمرک است — به تحلیل ما دربارهی پاکسازی دادههای ساختاریافته مراجعه کنید.




گفتگو