OpenAI: افزایش دقت عامل مالیاتی از ۲۵٪ به ۸۶٪ با حلقه‌ی بازخورد Codex

اگر شما یک حسابدار هستید که صدها ساعت وقتش را روی فرم‌های مالیاتی می‌گذارد، تصور کنید ابزاری داشته باشید که از اشتباهات شما در لحظه درس می‌گیرد. این دقیقاً همان اتفاقی است که در Tax AI می‌افتد؛ سیستمی که به‌جای تکرار اشتباهات، کد خودش را بازنویسی می‌کند.

بسیاری از عامل‌های هوش مصنوعی (AI Agents) — شبیه به دستیاری تازه‌کار که فقط دستورالعمل‌های خشک را می‌خواند و در مواجهه با داده‌های واقعی دست‌وپایش را گم می‌کند — در محیط عملیاتی شکست می‌خورند. همان‌طور که در تحلیل‌های قبلی ما درباره‌ی امنیت مدل‌های بازمتن اشاره کردیم، شکاف بین محیط آزمایشگاه و دنیای واقعی بسیار عمیق است. برای حل این مشکل، OpenAI و Thrive Holdings سیستمی ساختند که در آن متخصص انسانی، سیگنال اصلی برای تکامل مدل است.

به نقل از وب‌سایت openai.com، این سیستم در طول دوره‌ی آزمایشی خود ۷,۰۰۰ اظهارنامه را پردازش کرد. طبق گزارش منتشرشده در ۲۷ مه ۲۰۲۶، Tax AI از یک حلقه‌ی سه‌بخشی شامل بازخورد متخصص، ردیابی عملیات و چرخه‌ی تکرار مبتنی بر Codex استفاده می‌کند. نتایج این معماری کاملاً ملموس است:

دقت: درصد اظهارنامه‌هایی که ۷۵٪ فیلدهای آن‌ها درست تکمیل شده بود، در ۶ هفته از ۲۵٪ به ۸۶٪ رسید.
بهره‌وری: سرعت پردازش ۵۰٪ افزایش یافت. یک حسابدار ارشد توانست زمان آماده‌سازی خود را از ۱۸۰ ساعت به تنها ۱۵ ساعت کاهش دهد.
مقیاس: این عامل توانست از فرم‌های ساده W-2 به جداول پیچیده‌ی املاک (Schedule E) منتقل شود.

وقتی یک متخصص مقدار عددی را اصلاح می‌کند، سیستم تمام مسیر از سند منبع تا خروجی نهایی را ثبت می‌کند. سپس Codex این ردپا و مخزن کدها را بررسی می‌کند تا علت ریشه‌ای خطا را پیدا کند. در نهایت، یک اصلاحیه پیشنهاد می‌دهد، آن را با تست‌های رگرسیون می‌سنجد و یک درخواست تغییر (Pull Request) برای بررسی مهندسان ارسال می‌کند.

codex windows > art card

MRC 1_1

این رویکرد نقش مهندس را از یک «شکارچی باگ» به «معمار حلقه‌ی بهبود» تغییر می‌دهد. با محدود کردن دسترسی مدل به بخش‌های خاصی از کد، تیم توانست ریسک خرابی‌های خودکار را به حداقل برساند. این ثابت می‌کند که ارزشمندترین عامل‌ها، نه لزوماً آن‌هایی هستند که بهترین مدل را دارند، بلکه آن‌هایی‌اند که دقیق‌ترین زیرساخت بازخورد را ساخته‌اند.

How OpenAI delivers low-latency voice AI at scale > art card

گام بعدی شما

ظهور معماری‌های «خود-ترمیم‌گر» (Self-healing) را در حوزه‌های حساس مثل حقوق و پزشکی دنبال کنید.
بررسی کنید آیا ابزارهای فعلی شما دارای یک حلقه‌ی بازخورد ساختاریافته برای تبدیل خطا به کد هستند یا خیر.
مطالعه کنید چگونه می‌توان از Codex برای خودکارسازی اصلاح باگ‌ها در خط لوله‌ی تولید (Pipeline) استفاده کرد.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

دقت: درصد اظهارنامه‌هایی که ۷۵٪ فیلدهای آن‌ها درست تکمیل شده بود، در ۶ هفته از ۲۵٪ به ۸۶٪ رسید.
بهره‌وری: سرعت پردازش ۵۰٪ افزایش یافت. یک حسابدار ارشد توانست زمان آماده‌سازی خود را از ۱۸۰ ساعت به تنها ۱۵ ساعت کاهش دهد.
مقیاس: این عامل توانست از فرم‌های ساده W-2 به جداول پیچیده‌ی املاک (Schedule E) منتقل شود.

codex windows > art card

MRC 1_1

How OpenAI delivers low-latency voice AI at scale > art card

گام بعدی شما

ظهور معماری‌های «خود-ترمیم‌گر» (Self-healing) را در حوزه‌های حساس مثل حقوق و پزشکی دنبال کنید.
بررسی کنید آیا ابزارهای فعلی شما دارای یک حلقه‌ی بازخورد ساختاریافته برای تبدیل خطا به کد هستند یا خیر.
مطالعه کنید چگونه می‌توان از Codex برای خودکارسازی اصلاح باگ‌ها در خط لوله‌ی تولید (Pipeline) استفاده کرد.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

OpenAI: افزایش دقت عامل مالیاتی از ۲۵٪ به ۸۶٪ با حلقه‌ی بازخورد Codex

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

OpenAI: افزایش دقت عامل مالیاتی از ۲۵٪ به ۸۶٪ با حلقه‌ی بازخورد Codex

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

OpenAI: افزایش دقت عامل مالیاتی از ۲۵٪ به ۸۶٪ با حلقه‌ی بازخورد Codex

گام بعدی شما

مقاله‌های مرتبطهمه ←

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

کاهش پیچیدگی استقرار عامل‌های AI با یک قالب داده‌ای واحد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

OpenAI: افزایش دقت عامل مالیاتی از ۲۵٪ به ۸۶٪ با حلقه‌ی بازخورد Codex

گام بعدی شما

مقاله‌های مرتبطهمه ←

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

کاهش پیچیدگی استقرار عامل‌های AI با یک قالب داده‌ای واحد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران