اگر شما یک حسابدار هستید که صدها ساعت وقتش را روی فرمهای مالیاتی میگذارد، تصور کنید ابزاری داشته باشید که از اشتباهات شما در لحظه درس میگیرد. این دقیقاً همان اتفاقی است که در Tax AI میافتد؛ سیستمی که بهجای تکرار اشتباهات، کد خودش را بازنویسی میکند.
بسیاری از عاملهای هوش مصنوعی (AI Agents) — شبیه به دستیاری تازهکار که فقط دستورالعملهای خشک را میخواند و در مواجهه با دادههای واقعی دستوپایش را گم میکند — در محیط عملیاتی شکست میخورند. همانطور که در تحلیلهای قبلی ما دربارهی امنیت مدلهای بازمتن اشاره کردیم، شکاف بین محیط آزمایشگاه و دنیای واقعی بسیار عمیق است. برای حل این مشکل، OpenAI و Thrive Holdings سیستمی ساختند که در آن متخصص انسانی، سیگنال اصلی برای تکامل مدل است.

به نقل از وبسایت openai.com، این سیستم در طول دورهی آزمایشی خود ۷,۰۰۰ اظهارنامه را پردازش کرد. طبق گزارش منتشرشده در ۲۷ مه ۲۰۲۶، Tax AI از یک حلقهی سهبخشی شامل بازخورد متخصص، ردیابی عملیات و چرخهی تکرار مبتنی بر Codex استفاده میکند. نتایج این معماری کاملاً ملموس است:
- دقت: درصد اظهارنامههایی که ۷۵٪ فیلدهای آنها درست تکمیل شده بود، در ۶ هفته از ۲۵٪ به ۸۶٪ رسید.
- بهرهوری: سرعت پردازش ۵۰٪ افزایش یافت. یک حسابدار ارشد توانست زمان آمادهسازی خود را از ۱۸۰ ساعت به تنها ۱۵ ساعت کاهش دهد.
- مقیاس: این عامل توانست از فرمهای ساده W-2 به جداول پیچیدهی املاک (Schedule E) منتقل شود.


وقتی یک متخصص مقدار عددی را اصلاح میکند، سیستم تمام مسیر از سند منبع تا خروجی نهایی را ثبت میکند. سپس Codex این ردپا و مخزن کدها را بررسی میکند تا علت ریشهای خطا را پیدا کند. در نهایت، یک اصلاحیه پیشنهاد میدهد، آن را با تستهای رگرسیون میسنجد و یک درخواست تغییر (Pull Request) برای بررسی مهندسان ارسال میکند.


این رویکرد نقش مهندس را از یک «شکارچی باگ» به «معمار حلقهی بهبود» تغییر میدهد. با محدود کردن دسترسی مدل به بخشهای خاصی از کد، تیم توانست ریسک خرابیهای خودکار را به حداقل برساند. این ثابت میکند که ارزشمندترین عاملها، نه لزوماً آنهایی هستند که بهترین مدل را دارند، بلکه آنهاییاند که دقیقترین زیرساخت بازخورد را ساختهاند.

گام بعدی شما
- ظهور معماریهای «خود-ترمیمگر» (Self-healing) را در حوزههای حساس مثل حقوق و پزشکی دنبال کنید.
- بررسی کنید آیا ابزارهای فعلی شما دارای یک حلقهی بازخورد ساختاریافته برای تبدیل خطا به کد هستند یا خیر.
- مطالعه کنید چگونه میتوان از Codex برای خودکارسازی اصلاح باگها در خط لولهی تولید (Pipeline) استفاده کرد.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.
گفتگو