اگر عاملهای هوش مصنوعی شما بودجهی شما را با توکنهای بیهوده میسوزانند، Perplexity راهکار این مشکل را پیدا کرده است. طبق اعلام این شرکت در ۷ ژوئن ۲۰۲۶، معماری جدیدی معرفی شد که مصرف توکن (Token) — شبیه برشهای کوچک یک کیک طولانی که مدل تکهتکه میخورد — را در کارهای پژوهشی پیچیده ۸۵٪ کاهش میدهد.
اکثر عاملهای (Agent) — شبیه کارکنان دیجیتالی که میتوانند تصمیم بگیرند و عمل کنند — در یک حلقهی بسته گیر کردهاند؛ آنها یک سؤال میپرسند، لیستی از لینکها میگیرند و نویزها را دستی فیلتر میکنند. همانطور که در تحلیلهای قبلی ما دربارهی بهینهسازی هزینههای استنتاج اشاره کردیم، این روش برای پژوهشهای مقیاسبالا بسیار کند و گران است و مدلها را مجبور میکند بهجای وب، به دادههای داخلی خود تکیه کنند.
معماری Search as Code (SaC) یا «جستوجو به عنوان کد» این حلقه را با یک ساختار سهلایه میشکند:
- مدل: استراتژی کلی جستوجو را تعیین میکند.
- سندباکس (Sandbox): محیطی امن که کدهای پایتون مدل در آن اجرا میشود.
- Agentic Search SDK: ابزاری برای بازیابی، فیلتر، حذف موارد تکراری و رتبهبندی دادهها.

به نقل از گزارش فنی Perplexity، این روش روی ردیابی ۲۰۰ آسیبپذیری نرمافزاری (CVE) بین سالهای ۲۰۲۳ تا ۲۰۲۵ آزمایش شد. عامل در این مورد، یک کد سه مرحلهای نوشت تا فرمتهای خاص سازندهها را اسکن کند، شکافهای دادهای را بیابد و نتایج را با یک طرح مشخص (Schema) تطبیق دهد.


این سازوکار اجازه میدهد نویزها پیش از آنکه به پنجره متنی (Context Window) — مثل میز کاری که فقط جای چند ورق کاغذ دارد، نه کل کتابخانه — برسند، حذف شوند. در رقابتهای مستقیم، SaC در چهار مورد از پنج دستهبندی بنچمارک WANDR، از APIهای OpenAI و Anthropic پیشی گرفت.
این تغییر، جستوجو را از یک فراخوان ساده به یک لایهی عملیاتی برنامهپذیر تبدیل میکند. برای کسبوکارها، این یعنی عاملهای خودکار میتوانند بدون گم کردن مسیر یا افزایش هزینههای استنتاج (Inference) — شبیه لحظهی آشپزی واقعی، نه دورهی آموزش آشپز — پژوهشهای عمیقتری انجام دهند. این موضوع ثابت میکند که کدهای قطعی، بهترین راه برای مهار پیشبینیناپذیری مدلهای زبانی هستند.
این قابلیت اکنون در Perplexity Computer و Agent API در دسترس است.
گام بعدی شما
- اگر از Agent API استفاده میکنید، معماری SaC را در گردشکارهای خود تست کنید.
- نتایج عمومی بنچمارک WANDR را دنبال کنید تا قدرت این روش در برابر مدلهای دیگر را بسنجید.
- بررسی کنید آیا نیاز است منطق جستوجوی شما از APIهای ساده به کدهای پایتونی پویا تغییر کند؟
ama داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.

گفتگو