اگر امروز اپلیکیشنی با قابلیتهای Claude میسازید، هرگز به خوانایی ماشینی خروجیهای مدل اعتماد نکنید. بدون یک لایهی سختگیرانهی اعتبارسنجی، استفاده از رابط برنامنویسی پیامها (Messages API) معمولاً به توقف ناگهانی یا کرش برنامه در محیط عملیاتی ختم میشود.
این تغییر رویکرد به سمت پایداری، در حالی رخ میدهد که Anthropic بهشدت در حال گسترش زیرساختهای خود است. همانطور که در تحلیل قبلی ما دربارهی تلاش این شرکت برای جذب مهندسان تراشه بهمنظور طراحی سختافزار اختصاصی اشاره کردیم، حالا تمرکز بر بهبود تجربهی توسعهدهندگان است. برای یک برنامهنویس، این تغییر شبیه به عبور از یک گفتگوی دوستانه با یک دستیار است و رسیدن به یک قرارداد حرفهای و دقیق.
طبق راهنمای فنی منتشرشده در ۷ ژوئن ۲۰۲۶، سازوکار استفاده از ابزار (Tool Use) — که شبیه دادن یک جعبهابزار تخصصی به مدل است تا به جای حدس زدن، کار را انجام دهد — اکنون به Claude اجازه میدهد درخواستهای زیر را ارسال کند:
- درخواستهای HTTP
- پرسوجوهای دیتابیس (Database queries)
- توابع داخلی سرور
بر اساس مستندات Anthropic، توسعهدهندگان باید پیش از اجرای هر دستور، تمام آرگومانها را با استفاده از طرحها (Schemas) اعتبارسنجی کنند. همچنین توصیه شده که کلیدهای API را بهطور منظم تغییر دهید و شناسههای درخواست (Request IDs) را برای تسریع در پشتیبانی فنی ثبت کنید.
این رویکرد، جریان کار را از مهندسی پرامپت (Prompt Engineering) — که هنر سؤال درست پرسیدن است — به مهندسی سیستم تغییر میدهد. با اجبار مدل به استفاده از ابزارها، ریسک توهم (Hallucination) — یعنی وقتی مدل با اطمینان چیزی میگوید که وجود ندارد — از متن خروجی به مرحلهی اعتبارسنجی منتقل میشود. این تغییر باعث میشود عاملهای هوش مصنوعی برای استفادههای سازمانی پیشبینیپذیرتر شوند.
گام بعدی شما
- سیاست چرخش کلیدهای API و بودجههای توکن خود را بازبینی کنید.
- شناسهی مدلهای بهروز را در کنسول Anthropic چک کنید تا از نسخههای قدیمی استفاده نکنید.
- یک لایهی اعتبارسنجی سختگیرانه برای تمام خروجیهای ساختاریافتهی مدل تعریف کنید.
اما هزینهی اجرای این لایهها در مقیاس بالا چالش جدیدی است؛ برای درک بهتر مدیریت هزینهها، تحلیل ما دربارهی بهینهسازی استنتاج را بخوانید.
گفتگو