تصور کنید تمام ابزارهای پیچیده و پراکندهی هوش مصنوعی شما را در یک جعبه واحد جمع کنند تا مدیریت دادهها از یک کابوس به یک لذت تبدیل شود. اگر هنوز برای هر بخش از زنجیره هوش مصنوعی خود از یک ابزار متفاوت استفاده میکنید، پروژه «کلادیوس» (Claudius) مسیر جدیدی را پیش روی شما میگذارد.
به گزارش dev.to در ۲ ژوئیه ۲۰۲۶، توسعهدهندهای به نام نستور دازا (Néstor Daza) در حال مستندسازی ساخت یک فضای کاری شخصی است که هدفش حذف «پشتههای فرانکنشتاینی» در معماری AI است. او میخواهد ثابت کند که پیچیدگیهای زیرساختی را میتوان در یک پایگاهداده واحد متمرکز کرد تا مالکیت کامل دادهها و کنترل چرخه عاملمحور (Agentic Loop) تضمین شود.
ساخت یک عامل (Agent) — شبیه به یک دستیار دیجیتال که میتواند بهتنهایی تصمیم بگیرد و ابزارها را اجرا کند — معمولاً نیازمند ترکیبی پراکنده از ابزارهاست. توسعهدهندگان معمولاً باید همزمان یک پایگاهداده اصلی، یک حافظه موقت (Cache)، یک ذخیرهساز برداری برای RAG و یک صف پیام برای وظایف پسزمینه را مدیریت کنند. همانطور که در تحلیل قبلی ما دربارهی بهینهسازی عاملها با فایلهای قانون اشاره کردیم، چالش اصلی همواره مدیریت لایههای بازیابی بدون ایجاد بدهی فنی سنگین بوده است.
زمینه و انگیزه پروژه
دازا که بهطور روزمره از Claude برای پژوهش و کدنویسی استفاده میکند، میخواست بداند ساخت نسخهای از این ابزار بر روی زیرساختی که خودش کنترل میکند، چه الزاماتی دارد. او این مسیر را یک سفر یادگیری مینامد و معتقد است «بهترین معلم این است که چیزی را با دستان خود بسازید».
او با کدنویسی دستی برای چرخه عامل، مدیریت وضعیت و بازیابی، قصد دارد لایههای پنهانی را که محصولات نهایی ماسک میکنند، آشکار کند. انگیزه دیگر او، مالکیت داده است؛ او اپلیکیشنی میخواهد که اطلاعات را در گفتگوهای مختلف به یاد بیاورد، اما تمام این دادهها در پایگاهدادهای باشند که خودش اداره میکند.
معماری تک-پایگاهداده
دازا برای کل این برنامه از MongoDB بهعنوان ستون فقرات استفاده کرده است. بر اساس مستندات پروژه، او استدلال میکند که مدل سندی (Document Model) و قابلیت Atlas Vector Search نیاز به چهار سیستم مجزا را که باید همزمان همگام شوند، از بین میبرد.
- همگرایی: بهجای ترکیب پایگاهداده، کش، ذخیرهساز برداری و صف، تمام این موارد توسط MongoDB مدیریت میشوند.
- مدیریت وضعیت: از MongoDB برای ذخیره وضعیت فعال عامل استفاده شده تا گفتگوها پس از رفرش شدن صفحه، زنده بمانند.
- دسترسی: اپلیکیشن روی لایه رایگان MongoDB Atlas اجرا میشود، بنابراین هر توسعهدهندهای میتواند این الگو را کپی و اجرا کند.
مدلهای هوش مصنوعی و بردارهای معنایی
- مدلهای Claude: تمامی قابلیتهای مدل زبانی بزرگ (LLM) — مثل کتابخانهداری که میلیاردها صفحه را خوانده و حالا با همان لحن جواب میدهد — از طریق AWS Bedrock ارائه میشوند. این ساختار اجازه میدهد تنها با تغییر یک رشته متنی در درخواست، بین مدلهای سریع و ارزان یا مدلهای کند و توانمند جابهجا شد.
- Voyage AI: تولید بردار معنایی (Embedding) — که مثل کارت معرفی عددی برای هر واژه است و همسایگان معنایی آن را مشخص میکند — توسط Voyage AI انجام میشود. دازا اشاره میکند که یکپارچگی تامینکننده داده و لایه بازیابی، مدیریت را سادهتر میکند.
- پشتیبانی چندزبانه: به دلیل فعالیت دازا در مناطق آمریکای شمالی و لاتین، استفاده از مدلهای چندزبانه Voyage برای جلوگیری از بازیابیهای سطحی و بیمعنی در زبان اسپانیایی حیاتی است.
ویژگیهای کلیدی
«کلادیوس» برای جلوگیری از گسترش بیرویه دامنه پروژه، روی چهار قابلیت متمرکز است:
۱. گفتگوهای جریانی: پشتیبانی از چت در لحظه با قابلیت تغییر مدل Claude در میانهی رشته گفتگو.
۲. حافظه پایدار: بات حقایق را در گفتگوهای مختلف به یاد میآورد، بهجای اینکه فقط تاریخچهی متن را ذخیره کند.
۳. RAG مبتنی بر فایل: کاربر میتواند فایلی را آپلود کند و پاسخها صرفاً از محتوای همان فایل استخراج شوند. این همان تولید بازیابیافزا (RAG) است، شبیه دانشآموزی که قبل از جواب دادن، اول کتاب درسی را باز میکند و از آن نقل میآورد.
۴. عامل پژوهشگر: حالتی تخصصی که میتواند وظایف طولانی را برنامهریزی کرده و با بررسی منابع وب، پاسخی مستند ارائه دهد.
امنیت و دسترسی
برای حفظ سادگی، اپلیکیشن تنها از Google Sign-in استفاده میکند. نقشهای کاربر در سمت سرور تعیین میشوند تا هیچ مسیر عمومی برای دسترسی غیرمجاز به دادهها وجود نداشته باشد. قرار است در مراحل نهایی، یک لایه دسترسی عمومی با محدودیت سختگیرانه برای تست کاربران باز شود.
نقشه راه ششمرحلهای
این پروژه در ۶ فاز ساختاریافته است تا هر مرحله در GitHub بازتولید پذیر باشد:
- فاز ۰: ایجاد پایهها، مدل داده و سیستم احرازباه هویت.
- فاز ۱: متصل کردن Claude در Bedrock به فرانتاند برای اولین چت جریانی.
- فاز ۲: پیادهسازی آپلود فایل و بازیابی اسناد.
- فاز ۳: توسعه حافظه بلندمدت برای بقای دادهها در گفتگوهای مجزا.
- فاز ۴: انتقال وظایف سنگین (عامل پژوهشگر) به یک Worker پسزمینه.
- فاز ۵: پیادهسازی اندازهگیری مصرف و کنترل هزینه در askclaudius.dev.
گسست از منطق رابطهای
یکی از مهمترین تغییرات فنی، حذف کامل جدول پیامهای سنتی است. دازا قصد دارد نشان دهد چرا مدل سندی برای تاریخچه گفتگوها، انتخابی برتر از جداول Join در SQL است. او گفتگو را نه به شکل ردیفهای تکهتکه، بلکه به عنوان یک «سند زنده» میبیند.
این رویکرد برای توسعهدهندگان مستقل، روایت را از «استفاده از ابزارهای AI» به «مالکیت چرخه AI» تغییر میدهد. با استفاده از لایه رایگان MongoDB Atlas، ثابت شد که قابلیتهای پیشرفته مثل حافظه بلندمدت دیگر پشت زیرساختهای گرانقیمت سازمانی نیستند.
گام بعدی شما
- بررسی مخزن گیتهاب پروژه برای مطالعه نحوه پیادهسازی مدل سندی بهجای جداول SQL.
- تست قابلیتهای RAG در لایه رایگان MongoDB Atlas برای کاهش هزینههای زیرساختی.
- دنبال کردن لانچ عمومی askclaudius.dev برای ارزیابی عملکرد یک عامل تک-پایگاهداده در مقیاس واقعی.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.




گفتگو