تصور کنید میخواهید یک بنای تاریخی را پیش از آنکه فرسوده شود، برای همیشه در فضای دیجیتال منجمد کنید؛ این کار نیازمند تعادلی دقیق میان جزئیات بصری و سرعت پردازش است. طبق گزارش منتشرشده در ۲۶ ژوئن ۲۰۲۶، پژوهگری در PreserveMy.World — سازمان غیردولتی متمرکز بر میراث فرهنگی دیجیتال — پیادهسازی جریانهای کاری مبتنی بر هوش مصنوعی را برای این هدف آغاز کرده است.
دیجیتالی کردن مکانهایی مثل مسجد بادشاهی لاهور، فراتر از عکاسی ساده است. با استفاده از هوش مصنوعی زاینده (Generative AI) — که شبیه نقاشی است که یاد گرفته چگونه از روی توصیفات، تصاویر جدید بسازد — تیم پروژه میتواند سوابق سهبعدی غ immersion-worthy ایجاد کند. این یعنی حتی اگر سازههای فیزیکی تخریب شوند، تاریخ شهری به یک دارایی دیجیتال دائمی تبدیل میشود.
همانطور که در تحلیلهای پیشین ما دربارهی مدلهای بینایی-زبانی اشاره کردیم، ادغام دادههای بصری با تحلیلهای ساختاری کلید موفقیت این پروژههاست. این رویکرد با تلاشهایی برای بهبود دقت مکانی از طریق رابطهای کد-محور در مدلهای بینایی-زبانی همسو است تا بازسازیها با واقعیت تطابق بیشتری داشته باشند. به نقل از وبسایت dev.to، این پروژه در حال حاضر پنج متدولوژی اصلی را آزمایش میکند:
- COLMAP: تبدیل چندین عکس به یک ابر نقاط سهبعدی با استفاده از متد Structure-from-Motion.
- NeRF (Neural Radiance Fields): تولید صحنههایی با واقعگرایی خیرهکننده که البته به توان پردازشی بالای واحد پردازش گرافیکی (GPU) — یعنی همان موتور قدرتمندی که بازیهای سنگین را اجرا میکند — نیاز دارد.
- Gaussian Splatting: روشی بهینه برای رندرینگ با کیفیت بالا در پلتفرمهای وب.
- Monocular Depth Estimation: تخمین عمق از یک تصویر یا ویدیو؛ کاربردیترین ابزار برای بررسیهای میدانی سریع.
- Multi-View Stereo (MVS): بهترین گزینه برای بازسازی متراکم نمای ساختمانها.
در مراحل اولیه، یک اسکریپت پایتون برای شبیهسازی تخمین عمق تکتصویری نوشته شد تا امکانسنجی خط لوله (Pipeline) بررسی شود. بر اساس مستندات پروژه، اگرچه جمعآوری دادههای واقعی در ابتدا با خطاهای ۴۰۳ در API مواجه شد، اما نقشههای عمق شبیهسازیشده، موفقیت فنی این رویکرد را تأیید کردند.
این تنوع در روشهای بازسازی به پروژه اجازه میدهد ابزار خود را با محیط تطبیق دهد. استفاده از Gaussian Splatting برای وب و تخمین عمق تکتصویری برای پیمایشهای سریع، استراتژی حفظ میراث را مقیاسپذیر میکند تا برای هر مکان نیازی به تجهیزات گرانقیمت و تخصصی نباشد. این تلاش برای بهینهسازی ابزارها، یادآور تغییر رویکرد در برخی صنایع است، مانند زمانی که Tri-Fort برای تخمین دقیقتر هزینههای ساختساز، از یادگیری ماشین خالص به موتور ترکیبی روی آورد.
گام بعدی شما
- بررسی مخزن PMW-day1 در گیتهاب برای مطالعه کدهای شبیهسازی.
- تست ابزارهای متنباز Gaussian Splatting برای دیجیتالی کردن اشیای کوچک.
- دنبال کردن پیشرفتهای مدلهای تخمین عمق در پردازش تصاویر تکنفره.
اما چالش اصلی، تبدیل این مدلهای سنگین به ابزارهای سبک برای موبایل است؛ به تحلیل ما دربارهی کوانتش وزنها مراجعه کنید.




گفتگو