تصور کنید کتابخانهای از متون باستانی دارید که اگر بخواهید یکی را باز کنید، همان لحظه در دستان شما میسوزد و خاکستر میشود. این کابوس برای تاریخنگاران هرکولانیوم واقعی بود، اما حالا یک مدل هوش مصنوعی این بنبست را شکست.
به نقل از جامعه Vesuvius Challenge، در ۲۵ ژوئن ۲۰۲۶ اعلام شد که طومار PHerc. 1667 — که از زمان فوران کوه وزوو در سال ۷۹ میلادی مهروموم شده بود — برای نخستین بار بهطور کامل و از ابتدا تا انتها بهصورت مجازی باز شده و خوانده شده است. این دستاورد به معنای بازگشت یک اثر فلسفی دو هزار ساله از دنیای فراموشی است.
برای نزدیک به دو هزاره، کتابخانه کربنی هرکولانیوم یک پارادوکس بیرحمانه را ارائه میداد: طومارها از گرمای شدید آتشفشان جان سالم به در برده بودند، اما چنان شکننده شده بودند که هرگونه تلاش برای باز کردن فیزیکی آنها به معنای نابودی فوریشان بود. در واقع، خواندن یک طومار به معنای تخریب آن بود. به همین دلیل، اکثر این رولها به شکل تودههایی از کربن باقی مانده بودند؛ محتوای آنها حفظ شده بود اما برای تاریخنگاران دستنیافتنی بود.
همانطور که در تحلیلهای پیشین ما درباره کاربردهای بینرشتهای مدلهای زبانی اشاره کردیم، قدرت واقعی AI زمانی آشکار میشود که بتواند دادههای «ناخوانا» را به اطلاعات تبدیل کند. در اینجا، محققان از رویکردی شبیه به تولید بازیابی-افزا (RAG) — که در آن مدل ابتدا منبع داده را جستجو و سپس پاسخ میدهد — در مقیاس تحلیل دادههای بصری استفاده کردند تا الگوهای متنی را از میان لایههای کربنی استخراج کنند.
این موفقیت حاصل همکاری با European Synchrotron Radiation Facility (ESRF) در گرنوبل فرانسه است. محققان از تصویربرداری میکروتوموگرافی با تضاد فاز (phase-contrast X-ray microtomography) با رزولوشن بسیار بالا استفاده کردند. این ابزار پیشرفته قادر است لایههای بسیار نازک و متراکم پاپیروس را که در حالت عادی از زغال غیرقابل تشخیص هستند، تفکیک کند. طبق گزارش تیم پروژه، این عملیات در همکاری نزدیک با کتابخانه ملی ناپل «ویتوریو امانوئل سوم» که متولی حفاظت از پاپیروسهای هرکولانیوم است، انجام شده است.
فرآیند فنی بازخوانی
برای تبدیل یک توده سیاه و سوخته به یک کتاب خواندنی، تیم یک خط لوله دیجیتال چندمرحلهای را دنبال کرد:
- اسکن سهبعدی: استفاده از اشعه ایکس با رزولوشن بالا برای ثبت دقیق ساختار داخلی رول پاپیروس.
- بازسازی هندسی: تیم مسیر پیچخورده صفحه در داخل حجم طومار را ترسیم کرد و مارپیچ پاپیروس را ردیابی نمود.
- تختسازی مجازی: سطح منحنی پاپیروس بهصورت دیجیتالی بر روی یک صفحه دوبعدی تصویر شد تا سطحی قابل خواندن ایجاد گردد.
- تشخیص جوهر: آموزش شبکه عصبی (Neural Network) — که شبیه نقشهای از مترو است و سیگنالها را از ورودی به جواب میرساند — برای شناسایی سیگنالهای شیمیایی بسیار ضعیف جوهر باستانی که تقریباً با پاپیروس کربنی زیرین آن یکسان است.

یافتههای طومار PHerc. 1667
طومار PHerc. 1667 در واقع تکهای از یک رول بزرگتر است. تلاشهای پیشین برای باز کردن دستی این طومار — که در قرن نوزدهم، سال ۱۹۶۹ و دهه ۱۹۸۰ صورت گرفته بود — منجر به نابودی لایههای بیرونی آن شد. این تخریبها باعث شد تنها یک هسته مرکزی متراکم باقی بماند که عرض آن تنها ۸ سانتیمتر از ارتفاع اصلی ۱۹ تا ۲۴ سانتیمتری بود. با وجود این آسیبهای شدید، هوش مصنوعی توانست حدود ۱.۴ متر پاپیروس را بازیابی کند که شامل ۲۲ ستون متن یونانی است.
این یک نقطه عطف است، زیرا برای نخستین بار متن حفظشده در یک طومار هرکولانیوم بهصورت پیوسته از ابتدا تا انتها خوانده شده است، نه بهصورت کلمات پراکنده یا تکههای جداگانه. این ستونهای متن توسط پاپیروسشناسان حرفهای نسخهبرداری و بازبینی شدهاند.
محتوا و بستر فلسفی
متن استخراج شده، یک رساله فلسفی درباره اخلاق است. شواهد موجود بهشدت نشان میدهد که این یک اثر رواقی (Stoic) است که بر طبیعت انسان، تکانه (Impulse) و پیشرفت اخلاقی انسان تمرکز دارد. بر اساس زبان و مضامین متن، تاریخ نگارش آن به قرن دوم پیش از میلاد بازمیگردد.
نکته کلیدی این است که در آخرین ستون حفظشده، نام «آریستوکرئون» دیده میشود؛ او برادرزاده و شاگرد «کریسیپوس»، فیلسوف بزرگ و اثرگذار مکتب رواقی بود. به دلیل آسیبهای فیزیکی پاپیروس، نتایج بهصورت قطعاتی است و در جاهایی که سطح پاپیروس از بین رفته، شکافهایی وجود دارد. با این حال، چندین عبارت اکنون برای نخستین بار در دو هزار سال گذشته بهوضوح قابل خواندن هستند:
- «... ما درباره چیزی تحقیق خواهیم کرد، اما اگر به نوعی از خود و طبیعت خود فاصله بگیریم، آن را درک نخواهیم کرد...»
- «... با تلاش حداکثری در پژوهش و یادگیری... در حالی که همان حکمت عملی را داریم...»
- «... چنین کالاهایی برای ما مفید است، حتی از شرور متضاد آن نیز نه چیزی نیکو خواهد بود — چه رسد به زیبا — و نه چیزی بد — چه رسد به زشت — و نه سعادتی...»
گسترش متدولوژی به سایر طومارها
تیم برای اثبات اینکه این روش در مقیاس بزرگ قابل اجراست، تصویربرداریهای بهبودیافته را روی طومارهای دیگر نیز اعمال کرد. در طومار PHerc. Paris 4 (Scroll 1)، دادههای با رزولوشن بالاتر باعث شد جوهر برای نخستین بار مستقیماً در اسکنهای سهبعدی اشعه ایکس قابل مشاهده باشد. این فرآیند شامل قطعهبندی (segmenting) جوهر در فضای سهبعدی و سپس تصویر کردن مجدد آن بر روی صفحه بازشده بود.

این قطعهبندی سهبعدی با نتایج خوانش «جایزه بزرگ» در سال ۲۰۲۳ بهطور کامل (یک به یک) مطابقت داشت. این امر یک تأیید مستقل از طریق دادههای باکیفیتتر بود که ثابت میکرد خوانشهای قبلی واقعی و درست بودهاند.

علاوه بر این، تیم موفق شد عنوان و نویسنده طومار PHerc. 139 را شناسایی کند. با تقویت سیگنال جوهر در ناحیه عنوان، این اثر به عنوان کتاب هشتم «درباره خدایان» اثر «فیلودموس» شناسایی شد. فیلودموس فیلسوف اپیکوری بود که بخش بزرگی از این کتابخانه را آثار او تشکیل میدهد. توانایی خواندن عنوان یک طومار بسته به محققان اجازه میدهد تا پیش از مطالعه حتی یک ستون از بدنه متن، از محتوای کلی آن آگاه شوند.
مدل علم باز (Open Science)
این دستاورد نتیجه کار یک آزمایشگاه شرکتی بسته نبود، بلکه حاصل یک تلاش جهانی در قالب «علم باز» بود. پروفسور برنت سیلز از EduceLab پیشگام فناوری باز کردن مجازی بود. او در سال ۲۰۲۳ فناوری تصویربرداری و نرمافزاری آزمایشگاه خود را در اختیار Vesuvius Challenge قرار داد؛ تلاشی عمومی و وابسته به کمکهای مالی که توسط نات فریدمن و دانیل گراس بنیانگذاری شد.
بسیار حیاتی است که بدانیم تمام دادهها باز میمانند. دادههای توموگرافی، سطوح بازسازی شده و نسخهبرداریها تحت لایسنس Creative Commons در سایت scrollprize.org/data منتشر شده و در ESRF آرشیو شدهاند. همچنین کدهای برنامهنویسی در گیتهاب در دسترس همگان است.
طبق مستندات پروژه، بیشتر اعضای تیم تحقیقاتی فعلی، ابتدا به عنوان شرکتکننده در این مسابقه وارد شدند. آنها در رقابتهای باز شرکت کردند، برای پیشرفتهای خود جایزه گرفتند و متعاقباً به تیم اصلی جذب شدند که خواندن PHerc. 1667 را به پایان رساند. جامعه جهانی ایجاد شده توسط این چالش، مسئول اصلی این موفقیت است.
تحلیل: عصر جدید در دیرینهشناسی
این تحول، مطالعه متون باستانی را از «خوانش گمانهزن» — که در آن محققان حروف را بر اساس تکههایی از جوهر قابل مشاهده حدس میزدند — به یک فرآیند صنعتی مقیاسپذیر تبدیل میکند. با جدا کردن عمل خواندن از عمل باز کردن فیزیکی، ریسک نابودی اثرات تاریخی به صفر میرسد و روشی ایجاد شده که در برابر بررسیهای مستقل مقاوم است.
برای حوزه AI، این یک اثبات مهم است که مدلهای یادگیری ماشین میتوانند مسئله «سوزنی در انبار کاه» را حل کنند؛ یعنی زمانی که سیگنال (جوهر کربنی) تقریباً با نویز (پاپیروس کربنی) یکسان باشد و تفکیک آنها غیرممکن به نظر برسد.
گام بعدی شما
- متن کامل و ستونبهستون بازخوانی شده را در فایل PDF پیشچاپ مطالعه کنید.
- کدهای متنباز این پروژه را در گیتهاب بررسی کنید تا با نحوه پردازش تصویر سهبعدی آشنا شوید.
- در سایت scrollprize.org/data دادههای خام توموگرافی را کاوش کنید و به جامعهای بپیوندید که این طومارها را میخوانند.
صدها طومار مهروموم شده دیگر باقی ماندهاند که احتمالاً حاوی آثار گمشده فلسفه، شعر و نثر هستند و منتظرند برای نخستین بار از دوران باستان خوانده شوند. این متد برای مقیاسپذیری ساخته شده است؛ به تحلیل ما درباره آینده مدلهای بینایی-زبانی مراجعه کنید.




گفتگو