هوش مصنوعی نخستین طومار کامل هرکولانیوم را پس از ۲۰۰۰ سال خواند

تصور کنید کتابخانه‌ای از متون باستانی دارید که اگر بخواهید یکی را باز کنید، همان لحظه در دستان شما می‌سوزد و خاکستر می‌شود. این کابوس برای تاریخ‌نگاران هرکولانیوم واقعی بود، اما حالا یک مدل هوش مصنوعی این بن‌بست را شکست.

به نقل از جامعه Vesuvius Challenge، در ۲۵ ژوئن ۲۰۲۶ اعلام شد که طومار PHerc. 1667 — که از زمان فوران کوه وزوو در سال ۷۹ میلادی مهروموم شده بود — برای نخستین بار به‌طور کامل و از ابتدا تا انتها به‌صورت مجازی باز شده و خوانده شده است. این دستاورد به معنای بازگشت یک اثر فلسفی دو هزار ساله از دنیای فراموشی است.

برای نزدیک به دو هزاره، کتابخانه کربنی هرکولانیوم یک پارادوکس بی‌رحمانه را ارائه می‌داد: طومارها از گرمای شدید آتشفشان جان سالم به در برده بودند، اما چنان شکننده شده بودند که هرگونه تلاش برای باز کردن فیزیکی آن‌ها به معنای نابودی فوری‌شان بود. در واقع، خواندن یک طومار به معنای تخریب آن بود. به همین دلیل، اکثر این رول‌ها به شکل توده‌هایی از کربن باقی مانده بودند؛ محتوای آن‌ها حفظ شده بود اما برای تاریخ‌نگاران دست‌نیافتنی بود.

همان‌طور که در تحلیل‌های پیشین ما درباره کاربردهای بین‌رشته‌ای مدل‌های زبانی اشاره کردیم، قدرت واقعی AI زمانی آشکار می‌شود که بتواند داده‌های «ناخوانا» را به اطلاعات تبدیل کند. در اینجا، محققان از رویکردی شبیه به تولید بازیابی-افزا (RAG) — که در آن مدل ابتدا منبع داده را جستجو و سپس پاسخ می‌دهد — در مقیاس تحلیل داده‌های بصری استفاده کردند تا الگوهای متنی را از میان لایه‌های کربنی استخراج کنند.

این موفقیت حاصل همکاری با European Synchrotron Radiation Facility (ESRF) در گرنوبل فرانسه است. محققان از تصویربرداری میکروتوموگرافی با تضاد فاز (phase-contrast X-ray microtomography) با رزولوشن بسیار بالا استفاده کردند. این ابزار پیشرفته قادر است لایه‌های بسیار نازک و متراکم پاپیروس را که در حالت عادی از زغال غیرقابل تشخیص هستند، تفکیک کند. طبق گزارش تیم پروژه، این عملیات در همکاری نزدیک با کتابخانه ملی ناپل «ویتوریو امانوئل سوم» که متولی حفاظت از پاپیروس‌های هرکولانیوم است، انجام شده است.

فرآیند فنی بازخوانی

برای تبدیل یک توده سیاه و سوخته به یک کتاب خواندنی، تیم یک خط لوله دیجیتال چندمرحله‌ای را دنبال کرد:

اسکن سه‌بعدی: استفاده از اشعه ایکس با رزولوشن بالا برای ثبت دقیق ساختار داخلی رول پاپیروس.
بازسازی هندسی: تیم مسیر پیچ‌خورده صفحه در داخل حجم طومار را ترسیم کرد و مارپیچ پاپیروس را ردیابی نمود.
تخت‌سازی مجازی: سطح منحنی پاپیروس به‌صورت دیجیتالی بر روی یک صفحه دو‌بعدی تصویر شد تا سطحی قابل خواندن ایجاد گردد.
تشخیص جوهر: آموزش شبکه عصبی (Neural Network) — که شبیه نقشه‌ای از مترو است و سیگنال‌ها را از ورودی به جواب می‌رساند — برای شناسایی سیگنال‌های شیمیایی بسیار ضعیف جوهر باستانی که تقریباً با پاپیروس کربنی زیرین آن یکسان است.

PHerc. 1667 from sealed roll to readable text: a photograph of the carbonized roll, transverse and longitudinal CT cross-sections, and the unwrapped surface showing columns of Greek.

یافته‌های طومار PHerc. 1667

طومار PHerc. 1667 در واقع تکه‌ای از یک رول بزرگتر است. تلاش‌های پیشین برای باز کردن دستی این طومار — که در قرن نوزدهم، سال ۱۹۶۹ و دهه ۱۹۸۰ صورت گرفته بود — منجر به نابودی لایه‌های بیرونی آن شد. این تخریب‌ها باعث شد تنها یک هسته مرکزی متراکم باقی بماند که عرض آن تنها ۸ سانتی‌متر از ارتفاع اصلی ۱۹ تا ۲۴ سانتی‌متری بود. با وجود این آسیب‌های شدید، هوش مصنوعی توانست حدود ۱.۴ متر پاپیروس را بازیابی کند که شامل ۲۲ ستون متن یونانی است.

این یک نقطه عطف است، زیرا برای نخستین بار متن حفظ‌شده در یک طومار هرکولانیوم به‌صورت پیوسته از ابتدا تا انتها خوانده شده است، نه به‌صورت کلمات پراکنده یا تکه‌های جداگانه. این ستون‌های متن توسط پاپیروس‌شناسان حرفه‌ای نسخه‌برداری و بازبینی شده‌اند.

محتوا و بستر فلسفی

متن استخراج شده، یک رساله فلسفی درباره اخلاق است. شواهد موجود به‌شدت نشان می‌دهد که این یک اثر رواقی (Stoic) است که بر طبیعت انسان، تکانه (Impulse) و پیشرفت اخلاقی انسان تمرکز دارد. بر اساس زبان و مضامین متن، تاریخ نگارش آن به قرن دوم پیش از میلاد بازمی‌گردد.

نکته کلیدی این است که در آخرین ستون حفظ‌شده، نام «آریستوکرئون» دیده می‌شود؛ او برادرزاده و شاگرد «کریسیپوس»، فیلسوف بزرگ و اثرگذار مکتب رواقی بود. به دلیل آسیب‌های فیزیکی پاپیروس، نتایج به‌صورت قطعاتی است و در جاهایی که سطح پاپیروس از بین رفته، شکاف‌هایی وجود دارد. با این حال، چندین عبارت اکنون برای نخستین بار در دو هزار سال گذشته به‌وضوح قابل خواندن هستند:

«... ما درباره چیزی تحقیق خواهیم کرد، اما اگر به نوعی از خود و طبیعت خود فاصله بگیریم، آن را درک نخواهیم کرد...»
«... با تلاش حداکثری در پژوهش و یادگیری... در حالی که همان حکمت عملی را داریم...»
«... چنین کالاهایی برای ما مفید است، حتی از شرور متضاد آن نیز نه چیزی نیکو خواهد بود — چه رسد به زیبا — و نه چیزی بد — چه رسد به زشت — و نه سعادتی...»

گسترش متدولوژی به سایر طومارها

تیم برای اثبات اینکه این روش در مقیاس بزرگ قابل اجراست، تصویربرداری‌های بهبودیافته را روی طومارهای دیگر نیز اعمال کرد. در طومار PHerc. Paris 4 (Scroll 1)، داده‌های با رزولوشن بالاتر باعث شد جوهر برای نخستین بار مستقیماً در اسکن‌های سه‌بعدی اشعه ایکس قابل مشاهده باشد. این فرآیند شامل قطعه‌بندی (segmenting) جوهر در فضای سه‌بعدی و سپس تصویر کردن مجدد آن بر روی صفحه بازشده بود.

Higher-resolution cross-section of PHerc. Paris 4 showing ink directly visible on the papyrus surface, with the ink segmented in three dimensions.

این قطعه‌بندی سه‌بعدی با نتایج خوانش «جایزه بزرگ» در سال ۲۰۲۳ به‌طور کامل (یک به یک) مطابقت داشت. این امر یک تأیید مستقل از طریق داده‌های باکیفیت‌تر بود که ثابت می‌کرد خوانش‌های قبلی واقعی و درست بوده‌اند.

PHerc. Paris 4: the 2023 Grand Prize reading compared with the 2024 high-resolution synchrotron result, showing markedly clearer letters.

علاوه بر این، تیم موفق شد عنوان و نویسنده طومار PHerc. 139 را شناسایی کند. با تقویت سیگنال جوهر در ناحیه عنوان، این اثر به عنوان کتاب هشتم «درباره خدایان» اثر «فیلودموس» شناسایی شد. فیلودموس فیلسوف اپیکوری بود که بخش بزرگی از این کتابخانه را آثار او تشکیل می‌دهد. توانایی خواندن عنوان یک طومار بسته به محققان اجازه می‌دهد تا پیش از مطالعه حتی یک ستون از بدنه متن، از محتوای کلی آن آگاه شوند.

مدل علم باز (Open Science)

این دستاورد نتیجه کار یک آزمایشگاه شرکتی بسته نبود، بلکه حاصل یک تلاش جهانی در قالب «علم باز» بود. پروفسور برنت سیلز از EduceLab پیشگام فناوری باز کردن مجازی بود. او در سال ۲۰۲۳ فناوری تصویربرداری و نرم‌افزاری آزمایشگاه خود را در اختیار Vesuvius Challenge قرار داد؛ تلاشی عمومی و وابسته به کمک‌های مالی که توسط نات فریدمن و دانیل گراس بنیان‌گذاری شد.

بسیار حیاتی است که بدانیم تمام داده‌ها باز می‌مانند. داده‌های توموگرافی، سطوح بازسازی شده و نسخه‌برداری‌ها تحت لایسنس Creative Commons در سایت scrollprize.org/data منتشر شده و در ESRF آرشیو شده‌اند. همچنین کدهای برنامه‌نویسی در گیت‌هاب در دسترس همگان است.

طبق مستندات پروژه، بیشتر اعضای تیم تحقیقاتی فعلی، ابتدا به عنوان شرکت‌کننده در این مسابقه وارد شدند. آن‌ها در رقابت‌های باز شرکت کردند، برای پیشرفت‌های خود جایزه گرفتند و متعاقباً به تیم اصلی جذب شدند که خواندن PHerc. 1667 را به پایان رساند. جامعه جهانی ایجاد شده توسط این چالش، مسئول اصلی این موفقیت است.

تحلیل: عصر جدید در دیرینه‌شناسی

این تحول، مطالعه متون باستانی را از «خوانش گمانه‌زن» — که در آن محققان حروف را بر اساس تکه‌هایی از جوهر قابل مشاهده حدس می‌زدند — به یک فرآیند صنعتی مقیاس‌پذیر تبدیل می‌کند. با جدا کردن عمل خواندن از عمل باز کردن فیزیکی، ریسک نابودی اثرات تاریخی به صفر می‌رسد و روشی ایجاد شده که در برابر بررسی‌های مستقل مقاوم است.

برای حوزه AI، این یک اثبات مهم است که مدل‌های یادگیری ماشین می‌توانند مسئله «سوزنی در انبار کاه» را حل کنند؛ یعنی زمانی که سیگنال (جوهر کربنی) تقریباً با نویز (پاپیروس کربنی) یکسان باشد و تفکیک آن‌ها غیرممکن به نظر برسد.

گام بعدی شما

متن کامل و ستون‌به‌ستون بازخوانی شده را در فایل PDF پیش‌چاپ مطالعه کنید.
کدهای متن‌باز این پروژه را در گیت‌هاب بررسی کنید تا با نحوه پردازش تصویر سه‌بعدی آشنا شوید.
در سایت scrollprize.org/data داده‌های خام توموگرافی را کاوش کنید و به جامعه‌ای بپیوندید که این طومارها را می‌خوانند.

صدها طومار مهروموم شده دیگر باقی مانده‌اند که احتمالاً حاوی آثار گمشده فلسفه، شعر و نثر هستند و منتظرند برای نخستین بار از دوران باستان خوانده شوند. این متد برای مقیاس‌پذیری ساخته شده است؛ به تحلیل ما درباره آینده مدل‌های بینایی-زبانی مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.