سامانه Data2Story صحت ۹۳ درصدی ادعاهای داده‌محور را تضمین کرد

اگر تحلیلگر کسب‌وکار هستید یا روزنامه‌نگار داده، می‌دانید که کلنجار رفتن با جداول اکسل برای رسیدن به یک داستان بصری و صیقل‌خورده، معمولاً روزها کار دستی برای رسم نمودارها و بازبینی واقعیت‌ها (fact-checking) زمان می‌برد. این گردش‌کار با ظهور Data2Story به‌کلی تغییر می‌کند؛ سیستمی که کل خط لوله تولید، از یک فایل CSV خام تا یک مقاله وب تعاملی، تأییدشده و نهایی را به‌طور کامل خودکار می‌کند. تبدیل فایل CSV به گزارش خبری تعاملی و تأییدشده با هفت عامل هوش مصنوعی

این سامانه به‌گونه‌ای طراحی شده است تا مجموعه‌داده‌های خام را بدون هیچ‌گونه دخالت انسانی به مقالات وب چندوجهی (Multimodal) تبدیل کند. Data2Story قادر است درباره موضوعات بسیار متنوعی داستان بنویسد؛ از تحلیل نحوه گذراندن روزمره مردم گرفته تا بررسی روندهای مقالات در ArXiv. این قابلیت تحلیل متون علمی در زمانی توسعه می‌یابد که اشتراک‌گذاری کد و داده در مقالات هوش مصنوعی در arXiv رشد چشمگیری داشته است و دسترسی به منابع خام را تسهیل کرده است. یکی از دموهای اصلی این سیستم بر روی جدول زمان‌بندی جام جهانی ۲۰۲۶ فیفا تمرکز دارد. سیستم با تحلیل شهرهای میزبان و برنامه‌زمان‌بندی مسابقات، مقاله‌ای با محوریت اقلیم و یک نقشه تعاملی تولید کرد. یکی از یافته‌های کلیدی در این گزارش این است که حدود ۴ از هر ۱۰ مسابقه در مکان‌هایی برنامه‌ریزی شده‌اند که اتحادیه بازیکنان (FIFPRO) آن‌ها را در گروه «ریسک گرمای بسیار بالا» طبقه‌بندی کرده است. سیستم همچنین اشاره می‌کند که رطوبت، و نه دمای هوا، محرک اصلی این ریسک است؛ هرچود نویسندگان تأکید می‌کنند که این‌ها شرایط اقلیمی معمول آن مناطق هستند و پیش‌بینی خاصی برای دوره برگزاری تورنمنت محسوب نمی‌شوند.

این پیشرفت در لحظه‌ای حیاتی برای اعتماد به هوش مصنوعی رخ می‌دهد. مدل‌های زبانی بزرگ (LLM) فعلی به‌کرات از «توهم ارجاع» (attribution hallucination) رنج می‌برند؛ وضعیتی که در آن مدل پاسخ درست را ارائه می‌دهد اما منبعی را ذکر می‌کند که اصلاً وجود خارجی ندارد. طبق گزارشی از دانشگاه پکن، مدل‌های پیشرو اغلب در این آزمون پایه «مبنایابی» (grounding) شکست می‌خورند. مطالعه دیگری نشان می‌دهد که عوامل جست‌وجوی AI اغلب اصلاً تحقیق نمی‌کنند و در عوض، بیشتر آنچه را که از طریق داده‌های آموزشی خود می‌دانند، تأیید می‌کنند. Data2Story تلاش می‌کند این مشکل را با تغییری بنیادین حل کند: به جای اینکه با AI به عنوان یک «نویسنده» برخورد کند، آن را به عنوان یک «تحریریه هماهنگ» می‌بیند.

مکانیسم تحریریه مجازی

این سیستم بر پایه زنجیره‌ای از ۷ عامل (Agent) تخصصی کار می‌کند که در قالب یک «تحریریه مجازی» عمل می‌کنند. این جریان کاری تحریریه، مسیری ساختارمند از مرحله تحقیق تا صفحه‌آرایی نهایی را تضمین می‌کند:

کارآگاه (Detective): برای یافتن زمینه (Context) در وب جست‌وجو می‌کند؛ زیرا جدول‌های خام به‌ندرت کل داستان را روایت می‌کنند. برای داده‌های جام جهانی، کارآگاه توانست شهرهای میزبان را به داده‌های اقلیمی Open-Meteo و رتبه‌بندی ریسک گرمای FIFPRO متصل کند.
تحلیلگر (Analyst): به‌جای حدس زدن اعداد، کد می‌نویسد و آن را اجرا می‌کند تا ارقام دقیق به‌صورت محاسباتی استخراج شوند.
ویراستار (Editor): تصمیم می‌گیرد که کدام یافته‌های خاص باید روایت کلی داستان را پیش ببرند.
طراح (Designer): رسانه مناسب برای نمایش داده‌ها را انتخاب می‌کند؛ مثلاً استفاده از نقشه برای داده‌های جغرافیایی یا کلیپ صوتی برای موضوعات موسیقی.
برنامه‌نویس (Programmer): صفحه HTML واقعی و نهایی را پیاده‌سازی و کدنویسی می‌کند.
حسابرس (Auditor): چیدمان نهایی را برای یافتن هرگونه خطای بصری یا ساختاری بررسی می‌کند.
بازرس (Inspector): هر المان موجود در مقاله را به منبع اصلی‌اش بازمی‌گرداند و گره می‌زند.

تبدیل فایل CSV به گزارش خبری تعاملی تأییدشده با هفت عامل هوش مصنوعی

اجرای فنی توسط «بازرس» نهایی می‌شود که یک لایه ردیابی (Traceability layer) ایجاد می‌کند. این پنل بازرس، شواهد ساختارمندی را برای هر جمله و هر دارایی بصری نمایش می‌دهد. هر نمودار حاشیه‌نویسی شده، المان تعاملی و هر جمله، یک «کارت شناسایی» دارد که یا URL خارجی پشتیبان ادعا را نشان می‌دهد و یا دقیقاً خط کد و فایل داده‌ای که پشت آن عدد است را نمایش می‌دهد. این ویژگی به خوانندگان اجازه می‌دهد با یک اسکریپت قابل اجرا تعامل داشته باشند که ارقام را مستقیماً از داده‌های خام دوباره محاسبه می‌کند. تبدیل خودکار داده‌های CSV به گزارش خبری تعاملی و تأییدشده با هفت عامل هوش مصنوعی

بنچ‌مارک در برابر انسان‌ها

پژوهشگران برای آزمایش Data2Story، ۱۸ مجموعه‌داده عمومی را با نمونه‌های مشابه که توسط انسان نوشته شده بودند، جفت کردند. این منابع انسانی از سه منبع متمایز بودند: گزارش‌های موجز و مختصر The Economist، روایت‌های بلند با طراحی مجلل از The Pudding و مجموعه‌داده‌های جامعه‌محور از TidyTuesday. در نهایت، ۵۳ خواننده دعوت شدند تا هر دو نسخه را در ۵ دسته رتبه‌بندی کنند: طراحی بصری، ریتم روایت، شفافیت داده‌ها، تأییدپذیری ادعاها و میزان بینش به‌دست آمده.

نتایج به‌دست آمده تکان‌دهنده بود: ۷۴٪ از خوانندگان مقالات تولیدشده توسط عامل‌ها را ترجیح دادند، در حالی که ۲۵٪ نسخه انسانی را انتخاب کردند و تنها ۲٪ نتیجه را مساوی دانستند.

پیشتازی در شفافیت: Data2Story در هر ۵ دسته برنده شد. بیشترین فاصله در بخش شفافیت بود، جایی که امتیاز این سیستم ۱.۴۹ واحد در مقیاس ۷ درجه‌ای بالاتر از انسان بود.
شکاف تأییدپذیری: ۹۳٪ از تمام اظهارات قابل مشاهده در مقالات تولیدشده توسط عامل‌ها، قابل تأیید بودند. در مقابل، در نسخه‌های انسانی این رقم تنها ۲۵٪ بود؛ دلیل اصلی این است که روزنامه‌نگاران به‌ندرت کدهای تحلیل خود را منتشر می‌کنند. پژوهشگران ادعا می‌کنند این شکاف هم نشان‌دهنده نقطه قوت سیستم است و هم نشان‌دهنده حفره‌ای در عملکردهای فعلی روزنامه‌نگاری.
پوشش محتوایی: هنگام اندازه‌گیری هم‌پوشانی اظهارات، Data2Story حدود نیمی از دیدگاه‌های انسانی را پوشش می‌دهد. در مقابل، روزنامه‌نگاران تنها یک‌سوم (۳۵٪) از اظهارات عامل AI را شکار می‌کنند. این شکاف در گزارش‌های فرمالیستی اکونومیست در کمترین حالت است؛ جایی که عامل توانست ۷۳٪ از یافته‌های انسانی را بازتولید کند، زیرا آن متون از آمارهای استانداردی پیروی می‌کنند که عامل به‌راحتی می‌تواند محاسبه کند.

تبدیل فایل CSV به گزارش خبری تعاملی تأییدشده با هفت عامل هوش مصنوعی

جایی که انسان‌ها هنوز برنده هستند

با وجود بهره‌وری بالا، پژوهشگران سه حوزه را شناسایی کردند که در آن‌ها روزنامه‌نگاری انسانی همچنان برتر است:

۱. دیدگاه تحریریه (Editorial Perspective): خبرنگاران با استفاده از گزارشگری میدانی و تئوری، «چرایی» پشت داده‌ها را توضیح می‌دهند. در گزارشی درباره «کافه‌های تعمیرات» (Repair Cafes)، نویسنده انسانی توانست نرخ پایین تعمیرات را به سیاست تولیدکنندگان گوشی، خودرو و تراکتور مرتبط کند که به‌طور عمدی دسترسی به ابزارهای تشخیصی و قطعات را مسدود کرده‌اند. در مقابل، عامل AI فقط توانست نرخ تعمیرات را بر اساس نوع محصول نمودار کند؛ اما نتوانست تئوری «ماتریس انسداد شرکاتی» را کشف کند. تبدیل فایل CSV به گزارش خبری تعاملی تأییدشده با هفت عامل هوش مصنوعی

۲. طراحی خلاق رابط کاربری (Creative Interface Design): تیم‌های انسانی می‌توانند داده را به یک «تجربه» تبدیل کنند. در مقاله‌ای درباره کمدی استندآپ، وب‌سایت The Pudding متن کامل یک نمایش علی وانگ را به رابط کاربری تبدیل کرد که در آن اندازه دایره‌ها متناسب با طول خنده‌های Publikum بود. در مقابل، Data2Story به‌سادگی یک تصویر بندانگشتی (Thumbnail) استاتیک و قابل کلیک از یوتیوب قرار داد. تبدیل فایل CSV به گزارش خبری تعاملی تاییدشده با هفت عامل هوش مصنوعی

۳. تراکم گرافیکی (Graphic Density): طراحان انسانی می‌توانند اطلاعات را به‌طور موثرتری لایه‌بندی کنند. اکونومیست اغلب ارائه‌دهندگان دولتی و تجاری، نرخ موفقیت و حاشیه‌نویسی‌ها را در یک گرافیک متراکم واحد برای موضوع «رقابت فضایی» جای می‌دهد. اما Data2Story همان داده‌ها را در چندین نمودار تعاملی ساده‌تر پخش کرد، که باعث شد نکته اصلی روایت در میان نمودارهای متعدد گم شود. تبدیل فایل CSV به گزارش خبری تعاملی تاییدشده با هفت عامل هوش مصنوعی

زیرساخت فنی

این سیستم توسط مدل Claude Opus 4.7 که روی Claude Code اجرا می‌شود، قدرت می‌گیرد. برای مدیریت المان‌های چندوجهی، سیستم مدل‌های OpenRouter را ادغام کرده است؛ از جمله gpt-5.4-image-2 برای تولید تصاویر، و مدل‌های seedance-2.0 و lyria-3-pro-preview برای صوت و ویدیو.

این تغییر نشان‌دهنده حرکتی به سمت فلسفه «جست‌وجو به‌مثابه کد» (Search as Code) است؛ فلسفه‌ای مشابه آخرین به‌روزرسانی‌های Perplexity، که در آن مدل به‌جای تکیه بر یک API جعبه‌سیاه، ابزارهای جست‌وجو و محاسباتی خودش را می‌نویسد. این امر تضمین می‌کند که اگر خواننده‌ای به یک رقم شک کرد، می‌تواند شخصاً کد زیرین را اجرا کند تا خروجی را تأیید نماید. در دنیای مدل‌های زبانی، دقت در محاسبات و خروجی‌ها حیاتی است، همان‌طور که در تحلیل‌های مربوط به اثرات زیست‌محیطی AI، چارچوب‌های دقیق برای اصلاح تخمین‌های نادرست طراحی شده‌اند تا از توهمات عددی جلوگیری شود.

برای تحریریه‌ها، این ابزار به عنوان یک «همکار» معرفی شده است، نه جایگزین. انسان‌ها دیدگاه و گزارشگری را فراهم می‌کنند و عامل‌ها محاسبات و مستندسازی منابع قابل تأیید توسط ماشین را بر عهده می‌گیرند. این سیستم به‌ویژه برای مجموعه‌داده‌های تخصصی (Niche) که به‌دلیل کمبود نیروی انسانی هرگز به داستان تبدیل نمی‌شوند، بسیار مفید است. در حال حاضر سیستم به‌صورت «خلبان خودکار کامل» (full autopilot) اجرا می‌شود، اما پژوهشگران قصد دارند در نسخه‌های آینده بازخوردهای «انسان در حلقه» (human-in-the-loop) را پیاده‌سازی کنند. پروژه در آدرس data2story.github.io فعال است و کدهای آن در گیت‌هاب در دسترس است.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

مکانیسم تحریریه مجازی

کارآگاه (Detective): برای یافتن زمینه (Context) در وب جست‌وجو می‌کند؛ زیرا جدول‌های خام به‌ندرت کل داستان را روایت می‌کنند. برای داده‌های جام جهانی، کارآگاه توانست شهرهای میزبان را به داده‌های اقلیمی Open-Meteo و رتبه‌بندی ریسک گرمای FIFPRO متصل کند.
تحلیلگر (Analyst): به‌جای حدس زدن اعداد، کد می‌نویسد و آن را اجرا می‌کند تا ارقام دقیق به‌صورت محاسباتی استخراج شوند.
ویراستار (Editor): تصمیم می‌گیرد که کدام یافته‌های خاص باید روایت کلی داستان را پیش ببرند.
طراح (Designer): رسانه مناسب برای نمایش داده‌ها را انتخاب می‌کند؛ مثلاً استفاده از نقشه برای داده‌های جغرافیایی یا کلیپ صوتی برای موضوعات موسیقی.
برنامه‌نویس (Programmer): صفحه HTML واقعی و نهایی را پیاده‌سازی و کدنویسی می‌کند.
حسابرس (Auditor): چیدمان نهایی را برای یافتن هرگونه خطای بصری یا ساختاری بررسی می‌کند.
بازرس (Inspector): هر المان موجود در مقاله را به منبع اصلی‌اش بازمی‌گرداند و گره می‌زند.

تبدیل فایل CSV به گزارش خبری تعاملی تأییدشده با هفت عامل هوش مصنوعی

بنچ‌مارک در برابر انسان‌ها

پیشتازی در شفافیت: Data2Story در هر ۵ دسته برنده شد. بیشترین فاصله در بخش شفافیت بود، جایی که امتیاز این سیستم ۱.۴۹ واحد در مقیاس ۷ درجه‌ای بالاتر از انسان بود.
شکاف تأییدپذیری: ۹۳٪ از تمام اظهارات قابل مشاهده در مقالات تولیدشده توسط عامل‌ها، قابل تأیید بودند. در مقابل، در نسخه‌های انسانی این رقم تنها ۲۵٪ بود؛ دلیل اصلی این است که روزنامه‌نگاران به‌ندرت کدهای تحلیل خود را منتشر می‌کنند. پژوهشگران ادعا می‌کنند این شکاف هم نشان‌دهنده نقطه قوت سیستم است و هم نشان‌دهنده حفره‌ای در عملکردهای فعلی روزنامه‌نگاری.
پوشش محتوایی: هنگام اندازه‌گیری هم‌پوشانی اظهارات، Data2Story حدود نیمی از دیدگاه‌های انسانی را پوشش می‌دهد. در مقابل، روزنامه‌نگاران تنها یک‌سوم (۳۵٪) از اظهارات عامل AI را شکار می‌کنند. این شکاف در گزارش‌های فرمالیستی اکونومیست در کمترین حالت است؛ جایی که عامل توانست ۷۳٪ از یافته‌های انسانی را بازتولید کند، زیرا آن متون از آمارهای استانداردی پیروی می‌کنند که عامل به‌راحتی می‌تواند محاسبه کند.

تبدیل فایل CSV به گزارش خبری تعاملی تأییدشده با هفت عامل هوش مصنوعی

جایی که انسان‌ها هنوز برنده هستند

با وجود بهره‌وری بالا، پژوهشگران سه حوزه را شناسایی کردند که در آن‌ها روزنامه‌نگاری انسانی همچنان برتر است:

زیرساخت فنی

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

سامانه Data2Story صحت ۹۳ درصدی ادعاهای داده‌محور را تضمین کرد

مکانیسم تحریریه مجازی

بنچ‌مارک در برابر انسان‌ها

جایی که انسان‌ها هنوز برنده هستند

زیرساخت فنی

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

سامانه Data2Story صحت ۹۳ درصدی ادعاهای داده‌محور را تضمین کرد

مکانیسم تحریریه مجازی

بنچ‌مارک در برابر انسان‌ها

جایی که انسان‌ها هنوز برنده هستند

زیرساخت فنی

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

سامانه Data2Story صحت ۹۳ درصدی ادعاهای داده‌محور را تضمین کرد

مکانیسم تحریریه مجازی

بنچ‌مارک در برابر انسان‌ها

جایی که انسان‌ها هنوز برنده هستند

زیرساخت فنی

منابع

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

سامانه Data2Story صحت ۹۳ درصدی ادعاهای داده‌محور را تضمین کرد

مکانیسم تحریریه مجازی

بنچ‌مارک در برابر انسان‌ها

جایی که انسان‌ها هنوز برنده هستند

زیرساخت فنی

منابع

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

راهنمای فارسی هوش مصنوعی — با نگاه به ایران