مقاله پژوهشی جدیدی در arxiv.org نشان داده است که مدلهای زبانی بزرگ میتوانند بهعنوان رمزگذارهای مؤثر پرونده الکترونیک سلامت عمل کنند و عملکردی در سطح مدلهای تخصصی بنیانی این حوزه ارائه دهند. این پژوهش روشی کاربردی برای بهرهگیری از مدلهای عمومی در وظایف پیشبینی بالینی بدون تضعیف حریم خصوصی بیماران معرفی میکند.
تیم تحقیقاتی دادههای پرونده سلامت الکترونیک را با جایگزینی کدهای پزشکی توسط توصیفهای زبان طبیعی به متن ساده تبدیل کرد. این روش مدلهای زبانی بزرگ را قادر میسازد تا بردارهای تعبیهای چندبعدی برای پیشبینی downstream تولید کنند. این رویکرد نیاز به دادههای آموزشی پزشکی خصوصی را که یکی از محدودیتهای اساسی در توسعه هوش مصنوعی سلامت بوده، برطرف میکند.
عملکرد در ۱۵ وظیفه بالینی از معیار EHRSHOT ارزیابی شد، جایی که بردارهای تعبیهای مبتنی بر LLM با مدل تخصصی CLMBR-T-Base برابری کردند. برای اعتبارسنجی خارجی، پژوهشگران از مجموعه داده UK Biobank استفاده کردند، جایی که مدلهای مبتنی بر LLM در برخی وظایف بهبود آماری معناداری نشان دادند. تیم تحقیقاتی این دستاوردها را به پوشش واژگانی بالاتر و قابلیت تعمیمپذیری بهتر نسبت میدهد.
این مطالعه یک مبادله بنیادین در توسعه هوش مصنوعی پرونده سلامت الکترونیک را برجسته میکند. مدلهای تخصصی مانند CLMBR-T-Base بازدهی محاسباتی برای سازمانهایی با زیرساخت موجود ارائه میدهند، در حالی که بردارهای تعبیهای مبتنی بر LLM قابلیت حمل و استقلال دادهای بیشتری دارند. مؤسسات سلامت میتوانند از مدلهای عمومی از پیش آموزشدیده بدون نیاز به دادههای آموزشی یا منابع محاسباتی تخصصی حوزه استفاده کنند.
تاریخچه ارسال مقاله حاکی از توسعه فعال است و این مقاله از فوریه ۲۰۲۵ پنج بازنگری داشته که نشاندهنده پالایش مداوم روششناسی است. این پژوهش بهویژه محدودیتهای دسترسی که تاریخاً توسعه مدلهای بنیانی پرونده سلامت الکترونیک را محدود کرده، برطرف میکند و مسیری برای سازمانهایی فراهم میآورد که فاقد مجموعه دادههای پزشکی در مقیاس بزرگ هستند تا از قابلیتهای هوش مصنوعی پیشرفته بهرهمند شوند.

گفتگو