تیمی از پژوهشگران چارچوب «سهگانههای ترجیحی شرطیشده با داربست» (SCPT) را توسعه دادهاند که هدف آن بهبود بهینهسازی خواص مولکولی در کشف دارو با استفاده از مدلهای زبانی بزرگ (LLM) است. این رویکرد به محدودیتهای مهم روشهای فعلی یادگیری عمیق میپردازد؛ روشهایی که اغلب به مکانیزمهای امتیازدهی جعبه سیاه وابستهاند و کنترل محدودی بر حفظ داربست مولکولی دارند و معمولاً ویرایشهای ناپایدار یا زیستشناختی نامحتمل تولید میکنند.
چارچوب SCPT سهگانههای ترجیحی با محدودیت شباهت را میسازد که شامل پیکربندیهای مولکولی «داربست»، «بهتر» و «بدتر» هستند. این خط لوله از تکنیکهای همسوسازی داربست همراه با فیلترهای مبتنی بر شیمی بهره میبرد که اعتبار، قابلیت سنتز و دستاوردهای معنادار خواص را در حین آمادهسازی دادهها تضمین میکنند. این ترجیحات با دقت ساختهشده سپس برای همسوسازی یک LLM مولکولی از پیش آموزشدیده به عنوان ویرایشگر شرطی به کار میروند.
روششناسی این پژوهش بهبودهای چشمگیری را در معیارهای بهینهسازی تکهدفه و چندهدفه نشان میدهد. مدلهای آموزشدیده با SCPT به نرخهای موفقیت بهینهسازی بالاتر و بهبودهای خواص بیشتر دست مییابند و در عین حال شباهت داربست برتری نسبت به رویکردهای پایه رقابتی حفظ میکنند. این پژوهش تأکید میکند که در مقایسه با روشهای معرف بهینهسازی مولکولی غیر-LLM، LLMهای آموزشدیده با SCPT برای وظایف بهینهسازی چندهدفه با محدودیت داربست مؤثرتر هستند.
نکته قابل توجه این است که مدلهای آموزشدیده بر نظارت تکخصیصی و دوخصیصی، تعمیم مؤثری به وظایف سهخصیصی نشان میدهند که نشاندهنده قابلیتهای برونیابی امیدوارکننده تحت نظارت مرتبه بالاتر محدود است. این امر نشان میدهد که رویکرد میتواند با دادههای آموزشی نسبتاً پراکنده به سناریوهای بهینهسازی پیچیدهتر سازگار شود.
این خط لوله پارامترهای قابل کنترل ساخت داده را فراهم میکند که مرز قابل پیشبینی شباهت-دستاورد ایجاد مینماید و امکان سازگاری سیستماتیک در رژیمهای بهینهسازی متنوع را مهیا میسازد. این قابلیت کنترلپذیری SCPT را برای کاربردهای مختلف کشف دارو مناسب میسازد، جایی که متعادلسازی حفظ داربست با بهبود خواص ضروری است.
این پژوهش که به صورت پیشچاپ در arXiv در دسترس است، نمایانگر پیشرفت قابلتوجهی در بهکارگیری LLMها برای وظایف تولید مولکولی است و رویکردی اصولی برای نظارت ترجیحی مبتنی بر دانش شیمی ارائه میدهد.

گفتگو