
LifeSciBench: مدلهای برتر زیستشناسی در ۶۴٪ تکالیف پژوهشی شکست خوردند
OpenAI با معرفی محک LifeSciBench نشان داد که حتی پیشرفتهترین مدلهای تخصصی زیستشناسی در مواجهه با مسائل پیچیده پژوهشی ناتواناند. این دادهها حاکی از شکاف عمیق میان حفظ اطلاعات…










