پژوهشگران چارچوبی تازه معرفی کردهاند که مشکل افزونگی الگوها در سیستمهای خوشهبندی تفسیرپذیر را برطرف میکند. این پژوهش از آرXiv منتشر شده و به رهبری ** Motaz BENHASSINE ** انجام گرفته است.
خوشهبندی تفسیرپذیر (Explainable Clustering) روشی مبتنی بر دانش است که دادهها را به خوشههای مجزا تقسیم میکند. هر خوشه با نمادهای صریح مانند الگوهای بسته (Closed Patterns) توصیف میشود. این رویکرد در هوش مصنوعی تفسیرپذیر (Explainable AI) و کشف دانش نقش کلیدی دارد.
{{img:0}}
روشهای نوین از مدلی به نام k-RFP (الگوهای مکرر کا-ریلکس، k-Relaxed Frequent Patterns) استفاده میکنند. این مدل با تعریف تعمیمیافتهای از پوشش کا (k-cover)، محدودیتهای سخت پوشش را کاهش میدهد. سیستم ترکیبی از حلکننده SAT (SAT Solver) برای تولید الگو و برنامهریزی خطی عدد صحیح (Integer Linear Programming) برای انتخاب خوشه بهره میبرد.
اما ایراد اساسی وجود دارد: الگوهای متمایز k-RFP میتوانند پوششهای k یکسانی تولید کنند. نتیجه؟ نمایشهای نمادین تکراری و فضای جستجوی بزرگتر.
این چارچوب سه نوآوری ارائه میدهد. نخست، شرایط نظری تولید پوششهای تکراری را مشخص کرده است. دوم، با حفظ یک الگوی نماینده برای هر پوشش k، الگوهای زاید را حذف میکند. سوم، تفسیرپذیری و نمایندگی الگوهای انتخابشده توسط مدل ILP را تحلیل کرده است.
آزمایشهای گسترده روی مجموعهدادههای واقعی نشان داد: کاهش چشمگیر فضای جستجوی الگو و بهبود بهرهوری محاسباتی. نکته مهمتر آنکه کیفیت خوشهها حفظ شد یا حتی ارتقا یافت.

گفتگو