概要
非線形次元削減手法は探索的データ解析などに有用であるが、低次元空間上でのデータの解釈はしばしば困難である。本研究では、高次元データとして手書き数字およびポリマーデータセットを用い、Uniform Manifold Approximation and Projectionにより低次元空間に出現するクラスタをクラスタリングした。得られたクラスタラベルについて1 対他クラス分類モデルを構築し、各サンプルのクラスタに所属する予測確率と元の変数との相関係数を用いることで、解釈のための画像、棒グラフおよびヒートマップを作成した。加えて、各クラスタの比較を容易にするため、変数選択手法であるBorutaを用いた。さらに、解釈性の高いUMAPのためのハイパーパラメータ調整の自動化に関する手法も提案した。