文教速報デジタル版

BUNKYO DIGITAL

文教速報デジタル版

BUNKYO DIGITAL
大量データのクラスタリング手法 早稲田大研究Gが開発 多様な分野の時系列データ分析に利用

早稲田大学の松田佑教授らの研究グループは、大量の時系列データ類似度に応じたグループ分けの組み合わせを最適化問題として捉えた。これに特化した計算技術を応用して高速な計算を可能としている。

近年では、データの大容量化やセンサ性能の向上が劇的に進み、画像を扱うことも増えた。大きなデータが大量に得られるようになったため、その集合を高速に分類することが必要になっている。

研究グループは「各クラスタに入るデータ間の類似度の和が大きくなる」「1つのデータは最大1つのクラスタに入る」「各クラスタに入るデータ数とその分散を調整する」という3つの制約を課す手法を開発した。

流体計測画像を例にクラスタリングを実証。大きなノイズを含んだ信号変化のデータから、外れ値を考慮して上手く実行できることを示した。

研究グループは「時系列クラスタリングは富士通デジタルアニーラのように組合せ最適化問題に特化した計算技術を有効に利用できる分野であり、各専門分野での解析に活用いただければ幸甚だ」としている。