文教速報デジタル版

BUNKYO DIGITAL

文教速報デジタル版

BUNKYO DIGITAL
AIの国際会議「AAAI-24」に立教大の研究が採択 フーリエ変換を使った新たな画像認識

立教大学の立浪祐貴大学院生と瀧雅人准教授は音声などを異なる周波数にする「フーリエ変換」を使った新しい画像認識手法を開発した。この成果が人工知能分野の国際会議「AAAI-24」に採択された。

高解像度画像を扱うコンピュータービジョンモデルにおいて長距離の依存関係を学習する注意機構の仕組みは、膨大なメモリと計算時間が必要という問題を引き起こす。したがって、高解像度の画像を扱う場合、経済的負担を生む可能性がある。

この問題を回避する手法として、注意機構に代わる高速フーリエ変換ベースの仕組み「グローバルフィルタ」が提案されている。だが、最先端の性能を達成しているとは言い難い現状があった。

研究ではグローバルフィルタと注意機構の隔たりに注目し、その隔たりを埋めた動的フィルタを提案した。そして、提案手法の動的フィルタを取り入れた「DFFormer」と、動的フィルタと畳み込みニューラルネットを併用した「CDFFormer」という新たな画像認識モデルをチームは考案している。

これらは高解像度の画像認識において、グローバルフィルタと同様に少ないメモリ消費や計算時間で済むという特長を有している。

立浪大学院生らは「近年注意機構を使用した巨大なモデルばかり注目される傾向はあるが、動的フィルタのように訓練や推論時の経済的負担が少ないアプローチも重要視される契機となる」とした。