理化学研究所(理研)の共同研究チームは、タンパク質立体構造推論ソフトウエア「OpenFold」をスーパーコンピュータ『富岳』に実装し、高速化手法の開発により、超並列環境での高スループット(コンピュータが単位時間あたりに処理できるデータ量)性の達成に成功した。
「富岳」実装版「OpenFold」は、6月21日から、理研R-CSS(https://github.com/RIKEN-RCCS/OpenFold-for-Fugaku)よりオープンソースソフトウエアの形で創薬研究者などへ広く提供され、今後、大量のアミノ酸配列からタンパク質立体構造を高速に推論することが可能になる。
この研究成果は、構造未知のタンパク質立体構造の大規模高速推論を可能とし、分子レベルの知見を通してゲノム医療や次世代創薬への貢献が期待される。
今回、共同研究チームは、近年英国で開発された、アミノ酸配列からタンパク質の立体構造を高精度に推論するアミノ酸配列からタンパク質の立体構造を予測するAIプログラム「AlphaFold2(AF2)」のオープンソースソフトウエアである「OpenFold」を「富岳」に実装し、超並列環境でのスループット性を分析した。
今回提供されるソフトウエアには、分析結果に基づいて富士通㈱が新たに開発した大量のタンパク質を超並列環境で予測するための高速化技術を導入しており、推論全体で技術導入前に比べて6.3倍の高スループット性を実現した。
この研究は、米国時間6月20日に開催された国際ワークショップ『FlexScience ‘23』で発表された