東北大学の笠井均教授らによる共同研究グループは、分子の置換基情報のみを用いた記述子(CSN)による情報処理技術の利用を提案した。過去の抗菌薬候補分子の情報をCSNに変換して機械学習を行うことで、情報収集と計算コストを低減した上で有意な抗菌活性の予測モデルを構築することに成功している。記述子とは、分子の特徴を化学構造や物理化学的性質に基づく数値ベクトルとして表現したもの。
新規薬剤の開発において、機械学習などの情報処理技術を利用した「マテリアルインフォマティクス(MI)」の有用性が指摘されている。多くの情報を記述子に含めることで、予測精度の高いモデルの構築ができるが、その量が増えるとデータを集めるために膨大な労力が必要となってしまう。
そこで研究グループはCSNを提案した。これと抗菌活性のデータのみを用いて機械学習を行うことで、大幅な計算コストの低減を行うことが可能となる。さらに、必要な情報を絞るため、過去に記録された分子情報を労せずに利用できるという。
笠井教授らは「抗菌薬開発のみならず開発の成熟したさまざまな材料への機械学習モデルの導入にも貢献できる」と評している。