NEDO Web Magazine

材料データ構造化AIツール開発 論文などから高分子材料の物性データを自動抽出し、構造化

AIで構造化した材料データを相互活用し、
材料開発の加速化と産業強化を目指す

素材産業分野において大きくリードしている日本には、これまでに蓄積された材料開発に関する大量のデータがあります。これらのデータを資産として活用することは、競争力の高い日本の素材産業の優位性をさらに強化する上で重要です。そのためには、各機関や企業が個々に保有する材料データを共有し、相互活用できる基盤技術を整備していくことが要となります。

NEDOは、2019年度より、すでに公開されている特許・論文等の文書や、素材企業が保有する技術文書から、材料開発に必要な高分子材料の物性情報(物質名・物性値およびそれらの関係性等)やプロセス情報等を自動抽出し、構造化する「材料データ構造化AIツール」の研究開発を実施してきました。プロジェクトでは、AI学習用の「高分子論文コーパス」の開発および作成、論文から物性情報等を抽出するAIの開発、PDF文書に含まれるグラフや表の読み取りと構造化を行う「図表からの情報抽出ツール」の開発、抽出した各種材料データを構造化するための「標準データフォーマット設計およびオントロジー(辞書)」の研究開発に取り組みました。

プロジェクト終了後は、開発したツール等を積極的に公開し、マルチスケールシミュレータや AI 等の共通基盤技術の管理・運営体制の構築を目標に据えています。シミュレーションデータ、実験データに加え、構造化された多種多様かつ膨大な材料データを有効活用しAIによる材料開発の取り組みをさらに加速していきます。

材料データ構造化AIツール開発の全体像
Top