AI研究の最新知見、ミクロな化石の鑑定で成果 - Kyodo News PR Wire|RBB TODAY
※本サイトはアフィリエイト広告を利用しています

AI研究の最新知見、ミクロな化石の鑑定で成果



放散虫微化石の画像分類モデルを高精度化

ポイント
・ 機械学習分野で提案された新しいモデル構造と学習手法を微化石の画像分類に応用
・ 多数の化石種を、専門家に近いレベルの平均86%で分類可能
・ 火山灰や鉱物・花粉など大量の画像を収集することが難しいさまざまな粒子の分類に応用できる可能性

【画像:https://kyodonewsprwire.jp/img/202503045115-O1-JKKyy0fS

概 要
国立研究開発法人 産業技術総合研究所(以下「産総研」という)地質情報研究部門 見邨和英 研究員、板木拓也 研究グループ長、宮川歩夢 上級主任研究員、人工知能研究センター 片岡裕雄 上級主任研究員は、地層中に含まれる微化石の画像から高い精度で放散虫の種を分類できるモデルを開発しました。

プランクトンなどの生物の遺骸である微化石は、地層が形成された環境や年代を示す重要な指標であり、資源探査や過去の地球環境の復元などの研究に用いられています。近年、機械学習モデルを活用した効率的な微化石の観察技術の開発が行われていますが、微化石の種によっては学習に必要な十分な量の画像(教師データ)を収集するのが困難なことがあり、機械学習による高精度な観察の実現に向けたボトルネックとなっていました。一方、コンピュータービジョン研究分野においては、Vision Transformer(ViT)という新しいモデル構造や、数式で生成された幾何的な図形を用いた学習方法(Formula-Driven Supervised Learning、FDSL)などの新しい技術が次々と提案され、高精度な画像認識を実現するための技術開発が進んでいます。しかし、これらの最新の知見は、微化石分類などの地質研究の分野には十分に反映されていませんでした。

今回の研究では、これらの新技術を微化石の画像分類に応用し、平均で86%という専門家に近い精度で化石種の分類ができることが明らかになりました。この結果は、地質分野において課題であった、膨大な画像の収集が難しい場合においても、高精度な画像分類モデルを構築することができることを示唆しています。

なお、この技術の詳細は、2025年3月6日(英国時間)に「Scientific Reports」に掲載されます。

下線部は【用語解説】参照

開発の社会的背景
地層の解析は、人類が経験したことのない過去の温暖化記録の解読や、地層中に存在する石油や有用金属の資源探査などに重要な役割を果たしています。特に、地層中に存在するプランクトンなどの生物の遺骸である微化石は、その地層がいつ、どんな環境で形成されたのかを推定する重要な手がかりとして、さまざまな調査、研究に用いられてきました。微化石は顕微鏡で詳細な形状を観察して種類や個体数を分析するため、専門的な知識や技術、膨大な時間、労力が必要です。そこで、機械学習技術の一つである画像分類を活用した効率的な観察技術の開発が行われています。微化石の分類は、研究用途によっては90%程度の精度が求められています。しかし、地層中に稀にしか存在しない希少な種は大量の画像を収集することが難しいという課題があり、これまでに開発された画像分類モデルの精度は78%にとどまっていました。

これまで地質分野の画像認識では、畳み込みニューラルネットワーク(Convolutional Neural Network、CNN)と呼ばれる構造を持つモデルが一般的に使用されてきました。これらのモデルの多くは、目的のデータセットで訓練される前に、インターネットなどから収集された一般的な(動物、建築物、乗り物などの)画像からなるデータセットによって事前学習されていました。一方、近年コンピュータービジョン研究の分野では、Vision Transformerというモデルの構造が提案され、画像分類を含むさまざまなタスクにおいてCNNモデルよりも高い精度を示すことが報告されています。さらに、数式で生成された幾何的な図形を用いた事前学習(Formula-Driven Supervised Learning、FDSL)という産総研発の技術など、限られた教師データからでも高精度に画像分類するための技術開発が進んでいます。このような最新の知見は地質研究の分野には十分に反映されていませんでした。

研究の経緯
産総研 地質情報研究部門は、これまでに機械学習を活用した効率的な微化石観察の技術開発に取り組んできました(産総研プレス発表2018年12月3日)。また、人工知能研究センターでは、数式を用いて生成された幾何的な図形による事前学習(FDSL)が機械学習モデルの高精度化に有効であることを示しました(産総研プレス発表2022年6月13日)。今回の研究では、それぞれの領域の取り組みを連携することで、高精度な微化石鑑定モデルの開発を実現しました。

なお、本研究の一部は日本学術振興会(JSPS)の科研費(23K13192、24K00748)の支援を受けて実施されました。

研究の内容
本研究では、地質研究のさまざまな場面で用いられてきた「放散虫」と呼ばれる微化石画像のデータセット(図1)を検討の対象としました。このデータセットは32種類の化石種、約5万枚の画像から構成されており、種によっては画像数が数十枚程度のこともある不均衡データセットです。先行研究*においては、実画像を用いて事前学習がされたCNNモデルで学習が行われ、全ての種で平均した分類精度が78.2%であると報告されていました。

【画像:https://kyodonewsprwire.jp/img/202503045115-O2-I4bIL8mK

そこで本研究では、ViTを使った画像分類モデルについて、実画像データセットおよび幾何的な図形からなる2種類のデータセット(ExFractalDB-21k、RCDB-21k)で事前学習されたもので訓練を行いました。その結果、これらの新しい技術を全て用いた条件においては、平均で86%という専門家に近いレベルで化石種の分類ができることが明らかになりました。それぞれ技術要素ごとに検討すると、ViTを用いたモデルは、CNNモデルである先行研究の結果と比較して高い精度を示すことが分かりました(図2)。相対的には、CNNが画像のテクスチャー(質感)により着目する傾向があるのに対し、ViTはより輪郭に着目した分類をする傾向があり、輪郭が重要な鑑定基準となっている微化石の分類ではViTを用いたモデルがより有効である可能性が考えられます。

また、同じViTを使用したモデルの中で、実画像による事前学習を行った場合と数式で生成された幾何的な図形による事前学習(FDSL)を行った場合で比較すると、5回の試行のばらつきを考慮すると概ね一致する結果が得られました。ただし、それぞれの平均値で比べると、幾何的な図形で事前学習されたモデルが最も高い精度を示していることから、幾何的な図形を用いた事前学習は、微化石画像の自動分類において今後重点的に検討されるべき技術であると考えられます。今回の研究では微化石の形状は考慮せずに事前学習が行われていますが、今後は微化石に類似した形状を重点的に事前学習させることで、分類モデルをさらに高精度化できる可能性があります。

【画像:https://kyodonewsprwire.jp/img/202503045115-O3-kul6590i

さらに、本研究で最も良い精度を示した、ViTを用いて幾何的な図形で事前学習されたモデルについて、化石種ごとの画像枚数と分類精度の関係を検討すると、比較的小規模な画像しか収集できなかった種においても高い分類精度を示すことが明らかになりました(図3)。これは、種類によっては大量の画像を収集することが難しいという地質分野の課題への有効な解決策であると考えられます。本研究の成果はいずれも、機械学習分野で提案される新たな技術を積極的に取り入れることが、地質分野におけるAIモデルのより効果的な活用につながる可能性があることを示唆しています。

【画像:https://kyodonewsprwire.jp/img/202503045115-O4-6d7axm6I

今後の予定
今後は、より小規模なデータセットからでも高い精度で化石種の分類ができるように、数式を用いた幾何的な図形の生成手法をさらに詳細に検討します。また、本研究で検討した技術は、微化石に加えて火山灰や鉱物、花粉などさまざまな粒子の鑑定に応用され、地質分野における画像認識を高精度化することにつながる可能性があります。

参考文献
* 板木拓也. (2024). 人工知能を用いた微化石自動分類・ピッキングシステム. 化石, 115, 33-42.

論文情報
掲載誌:Scientific Reports
論文タイトル:Classifying microfossil radiolarians on fractal pre-trained vision transformers
著者:Kazuhide Mimura, Takuya Itaki, Hirokatsu Kataoka, Ayumu Miyakawa
DOI:10.1038/s41598-025-90988-z

用語解説
Vision Transformer(ViT)
2020年に提案された、画像認識モデルにおける新しいネットワーク構造。

Formula-Driven Supervised Learning(FDSL)
数式によって生成された幾何的な図形によって事前学習を行う技術。教師データを収集する膨大な手間が省けることに加えて、プライバシーの侵害や不適切なラベル付けなどの倫理問題が原理的に生じないというメリットが存在する。
参考:産総研プレス発表2022年6月13日

畳み込みニューラルネットワーク(Convolutional Neural Network、CNN)
画像認識を行う深層学習モデルにおいて古くから用いられてきたネットワーク。画像の局所的な情報に着目して特徴抽出を行う傾向があることが知られている。

事前学習
ある目的(本研究では微化石の分類)に特化したモデルを訓練する前に、大規模なデータセットを用いて汎用的な機械学習モデルを構築すること。この作業によって、比較的小規模なデータセットからでも学習が進行するということが知られている。

ExFractalDB-21k、RCDB-21k
FDSLに用いられる、幾何的な図形からなる画像データセット。ExFractalDB-21kはフラクタル幾何による画像からなるのに対し、RCDB-21kは輪郭形状による画像からなるという違いがある。

 
プレスリリースURL
https://www.aist.go.jp/aist_j/press_release/pr2025/pr20250306_2/pr20250306_2.html

page top