デジタル推進事業
人材育成・情報発信
最新論文から読み解いた
「地下評価×AI」の技術動向
最新論文から読み解いた
「地下評価×AI」の技術動向
人工知能(AI)によって地下評価は
どう変わってきているのか?
- POINT
- 地下評価にも人工知能適用の波が来ている
- 人工知能が地下評価へどう活用されているか?
- 地下評価への適用における特有の難しさとその対策は?
地下評価にもAIの波が来ている
地下評価業務を担う地質・物理探査分野では、2014年後半からの世界的な原油価格低下などを背景として事業効率化やコスト削減に対するニーズの高まりを受け、その解決策として人工知能(AI)を活用した取り組みが本格化しています。日々増え続けるデータや情報もAIの適用を後押ししています。下図の「機械学習が適用されている論文件数の年代変化」を参考にすると、2017年頃より地質・物理探査分野における機械学習を適用した論文の件数が大幅に増加し、現在も右肩上がりに数が増え続けているため、まさにブームの真っ只中にあることがわかります。
論文の中身を考察してみますと、2017年以前の初期の黎明期においては「地震探査データをはじめとした信号処理」を中心に使われ始め、その後「地質解釈」や「地震探査等のイメージ処理」へ適用され、最近では「モデリングやシミュレーション」を機械学習アルゴリズムによって置き換えていったり、高速化したりすることがトレンドとなってきています。より複雑で、人間の補助を必要としない自動化も行われ始めました。また、現在は全く新しいAIのアイデアを試すというより、どこかでうまくいったアイデアを別のエリアにも試すといったケーススタディの件数が増えており、すなわち技術のレベルも徐々に成熟している傾向にあります。
さらに、地質・物理探査分野のAI適用の対象としては石油ガス開発事業だけでなく、昨今の世界的なカーボンニュートラルの動きとともに、CCS(Carbon Capture and Storage)事業への適用例も多く公表されています。例えば地下に圧入したCO2のモニタリングにAIを適用し、コストの低減を目指す研究(例えばFeng et al.,2021[1])などが進められており、CCSでの課題である事業コストの削減に繋がることから注目すべき適用対象です。
[1] Feng, S., Zhang, X., Wohlberg, B., Symons, N. and Lin, Y., 2021, September. Monitoring and Forecasting CO2 Storage in the Sleipner area with Spatio-temporal CNNs. In First International Meeting for Applied Geoscience & Energy (pp. 1686-1690). Society of Exploration Geophysics.
地質・物理探査分野における機械学習が適用されている論文の投稿件数
(略称)SPE:Society of Petroleum Engineer、SEG:Society of Exploration Geophysics
AIアルゴリズムの発展と地下評価への取り入れ
発展著しいAIは2000年代より第三次ブームとなっており、ブームの火付け役となったディープラーニング(DL)は、学習に用いるインプットデータと正解ラベルのセットを数多く取り揃えれば関係性を機械が自動で見つけてくれます。これにより人手での特徴抽出がうまくいっていなかった、画像認識、自然言語処理や音声認識分野で目覚ましい成果を出しており、汎用性が高く様々なビジネスに展開が進められています。この躍進の背景としては、アルゴリズムの研究が進んだことに加え、IT技術普及により大量のデータが集まるようになったことやコンピュータ性能が飛躍的に向上したことが背景となります。一方でDLの短所としては、学習に大量のデータが必要なこと、モデルの中身がブラックボックスとなり結果の説明が難しいという問題もあるため、ビジネス活用においてはこれらを考慮した検討を行う必要があります。
地下評価分野ではAIアルゴリズムそのものを研究する「コンピュータサイエンス」でうまくいったもの、特に従来以上にデータの特徴をうまく捉えられる新手法が横展開されています。例えば人の視覚認識を模したアルゴリズムとして画像認識で革新を起こした「畳み込みニューラルネットワーク」は、専門家が目で解釈していた岩石や化石の判別、地震探査データ解釈などで試されています。また、自然言語処理や時系列データ解析に強い、「再帰型ニューラルネットワーク」により過去の重要な情報の記憶・選別が可能となったため、データの順番やデータの関係性や影響も学習可能となりました。これにより、垂直・水平方向に関連性が高い地下情報を従来よりもうまくモデルで学習可能となり、取り入れられています。さらに興味深いことに、2000年以前に開発された従来の機械学習も、データ量がDLほど必要でないこと、アルゴリズムの理解度が深まったことからまだまだ現役として使われています。今後も最新動向から目が離せません。
従来の機械学習手法とディープラーニングの違い
地下評価にAIはどのように活用されているか?
SPEやSEGへ投稿される論文の傾向やBergen et al.,2019[2]に基づくと、地下評価業務を担う地質・物理探査分野において、現在AIは主に3つの目的で活用されています。
1つ目は「Automation(自動化)」を目的とし、従来専門家が経験に基づき実施していた信号処理や地質解釈といった作業工程を自動化していくことにより、時間短縮や省人化によるコスト削減や、人でないと対応が難しい業務に集中できるなどの利点があります。適用例としては、地震探査収録データの自動処理、断層の自動解釈や岩相(砂や泥など)の自動分類など多岐にわたります。
2つ目は「ModelingやSimulation」の置き換えを目的としたものであり、従来複雑な物理(理論)式を数値的に解いていたところを、データと正解を与えて、式そのものを機械に発見して解いてもらうことにより、モデリングやシミュレーションの速度をさらに早くすることや、計算コストを下げることが期待されています。時には機械学習で解いた結果、従来手法より出力の精度・解像度向上や不確実性の低減をもたらす事例も報告されています。
3つ目はデータからの「Discovery(発見)」を目的とし、多くの情報から重要な情報を検出することやデータの関係性を見つけることを目的として使われます。具体的には、地震探査で得られたノイズを多く含んだ信号データの中からシグナルのみを抜き出すことや、地震波の強さや磁場の強さといった情報を元に炭化水素が存在すると思われる地点を見つけてくる、などで活用されており、莫大なデータであっても探索が可能な機械の長所を生かすものとなります。
このように従来、技術者が苦労した地下評価作業や課題にAIが得意なことをうまく活用することにより、大幅な効率化やコストの削減、時には新たな発見が期待されます。
[2] Bergen, K. J., Johnson, P. A., Hoop, M. V. D., and Beroza, G. C., 2019, Machine learning for data-driven discovery in solid Earth geoscience. Science.
地下評価における3つのAIの活用方法
地下評価にAIを活用する場合の2つの課題
地下評価にAIを適用する上で特有の課題を2点紹介します。
1点目は「正解ラベルが少ない、または多数ある場合も質にばらつきがある」点です。地下評価では真の正解を得るには、井戸を掘り直接サンプル(岩石、化石や流体等)を取得しなければ分かりません。一方で井戸を掘るには莫大な費用が必要なため、多くの事例で正解ラベル不足となります。また直接正解が入手できないため、限られた入手情報や間接的な地下情報(物理探査データ)をもとに熟練技術者の解釈を「正解ラベル」に用いる場合も多いです。この場合、熟練者でもインプットが少なければ誤った解釈を行うことや、解釈であるため人によりばらつきがあるため、正解データの質にばらつきが生じます。加えて、データにはノイズや誤差も多く含まれているため、インプットデータの質の低下により、正しい答えが出ない要因となります。このように、正解ラベルの量・質が第1の課題です。
2点目は「地域性」です。例えば「中東の砂漠地帯」、「グリーンランドの氷河地帯」、「東南アジアの熱帯雨林」の間では環境や生物が大きく違うことが想像できると思いますが、それを反映する地質(地層)も大きく異なります。このような特徴が異なる地域間では得られるデータも大きく異なります(例えば化石の種類など)。AIではインプットされるデータに基づき学習を行うため、学習に使ったデータと傾向が大きく違うものに対してはうまく予測ができません。このため、ある地域に適したモデルができても、別地域に展開する場合に予測がうまくできないという問題が生じます。石油ガス事業では入手データが限られることが常であり、1)特定地域だけに絞って、例え正解データが少なくてもモデルを作成するか、2)多少の誤差を許容して他の地域のデータも使いモデルを作成するか悩みどころです。
地下評価に機械学習を適用する上の2つの課題
うまくいっている事例ではどのようなアプローチが取られているか?
それでは地下評価特有の課題はどのように対応しているのでしょうか?例として、「人工的に用意したデータ(Synthetic data)を利用する」と「シンプルなアルゴリズムを活用する」の2つを紹介したいと思います。
「人工的に用意したデータの利用」とは、実フィールドから取得されたデータではなく、人工的に作成した正解とそれに対応するインプットデータ(正解の場合に理論的に観測されるデータを作る)のペアを大量に作って学習を進め、これに徐々にノイズを加え頑健性を上げていき、最終的に実データでテストを行うというものです(例えばWu et al.,2019[3])。この手法の利点としては、実フィールドからのデータほど複雑性はなくても、正解が確実に早く正しく作れるという点にあります。
次に「シンプルなアルゴリズムの活用」については、より少ないデータでもそれなりの精度が出せるシンプルな機械学習アルゴリズム(Random Forest、XG BoostやSVMなど)を活用することです。これによる副次的利点として、データのどの特徴が結果に大きく寄与するかの可視化が行いやすく、結果の妥当性の考察や説明が行いやすいという点があります。このように地下評価においては、データ数の制約や説明しやすさという観点から、最新の複雑でブラックボックスなアルゴリズムではなく、従来から使われているシンプルな機械学習アルゴリズムが適用されている事例が数多くあります。
地域性に関しては、残念ながら様々なエリアで使える汎用モデルの成功事例は報告されておらず、より簡便に構築できる、地域特化型モデルが現在は主流となります。但し様々な挑戦が現在も世界中で行われており、Transfer Learning(転移学習)など、可能性を感じることのできるアルゴリズムも開発されてきているので、解決する手法が出てこないか動向に注目する必要があります。
[3] Wu, X., Liang, L., Shi, Y. and Fomel, S., 2019. FaultSeg3D: Using synthetic data sets to train an end-to-end convolutional neural network for 3D seismic fault segmentation. Geophysics, 84(3), pp.IM35-IM45.
- マサチューセッツ工科大学
- Nori Nakata
- 2019年よりマサチューセッツ工科大学(MIT)のPrincipal Research Scientist、2020年からはLawrence Berkeley National LaboratoryにもStaff Scientistとして所属し、研究活動を実施。また、Nawii LLC のCEOとしても活躍中。
ホームページ:http://www.mit.edu/~nnakata/
- JOGMEC デジタル推進グループデジタル企画チーム
- 山根規人
- 2018年より企画調整部技術企画課に所属。2019年よりデジタル推進グループデジタル企画チームを併任。
※所属・役職及び本記事の内容は執筆時点のものです。
関連する技術・活動