デジタル推進事業 JOGMEC業務のデジタル化 埋もれた文章を素早く検索する
システム導入

埋もれた文章を素早く検索する
システム導入

埋もれてしまったデータも
検索システムで有効に活用

POINT
長年の活動で埋もれてしまった文書データを利活用
既存のサーバーはそのままに、文書データ検索用システムを導入
システムが文章を解釈し、「探す」だけではない「助けてくれる」検索へ

埋もれてしまった文書データ

 JOGMECは長年にわたって国内外各地での地質関連データ収集や、実験・解析作業、その他各種業務プロセスを通して、数多くの文書ファイルを作成してきました。しかし、せっかく作成された文書も、必ずしも効率的に活用しやすい状態になっていたわけではありませんでした。例えば、地質関連データや関連文書のみを保存したサーバーが幕張のTRCにあり、東京の本部ではIT部門が管理するサーバーがあり、さらに各部署が独自に作成した解析データ等を保存したハードディスクがそれぞれ保有されている、といった状況でした。また、機密性の高い文書も多く保有していることもあり、それぞれには部署に従ったアクセス権の管理がなされています。そのため、あるプロジェクトで作成した文書も担当者が変わればその存在は忘れられ、若手職員が過去のスタディを活用することも難しく、まさに情報が「サイロ化」した状態でした。
 こうした状態を改善し、効率的に文書を探し出すことを可能にすることで、スタディの精度を高めたり日常業務を効率的に行ったりすることが求められていました。

検索システムで文書データを発掘

 しかしながら、情報のサイロ化を改善するためとはいえ、今稼働しているサーバーを根本から作り直すようなことは労力も非常にかかる上に日常業務にも支障をきたすため、現実的な方法とは言えません。そこで、JOGMECが選択したのは、現状のサーバーなどはそのまま使用し続け、横断的かつ高度にファイル検索ができるシステムを導入することでした。つまり、JOGMEC内の複数のサーバーやハードディスクを同時に検索するのみならず、ウェブサイトや学会論文のような「JOGMEC外の文書」も同時に検索できること、そして文書データの内容を自動的に解釈し職員の作業効率を高めることを目指しました。
 JOGMECが導入したシステムでは、既存のサーバーとは別に検索システム用のサーバーを設置し、そこへ文書検索用ファイルを一元的に集約したものとしました。また元の文書ファイルそのものを検索用サーバーに取り込んだわけではないためセキュリティ上のリスクも低く、加えて、既存のサーバーにおけるファイルアクセス権を検索結果にも反映させ、情報の機密性にも配慮したものとなりました。ウェブサイトや学会論文等の検索用ファイルも同様に集約されているため、JOGMEC内外の文書を同時に検索できるシステムにもなっています。
 この検索システムは、文書内容を自動で解釈してから検索用ファイルを作成するという機能も持っています。文書内の単語の有無をただ調べるだけではなく、文章中の特定のキーワード(例えば地域名や地質年代名)を抽出して、そのキーワードに関連した資料のみに絞り込んで検索することもできるようになっています。また、検索ワードに関連する単語を「原因」や「結果」等の関係性とともに検索者に示唆して文献調査をサポートしてくれたり、検索者が疑問文で検索して、その回答にあたる文書を見つけたりすることも可能になっています。

「探す」だけではない、「助けてくれる」検索へ

 この検索システムを本格的に業務へ導入する前に、まずは、JOGMECが毎年発行しているTRCの成果をまとめた年報を対象に試験的な文献調査を行って、システムの有効性を確かめました。例えば、物理探査におけるノイズへの対処に関する記述を調べるため「どのようにノイズを除去するか」という主旨の疑問文で検索したところ、「ノイズを除去するためラドンデマルチプル処理を実施した」という主旨の、対処法について記した箇所がヒットしました。
 その後2020年よりJOGMECの石油開発部門で保有していた文書ファイルの多くを検索対象として、検索システムの運用を本格的に開始しました。導入後早速、これまで数時間かかっていた文書検索が数分で完了できるようになったという声も聞かれ、確実な効果を見せています。今後、これまではアクセス権の制限のためにその存在を知ることすら難しかった他部署の資料について、例えば文書ファイルのタイトルだけを検索結果に表示するような仕組みの導入を検討しており、格段に業務の精度を上げられることを期待しています。

※所属・役職及び本記事の内容は執筆時点のものです。

デジタル推進事業 技術・活動紹介の一覧へ戻る