人文学・社会科学総合データカタログ(JDCat)での人文学用メタデータスキーマ項目の制定

  • 分野別研究データ
本文

「人文学・社会科学総合データカタログ(JDCat)メタデータスキーマにおける人文学向けメタデータ項目の策定」

目次

  1. 公開元URL
  2. 実施機関
  3. 本事例の内容
  4. 本事例の対象
  5. 人文学におけるメタデータ共有の状況
  6. JPCOARスキーマを利用した背景・理由
  7. 使用したJPCOARスキーマのバージョン
  8. メタデータ制定・付与において意識したこと
  9. 実施結果
  10. 関連リンク

 

公開元URL  

https://jdcat.jsps.go.jp/JDCatmetadata.html

実施機関

東京大学史料編纂所、東京大学大学院人文社会系研究科、日本学術振興会

本事例の内容

 人文学・社会科学総合データカタログ(JDCat)は、日本学術振興会が実施する「人文学・社会科学データインフラストラクチャー構築推進事業」[1]および「人文学・社会科学データインフラストラクチャー強化事業」[2]の一環として構築された、人文学・社会科学双方の研究データを横断的に検索できるデータベースである。JDCatメタデータスキーマ[3]は、JDCatにおいて研究データのメタデータを公開・共有するために策定されたものであり、人文学・社会科学それぞれのデータの特性を尊重しつつ、分野横断的な検索・アクセスを可能にすることを目的としている。そのため、既存の代表的なメタデータスキーマとの相互運用性を重視した設計がなされている。具体的には、社会科学領域ではData Documentation Initiative(DDI)スキーマ[4]、人文学領域ではJPCOARスキーマを参照している。

本事例の対象

 JDCatの対象は、連携している人文学・社会科学系アーカイブ(リポジトリ等)に収録された研究データのメタデータである(連携機関については[5]を参照)。ここでいうメタデータとは、データセットの内容、作成・収集の背景、来歴などを表現する情報を指す。人文学領域の研究データは36,731件(2025年12月31日現在)であり、その多くは古文書・古記録、木簡などの一次資料で構成されている。

人文学におけるメタデータ共有の状況 

 人文学は、歴史・文学・哲学・考古学など多様な分野を包含し、資料の収集・整理主体も大学や研究機関に限らず、研究コミュニティや研究者個人にまで及ぶ。このため、分野横断的に統一されたメタデータスキーマを整備することは容易ではない。一方で、日本史や日本文学など一部の分野では、東京大学史料編纂所や国文学研究資料館といった大規模な研究機関が資料と目録を体系的に整備しており、当該の分野内においては一定程度のメタデータ共有が実現している。JDCat以外の分野横断的な取り組みとしては、人間文化研究機構に属する6機関のデータベースを統合検索するシステム(現・nihuBridge)が挙げられる。ただし、人文学領域は対象範囲が極めて広く、すべての分野の専門家の要請を満たす統一的な管理やシステムを構築することには本質的な困難がある。他方、人文学分野においても海外を中心に資料のデジタル化やデジタルアーカイブの公開が進み、研究手法や研究環境に変化が生じている。日本においても、同様の動きが徐々に広がりつつあることから、分野横断的な検索・アクセスが期待されている。

JPCOARスキーマを利用した背景・理由 

 JDCatの基盤となる人文学・社会科学データインフラストラクチャー構築推進事業は、2018年度の開始当初、社会科学系の機関を中心に構成されており、人文学系機関(東京大学史料編纂所)が参加したのは翌年度からであった。この時点ですでにJDCatメタデータスキーマの策定作業は進行しており、社会調査データを主眼としたDDIスキーマを核とする検討が行われていた。しかしながら、人文学資料のメタデータを収録するにあたり、DDIが前提とする調査設計や研究プロジェクト中心の記述は、人文学の実態と大きく乖離していることが明らかとなった。そこで、DDIベースの項目をそのまま適用するのではなく、人文学領域におけるメタデータ設計の方針を以下のとおり整理し、JDCatメタデータスキーマとの関係性を明確化することとした[6]

 1. 社会科学領域との整合性を保つこと
 2. 人文学領域の拠点機関である東京大学史料編纂所のデータを過不足なく記述できること
 3. 国際的な相互運用性を確保すること
 4. 特定分野に限定せず、人文学領域全般に適用可能であること
 5. 長期的な利用を前提とした設計とすること

 メタデータ共有を目的とする構造化データとしてはDublin Coreの採用も検討されたが、人文学資料では、作者・所有者・公開者がそれぞれ異なるなど、より詳細な来歴情報を必要とする場合が多い。そのため、共通性を確保しつつ、Dublin Coreよりも多様な記述が可能な枠組みとして、人文学分野のメタデータ項目はJPCOARスキーマと対応づけて策定する方針が採用された。

使用したJPCOARスキーマのバージョン

 JPCOARスキーマ 1.0.x

メタデータ制定・付与において意識したこと

 JDCatは人文学・社会科学全般の研究者によるデータ共有を目的としているため、メタデータ策定にあたっては、当該分野以外の研究者にも理解可能であることを重視した。また、本事例では、日本史資料へのメタデータ付与を起点としてスキーマを検討したが、人文学領域の全体を対象とする場合、過度な詳細化はかえって適用を困難にすることが予想された。そのため、JDCatメタデータスキーマは当初から複雑化させず、JPCOARスキーマの基本項目に必要最小限の拡張を加える構成とした。JDCatメタデータスキーマにおける人文学領域の必須・推奨項目(14項目)は、すべてJPCOARスキーマの項目と対応している。ただし、トピック、対象地域、データタイプについては、JDCat独自の統制語彙を採用している。

実施結果

 本事例による最大の成果は、人文学における研究データの存在が分野横断的に可視化された点にある。各データは従来から個別には検索可能であったものの、分野外の研究者に認知される機会は限定的であった。JDCatへの掲載により、分野を超えた検索・共有のための共通基盤が提供された。また、JDCatメタデータスキーマ策定過程での議論を通じて、人文学と社会科学では研究プロセスやデータの捉え方が大きく異なることが明確になった。例えば、社会科学においては研究プロジェクト単位での調査実施が前提となるため、プロジェクト名がメタデータの必須項目となっている。このような差異を相互に理解すること自体が、分野横断的なデータ共有を進める上での重要な知見となった。

関連リンク

[1] 人文学・社会科学データインフラストラクチャー構築推進事業, https://www.jsps.go.jp/j-di/  

[2] 人文学・社会科学データインフラストラクチャー強化事業, https://www.jsps.go.jp/j-di2/  

[3] JDCatメタデータスキーマ, https://jdcat.jsps.go.jp/JDCatmetadata.html  

[4] DDI Alliance, https://ddialliance.org/

[5] 関係機関のリンク, https://www.hi.u-tokyo.ac.jp/di/initiatives/  

[6] 池内有為, 人文学分野におけるメタデータの整備状況. 2020年度統計関連学会連合大会, 2020-09-10. https://www.jsps.go.jp/file/storage/general/j-di/data/jigyo/3_ikeuchi.pdf

 

謝辞

本事例紹介は、東京大学大学院人文社会系研究科の大向一輝先生より、情報の提供ならびに草稿への多大な加筆修正をいただき、作成したものである。