研究課題/領域番号 |
22K18448
|
研究機関 | 東京大学 |
研究代表者 |
大向 一輝 東京大学, 大学院人文社会系研究科(文学部), 准教授 (30413925)
|
研究期間 (年度) |
2022-06-30 – 2025-03-31
|
キーワード | ウェブ情報学 / 技術史 / 知識グラフ |
研究実績の概要 |
本研究では日本におけるウェブの通時的変遷を捉えるべく、普及過程を調査分析し、科学技術史の一部としての研究分野の確立に向けた基礎資料群の形成と公開、ならび研究コミュニティの立ち上げを目的としている。本年度は研究の初期段階として公的機関や企業、個人に散逸している関連文献の収集と整理を行った。とくに、ウェブ関連の団体や企業が作成した年表を対象として、7000件超の項目を収集しデータベース化を行っている。本データベースでは複数の情報源から提供されたデータが混在することから、各項目の形式や内容を精査し、同一の出来事を指す項目については一定のルールに従って自動的に統合処理を行った。また、年月日などの時間情報や人名・組織名などの固有名詞については統一的な表現形式に変換することで事後的な情報抽出を容易にした。これらと並行して、出来事同士の時系列が明確でない場合に、解釈者の判断であることを明示した形で暫定的に前後関係を記述することができるデータモデルの設計を行い、Resource Description Framework(RDF)を用いた表現形式の確立とデータベースへの実装を行った。構築した年表データベースでは項目ごとに一意な識別子を付与している。これによって、分野を問わず参照可能な情報源としての公共性を担保するとともに、以後の研究成果がデータベース上の識別子を引用することで、研究同士の関連性を明示化できる環境を整備した。今後はデータベース内の情報の拡充と公開に向けた調整を行いつつ、コンテンツ分析を行う予定である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
データの収集やデータモデルの設計については計画通りに進んでいる一方で、項目同士の統合処理については当初の想定以上に例外的な事象が多く存在し、ルールやアルゴリズムの整備に時間を要した。他方、データベース構築の過程で次年度以降の調査対象の洗い出しや予備的な情報収集を実施できたことから、研究全体としてはおおむね順調に進展していると判断する。
|
今後の研究の推進方策 |
データベース中の情報の精査の結果、とくに団体・企業については名称変更や合併・解散などのイベントが相当数生じていることが明らかになった。これらを踏まえた統一的な分析を可能にするために、団体・企業の変遷を扱うデータベースを新たに構築し、連携させることを検討している。また、両データベースに記録された項目の典拠となる文献や資料を紐付けるためのデータモデルを設計し、順次情報を追加する予定である。
|
次年度使用額が生じた理由 |
新型コロナウイルス感染症の影響により、調査・情報収集のための出張を延期したことで旅費について次年度使用額が生じている。当該の出張は次年度に実施する予定である。
|