研究課題/領域番号 |
22K18448
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分1:思想、芸術およびその関連分野
|
研究機関 | 東京大学 |
研究代表者 |
大向 一輝 東京大学, 大学院人文社会系研究科(文学部), 准教授 (30413925)
|
研究期間 (年度) |
2022-06-30 – 2025-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
3,640千円 (直接経費: 2,800千円、間接経費: 840千円)
2024年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2023年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2022年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
|
キーワード | ウェブ情報学 / 技術史 / 知識グラフ |
研究開始時の研究の概要 |
本研究は日本におけるウェブの普及過程の調査分析、基礎資料群の形成と公開を目的としている。具体的には各所に散逸している学術論文や書籍の他、日本のウェブの普及を担った人物による著書や、ウェブ関連の雑誌、企業や団体が作成した年表等を精査し、可能な限り網羅的な時系列情報を作成する。時系列情報には典拠となる文献やウェブ情報を紐付け、識別子を付与することで情報源としての公共性を担保するとともに、研究同士の関連性を明示化できる環境を整備する。
|
研究実績の概要 |
本研究では日本におけるウェブの通時的変遷を捉えるべく、普及過程を調査分析し、科学技術史の一部としての研究分野の確立に向けた基礎資料群の形成と公開、ならび研究コミュニティの立ち上げを目的としている。本年度は研究の初期段階として公的機関や企業、個人に散逸している関連文献の収集と整理を行った。とくに、ウェブ関連の団体や企業が作成した年表を対象として、7000件超の項目を収集しデータベース化を行っている。本データベースでは複数の情報源から提供されたデータが混在することから、各項目の形式や内容を精査し、同一の出来事を指す項目については一定のルールに従って自動的に統合処理を行った。また、年月日などの時間情報や人名・組織名などの固有名詞については統一的な表現形式に変換することで事後的な情報抽出を容易にした。これらと並行して、出来事同士の時系列が明確でない場合に、解釈者の判断であることを明示した形で暫定的に前後関係を記述することができるデータモデルの設計を行い、Resource Description Framework(RDF)を用いた表現形式の確立とデータベースへの実装を行った。構築した年表データベースでは項目ごとに一意な識別子を付与している。これによって、分野を問わず参照可能な情報源としての公共性を担保するとともに、以後の研究成果がデータベース上の識別子を引用することで、研究同士の関連性を明示化できる環境を整備した。今後はデータベース内の情報の拡充と公開に向けた調整を行いつつ、コンテンツ分析を行う予定である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
データの収集やデータモデルの設計については計画通りに進んでいる一方で、項目同士の統合処理については当初の想定以上に例外的な事象が多く存在し、ルールやアルゴリズムの整備に時間を要した。他方、データベース構築の過程で次年度以降の調査対象の洗い出しや予備的な情報収集を実施できたことから、研究全体としてはおおむね順調に進展していると判断する。
|
今後の研究の推進方策 |
データベース中の情報の精査の結果、とくに団体・企業については名称変更や合併・解散などのイベントが相当数生じていることが明らかになった。これらを踏まえた統一的な分析を可能にするために、団体・企業の変遷を扱うデータベースを新たに構築し、連携させることを検討している。また、両データベースに記録された項目の典拠となる文献や資料を紐付けるためのデータモデルを設計し、順次情報を追加する予定である。
|