研究課題/領域番号 |
23K22017
|
補助金の研究課題番号 |
22H00745 (2022-2023)
|
研究種目 |
基盤研究(B)
|
配分区分 | 基金 (2024) 補助金 (2022-2023) |
応募区分 | 一般 |
審査区分 |
小区分03070:博物館学関連
|
研究機関 | 東京藝術大学 |
研究代表者 |
嘉村 哲郎 東京藝術大学, 学内共同利用施設等, 准教授 (90543710)
|
研究分担者 |
亀田 尭宙 国立歴史民俗博物館, 大学共同利用機関等の部局等, 特任助教 (10751993)
川邊 咲子 国立歴史民俗博物館, 大学共同利用機関等の部局等, 特任助教 (70867374)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
15,860千円 (直接経費: 12,200千円、間接経費: 3,660千円)
2024年度: 5,070千円 (直接経費: 3,900千円、間接経費: 1,170千円)
2023年度: 5,070千円 (直接経費: 3,900千円、間接経費: 1,170千円)
2022年度: 5,720千円 (直接経費: 4,400千円、間接経費: 1,320千円)
|
キーワード | シソーラス / 専門用語 / デジタルアーカイブ / Linked Open Data / 文化財情報 / 専門用語辞書 / Lunked open Data / 多言語辞書データ / 美術館・博物館 |
研究開始時の研究の概要 |
本研究は、日本語で利用可能な芸術・文化財向けの専門辞書データを開発して、データ活用社会における文化・芸術情報の検索性向上とデータ活用・流通を促進する芸術情報基盤の構築をめざすものである。この背景には、美術館・博物館等がウェブ公開した作品情報の属性や主題等の用語が組織毎に異なっていたために、意図した検索やデータ活用が困難などの課題があった。本研究では、海外で利用されている文化・芸術関連辞書データを日本語化してオープンなデータ形式で公開してその利用を試みることで、多言語辞書データの活用が日本の芸術作品や文化財情報の検索と流通に有用であることを明らかにする。
|
研究実績の概要 |
本研究は、日本語で利用可能な芸術・文化財向けの専門辞書データを開発して、データ活用社会における文化・芸術情報の検索性向上とデータ活用・流通を促進する芸術情報基盤の構築をめざすものである。本研究では、多言語で利用可能な芸術・文化財向けの専門辞書データの開発に際し、ベースとなる辞書データは米国ゲティ研究所が開発を進めているArt & Architecture Thesaurus(AAT)を用いる。AATは、中国語やドイツ語、ポルトガル語など8カ国語以上に対応した多言語辞書データの整備が進められており、現在公開されているデータに日本語は含まれていない。本研究では全レコード件数41,457件のうち、データとして利活用の可能性がある見出し語(ラベル)及びノートと呼ばれる用語の解説文を対象に翻訳を進めている。なお、AATでは、オリジナルの辞書データに統合してもらうためにはラベルと解説文の翻訳に加えて、ラベルが実際に利用されている事を示す典拠情報を3件以上示す必要がある。 2023年度の辞書データ開発の活動結果は次の通りである。ラベルの翻訳数18,139件(前年比+2,480件)、解説文の翻訳件数2,923件(前年比+2,679件)、典拠情報の登録件数4,567件(前年比+4,157件)典拠情報は3件登録済みの用語は3,576件、2件登録済みは427件、1件のみの語は564件である。その他の活動として、本研究活動の取組を国際博物館会議ドキュメンテーション委員会の年次大会(ICOM CIDOC2023)で発表を行った。また、当該大会ではGetty AATの開発担当者が参加していたことから、日本語化に伴う日本特有の課題を報告するなど情報共有を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
翻訳作業のうち、特に解説文の翻訳が遅延の傾向にある。その理由には、芸術・文化財向けの専門辞書データセットではあるものの、文化人類学や民族学に由来するようなものから化学系・工業系の用語が多数含まれていることから、これらに対する日本語化に困難を要している。また、一般的な用語においても、文字数が多い語が多いことから、ラベルに対して翻訳件数が少ない状況にある。ラベルの翻訳作業では、原文に対する翻訳語の選択に際して、複数の解釈を持つ語が見られた。例えば、oil paintingは絵画の技法と絵画作品の種別をあらわす二種類の解釈がある。このようなラベルに対して、適切な翻訳語を附するために、原文側に追加されていた付帯情報を翻訳作業用のラベルと共に情報提供し、翻訳作業者が語を選択する際に判断を迅速に行える対応を行った。
|
今後の研究の推進方策 |
2024度は、本事業の最終年度に当たるが可能な限り日本語化と典拠情報の整備を進める。特に日本語化に際してはラベルを優先的に行っていく。その上で、2024年度の実施内容は次の通りとする。1.日本語化の作業継続、2.国際チームや開発元とのコミュニケーション、3.日本語化データのWeb公開。1の日本語化作業は冒頭に述べたとおり、多言語辞書デー タ化に求められる制約事項(辞書データ開発元によるポリシー)の対応や調査に時間を要していることから継続してこれを行う。なお、各語に付帯する解説文の日本語化はとりわけ負担が大きく、とくに美術や建築の範疇を超える部分に関しては、専門的な人材に依頼することを考えている。 2の国際チー ムや開発元とのコミュニケーションは、コロナウイルスの影響で開催が見送られていた開発元主催の多言語化辞書データ開発の国際会議に参加し、本研究の取組状況を報告すると共に他国の状況等をヒアリングして今後の活動の参考にする計画である。その他、国内の関連学会や国際会議等ではデータ基盤となるようなシ ソーラス整備の取組や活用状況をリサーチしていく。3の日本語化データのWeb公開は、開発元ポリシーに適合した用語については開発元が公開するデータ基盤上の既存データに統合を依頼し、それ以外の用語については本研究成果として独自にWebへのデータ公開を行う。本研究におけ る助成金の利用は、翻訳作業にかかる謝金を中心に、国際会議や国内学教会への参加費が主となる。また、物件費については参考文献の購入や 典拠情報の調査に活用できる百科事典のクラウドデータベース等の利用に充てる。
|