2007 Fiscal Year Annual Research Report
利用者とオブジェクトの特性に応じた文化財コンテンツ解説文の言い換え支援
Project/Area Number |
19650055
|
Research Institution | National Institute of Informatics |
Principal Investigator |
神門 典子 National Institute of Informatics, 情報社会相関研究系, 教授 (80270445)
|
Keywords | 図書館情報学 / 言い換え / 文化遺産 / 自然言語処理 / 利用者調査 / メタデータ / 子供向けメタデータ |
Research Abstract |
本研究では、文化財コンテンツに特徴的な点を考慮し、解説文に付随する画像にも「語らせ」、簡潔な文章で言いかえを行うために、言い換え例や言い換えパターンを、言い換えに必要な知識(たとえば、専門用語とその属性など)とともにデータベース化し、解説のテキストを入力すると、言い換え例を適切性が高い順に提示する「言い換え支援システム」のプロトタイプを構築し、その評価を行うことを目的としている。 今年度は、言い換えデータベース構築では、文化財に関する専門家向け・一般利用者向け・小学生向け解説の組からなるコーパスを人手で分析し、特徴的な言い換えパターンを収集した。また、収集したパターンに基づいて、言い換えルールを作成し、その有効性を検討した。しかしながら、文化遺産ドメインにより、異なる傾向が見られることがわかり、今後は、知識の汎化とドメインに特化した知識の組み合わせを検討することが望ましいことが示唆された。 言い換える箇所のモデル構築については、今年度は、言い換える箇所の提案について言語学的分析を行い、同一コンテンツに対する、専門家向けと小学生向けの解説が対となっているデータに対して、用字(漢字の使用等)、語彙、構文、意味、文章全体、語用論レベルについて、言い換え箇所の特徴を人手で洗い出し、整理した。 さらに、多くの被験者を対象とするプロトタイピングのフェーズ1調査の手法についての検討と実現可能性テストを行った。プロトタイピングは、具体的には、a)モデルの探索、b)モデルの検証、c)言い換え箇所認定モジュールの評価という3フェーズからなるが、今年度の検討を踏まえ、次年度おいて、適切な被験者群と対象コーパスと被験者群について、適用範囲を拡大して、再検討することとした。
|
Research Products
(3 results)