• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2022 年度 研究成果報告書

自己相関関数に基づく文書主題と文書構造を考慮した文書検索手法の開発

研究課題

  • PDF
研究課題/領域番号 16K00160
研究種目

基盤研究(C)

配分区分基金
応募区分一般
研究分野 マルチメディア・データベース
研究機関昭和大学

研究代表者

小倉 浩  昭和大学, 教養部, 教授 (40214100)

研究期間 (年度) 2016-04-01 – 2023-03-31
キーワード自己相関関数 / 待ち時間分布関数 / 拡張指数型関数 / ポアソン分布 / Hawkes過程 / 自己相似構造 / 長時間相関 / 時系列解析
研究成果の概要

文書の主要テーマに関連する重要語の文書中における出現パターンを2値時系列データであるとしてとらえ,時系列解析の手法を用いて解析した.これまでの一連の研究により,文書中の重要語の出現パターンを支配する確率過程が,単純なポアソン過程とは大きく異なった確率過程であることが示された.これらの語の自己相関関数は拡張指数型となり,またその待ち時間分布はフラクタル構造を有していることも分かった.さらに,この確率過程を記述する有力なモデルとしてHawkes過程が使用できることも明らかとなった,今後は,Hawkes過程と待ち時間分布の関係について,より詳細な研究の進展が望まれる.

自由記述の分野

言語統計学,時系列解析

研究成果の学術的意義や社会的意義

本研究により,文書の主要テーマに深く関連した重要語の識別を精度よく行うことが可能となった.このための最も大切な指標は,対象となる語を生成する確率過程がPoisson過程からどの程度ずれているかを表す指標である.この成果は,文書検索の精度向上に対する重要な貢献となり得るものである.また,(a)本研究で提案された2次元DAG構造を一次元の擬似的な文書構造に変換する手法は文書生成時の人間の思考をシミュレートするものであること,(b)語生成を支配する確率過程のモデルとして提案したHawkes過程を多次元化することで文書生成確率過程を精密化できること,などから認知心理学分野への将来の寄与も期待される.

URL: 

公開日: 2024-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi