代表者
-
- 安達 淳
- ADACHI, Jun
- 研究者番号:80143551
- 国立情報学研究所・ソフトウェア研究系・教授
研究課題基本情報
研究期間
2001年度〜2005年度研究分野
審査区分
研究種目
特定領域研究
研究機関
国立情報学研究所
配分額
- 2002年度:29200千円 (直接経費:29200千円)
- 2003年度:27500千円 (直接経費:27500千円)
- 2004年度:26400千円 (直接経費:26400千円)
- 2005年度:28000千円 (直接経費:28000千円)
研究分担者
研究概要
本研究では,インタネット上の情報資源は,生産・流通・利用・蓄積・他との関連・形態などあらゆる側面において従来のコンテンツとは根本的に異なる「不均質」なコンテンツであることに着目し,Webの構造解析、メディア処理・活用手法、評価用テストベット構築、社会・利用分析の研究を進めた。
1)Webの構造解析については、そのリンク構造や言語情報に基づいた各種のクラスタリング法および情報が作られた時間情報を用いたトピックのトラッキング法を考案した。
2)メディア処理および活用に関しては,特に,(1)言語の不均質性,(2)ジャンル(コンテンツのタイプ)の不均質性に着目し,多言語の文書集合からのトピック抽出や文書のジャンルに応じた要約自動生成などについて研究を行った.さらに,(3)画像,映像などを含むメディア横断の検索手法や学習環境への活用について研究を行った。
3)国内外の多数の研究グループが参加する評価型ワークショップ「NTCIR」を開催し、不均質コンテンツ活用システムの有効性評価を目的とし、共通の評価用データを有するテストベッドを協同構築した。JPドメインから自動収集したテラバイト規模のデータセットを構築し、現実に即した評価方式を実現するなどの成果を得、当該研究領域の進展に貢献した。
4)Web情報源に対する工学的な処理とモデルの分析が前提としている認識論的布置を、その歴史的背景にある近代印刷世界との対比で分析し、そこから、近代図書館に特権的に理念化されてきた「過去のメッセージを現在のアクチャリティをもって蓄積する」モデルはオンラインでは成立しにくく、オンライン上の情報を、内容等ではなく、特定のメディア的・物理的属性により区別した上で、図書館モデルへ当てはめる領域を絞り込むことが妥当であることを示した。
発表文献
雑誌論文
-
金沢 輝一, 相澤 彰子, 高須 淳宏, 安達 淳: "日英言語横断検索における関連性の重ね合わせモデルの効果" 情報処理学会論文誌「データペース」 43・SIG 2(TOD 13). 1-10 (2002),

-
Akiko Aizawa: "An Information-Theoretic Perspective of Tf-idf Measuress" Information Processing and Management 39・1. 45-65 (2003)
-
Koji Eguchi, Keizo Oyama, Emi Ishida, Noriko Kando, Kazuko Kuriyama: "Evaluation Methods for Web Retrieval Tasks Considering Hyperlink Structure" IEICE Transactions on Information and Systems E86-D・9. 1804-1813 (2003),

-
相澤 彰子: "低頻度語の利用によるテキストの分類性能の改善と評価" 情報処理学会論文誌 44・7. 1720-1730 (2003),

-
Kyung-Soon Lee, Kyo Kageura, Key-Sun Choi.: "Implicit Ambiguity Resolution Based on Cluster Analysis in Cross-Language Information Retrieval" Information Processing & Management 40・1. 145-159 (2004)
-
高須 淳宏, 相原 健郎: "テキスト認識エラーモデルによる引用文献文字列からの書誌要素の抽出" 電子情報通信学会論文誌 J87-D-II・6. 1298-1308 (2004),

-
Kageura, K., Daille, B., Nakagawa, H., Chien, L-F.: "Recent trends in computational terminology" Terminology 10・1. 1-21 (2004)
-
Tomonari Masada, Atsuhiro Takasu, Jun Adachi: "Decomposing the Web Graph into Parametarized Connected Components" IEICE Transactions on Information and Systems E87-D, 2. 380-388 (2004),

-
相澤 彰子, 大山 敬三, 高須 淳宏, 安達 淳: "レコード同定問題に関する研究の課題と現状" 電子情報通信学会論文誌,Dl J88-D1・3. 576-589 (2005),

-
正田 備也, 高須 淳宏, 安達 淳: "リンク情報の利用によるWeb検索性能の改善" 情報処理学会論文誌「データベース」 SIG8(TOD26). 48-59 (2005)
-
Frederic C.Gey, Noriko Kando, Carol Peters: "Cross-language Information Retrieval : the Roard Ahead" Information Processing and Managemen 41・3. 415-431 (2005)
-
Tsuneaki Kato, Jun'ichi Fukumoto, Fumito Masui, Noriko Kando: "Are Open-domain Question Answering Technologies Useful for Information Access Dialogues? - An Empirical Study and a Proposal of a Novel Challenge" ACM Transactions of Asian Language Information Processing 4・3. 243-262 (2005),

-
関 洋平, 江口 浩二, 神門 典子: "利用者の情報要求を考慮した観点に基づく複数文書要約とその評価" 情報処理学会論文誌データベース SIG8 (TOD26)・46. 106-119 (2005)
-
Lee, K-S., Kageura, K.: "Korean-Japanese Story Link Detection based on Event Term Weighting on Timelines and Multilingual Spaces" Information Processing and Management 42・2. 935-946 (2006)
-
Makoto Iwayama, Atsuhi Fujii, Noriko Kando, Yuzo Marukawa: "An empirical study on retrieval models for different document genres : Patents and newspaper articles" Information Processing and Management 42・1. 207-221 (2006)
図書
このページのURI
http://kaken.nii.ac.jp/ja/p/13224087/2005/6/ja
