研究課題/領域番号 |
16590430
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
医療社会学
|
研究機関 | 京都府立医科大学 |
研究代表者 |
大武 博 京都府立医科大学, 医学研究科, 教授 (20149925)
|
研究分担者 |
金子 周司 京都大学, 薬学研究科, 教授 (60177516)
鵜川 義弘 宮城教育大学, 教育学部, 教授 (20232803)
河本 健 広島大学, 医歯薬学総合研究科, 講師 (50224861)
竹腰 正隆 東海大学, 医学部, 講師 (80221373)
BRIAN Morren (MORREN Braian) 福井県立大学, 学術教養センター, 教授 (20244519)
|
研究期間 (年度) |
2004 – 2006
|
研究課題ステータス |
完了 (2006年度)
|
配分額 *注記 |
3,500千円 (直接経費: 3,500千円)
2006年度: 700千円 (直接経費: 700千円)
2005年度: 1,000千円 (直接経費: 1,000千円)
2004年度: 1,800千円 (直接経費: 1,800千円)
|
キーワード | 英文コーパス / 共起表現 / 英文用例 / 英文作成支援 / 生命科学 / インターネット / Life Science |
研究概要 |
本研究では、英文分析用元資料として、PubMedを利用して医学・生命科学分野の主要学術雑誌に発表された英文抄録を採集し、英文コーパス(LSDコーパス)を作成した。この英文コーパスは、本研究着手当初は、総語数約3000万語、異語数約22万語から構成されていたが、その後充実を計り、完成年度の平成18年度末には、総語数で6000万語を超えるに至っている。このコーパスを計量分析した結果、論文抄録の90%は約1万語の範囲内で書かれており、1000語未満の単語が、全体の約70%をカバーしていることが判明した。本研究プロジェクトを通じて、任意の語(句)についての日英対訳、用例、共起を、非常に簡単なインターフェースで瞬時に検索・表示できるシステムを構築し、無償で公開しており(http://lsd-project.jp/)、日々10万件を超えるアクセスを記録している。このシステムを利用して、頻度の高い語を中心に、英語ネイティブ著者達の英語の特性を分析し、日本人研究者の書く英語表現との差異を調査研究した。日本人英語の特性調査研究と平行して、約3000万語の抄録の中で、4000回以上出現した動詞・名詞・形容詞および1000回以上出現した副詞を中心に、論文を書くために重要な単語およびその派生語約1000語を選び、それぞれ論文でよく使われる重要表現を収集した。 調査研究結果をふまえ、医学・生命科学関連英文論文作成支援の観点から、頻出語彙を中心に類義語辞典の作成を実現した。
|