研究課題/領域番号 |
15K00154
|
研究機関 | 岩手県立大学 |
研究代表者 |
槫松 理樹 岩手県立大学, ソフトウェア情報学部, 准教授 (00305286)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | 文書分類 / 自然言語処理 / 特許情報 |
研究実績の概要 |
本研究では,権利調査などにおける特許公報処理支援を行うために,特許公報で述べられている,解決しようとする課題とその手段の候補を推定する手法を2つ提案した. 第1の手法では,専門家により事前に分類された特許公報の要約文における語句の出現情報をもとに未分類特許公報の分類を推定する.語句としては,形態素列,カタカナ列,英字列,専門辞書中の代表語のいずれかを抽出する.語句としては,課題・手段において傾向が違う事から,課題抽出用,手段抽出用それぞれを選出することとしている.また,分類のうち,出現特許が少ない特許をまとめて扱うことで精度向上を図る. 専門家の協力のもとに行った評価実験においては,ランダムで選択した精度よりも高い値となったが,ラベル数の偏りに影響が大きい結果となった. 上記の結果を踏まえ,特許を文書ベクトルに変換するのではなく,ANNを用いて分類モデルを構築し,それを用いる第2の手法を構築した.第2の手法では,専門家により事前に分類された特許公報の要約文における語句の出現情報をもとに機械学習手法で作成したモデルを用いて未分類特許公報の分類を推定する.専門家の協力のもとに行った評価実験においては,正解率は従来手法には及ばなかった. 第1の手法と第2の手法を比較した結果,ベクトルの造り方に際があり,それが正答率が低くなった大きな要因となっていると考えられる.そのため,この点を解消する方法を検討している.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成28年度においては、研究協力者に助言をうけながら、複数の方法を構築、評価してきた。それらの成果を発表することは少なかったが、一定の結果を得ている。 また、それらの結果に基づき、新たな観点を見つけるとともに、研究開発の進度が速い機械学習分野の手法を取りいれる準備も整えつつある。 以上の点から、おおむね順調に進展していると評価する。
|
今後の研究の推進方策 |
平成29年度においては、平成28年度までに検討した手法および新たな手法を精査し、整理する。この結果に基づき、システムを再度構築する。さらにシステムを従来のデータで評価する事で、研究の総括を行う。
|
次年度使用額が生じた理由 |
学内における役割が変更となり、入試の本部業務などの学内業務が増加した。 そのため、3日以上の出張が難しくなり、予定していた海外出張に行けなかったことが大きな要因である。また、特許処理作業が人手を要しなくともある程度は進めることもあり、学生バイトなどの雇用をしなかったことも大きな理由である。
|
次年度使用額の使用計画 |
今年度も、入試の本部業務などの学内業務を行う必要がある。そのため、海外出張は難しいが、国内の研究会や会議に積極的に参加するとともに、論文誌への投稿を目指す。また、単純だがボリュームある業務については、学生バイトを雇用するなどし、科研費の適正かつ有効的な活用に努める。
|