平成30年度7月海外派遣報告

WRHI海外研究機関派遣支援プログラムにより、「法律文書からの議論構造抽出」について共同研究を行うためUniversity of Cambridgeを訪問した。

University of Cambridge Computer laboratoryのSimone Teufel 教授の元を訪問し、一カ月に渡って共同研究を行った。Teufel教授は文書からの情報抽出・要約のため、文書中の各テキストが議論構造中で果たす役割を特定し、抽出する枠組みであるArgument Zoning の提案者であり、自動要約研究のスペシャリストである。我々は法律文書向けのArgument Zoning枠組みを拡張して、より精密な議論構造を考慮した要約研究に取り組んでおり、今回の共同研究ではその枠組みに沿って用意した注釈付きデータを利用して、実際に機械学習を用いた自動抽出の実験を行った。特に、今回は深層学習を用いたアプローチを用いて、文書中の各テキストの修辞役割を分類する数種のモデルを構築し、実験を行った。これまでの実験で使用していたサポートベクトルマシン/条件付き確率場を用いた分類モデルと比較して、期待していた性能の大きな向上は見られなかったものの、これまでに構築してきた人手による特徴量実装の有効性が確認できたことは大きな成果となった。今回の訪問で行った共同研究については、今後追加実験と内容の拡張を行い、国際学会にて発表する予定である。

 

 

また、同期間中に関連研究者との意見交換・共同研究への関係構築のため、University of Edinburgh及びUniversity of Bristolを訪問した。

University of Edinburgh のClare Grover教授の研究室を訪問し、Grover教授の紹介で科学技術論文に対するArgument Zoningを研究しているArlene Casey氏と、SNSにおけるユーザ投稿からのトピック(話題)抽出を研究しているClare Llewellyn博士とのミーティングを行い、今後の研究実施に有益な情報交換を行った。今後も緊密に連絡を取り合うことで一致し、特にデータ量が少ない際の議論構造抽出やトピック抽出の手法に関して情報交換を継続する予定である。

University of Bristolでは、Oliver Ray博士の研究室を訪問した。Ray博士は、イギリスの判決書からのRatio Decidendi(判決の主要な結論部分)を抽出する研究を行なっており、我々の研究内容及び研究対象文書の観点から非常に関連性が高い。今回の訪問では、相互の研究内容の共有と今後の共同研究に向けた意見交換を行った。議論を進めるうちに、日英での相違点、共通点はそれぞれ見えてきたが、アプローチに至った動機やその枠組みの理念は訪問者の研究の目指すところと同一であることがわかり、直接緊密に議論を交わすことで深い相互理解と意見交換を行うことができた。Ray博士らのグループとは判決書からの議論構造抽出のアプローチに関しての共同研究を行うことを目指し、今後頻繁に意見交換を行っていく。

 

情報理工学院 情報工学系 知能情報コース
徳永研究室
博士後期課程・山田 寛章