ベースラインシステムの実装
博士課程としての研究をスタート。
今一番興味があるのはこの論文。
http://www.aclweb.org/anthology/P15-1051
ざっくり説明すると、文書が与えられたときに
その文書を読む際に必要な背景知識を抽出するという論文。
やはり、人間の常識的なところをうまく利用して
既存タスクの精度を上げていくという方向性でいきたいので、
この論文はうってつけだと思っている。
まずは、上論文を実装してその改良で
1つ研究をまとめられればと思っている。
上の論文は評価実験で文書分類をしているということで、
そのデータセットを収集中。
ざっと調べたところ、以下の2つのデータセットがあるとのこと。
・Reuters-21578
・20Newsgroups
20Newsgroupsについては以下のサイトでナイーブベイズの実装が公開されていたので、まずはその実装から始めようと思う。
2週間後のミーティングまでに
既存手法の実装+エラー分析+改良法の提案
までいきたい。