ベースラインシステムの実装

博士課程としての研究をスタート。

 

今一番興味があるのはこの論文。

http://www.aclweb.org/anthology/P15-1051

 

ざっくり説明すると、文書が与えられたときに

その文書を読む際に必要な背景知識を抽出するという論文。

 

 

やはり、人間の常識的なところをうまく利用して

既存タスクの精度を上げていくという方向性でいきたいので、

この論文はうってつけだと思っている。

 

まずは、上論文を実装してその改良で

1つ研究をまとめられればと思っている。

 

 

上の論文は評価実験で文書分類をしているということで、

そのデータセットを収集中。

 

ざっと調べたところ、以下の2つのデータセットがあるとのこと。

・Reuters-21578

・20Newsgroups

 

20Newsgroupsについては以下のサイトでナイーブベイズの実装が公開されていたので、まずはその実装から始めようと思う。

 

aidiary.hatenablog.com

 

 

2週間後のミーティングまでに

 

既存手法の実装+エラー分析+改良法の提案

 

までいきたい。