libSVMのパラメータ調整について

昨日からSVMlibSVMを使って動かしている。

で、どうやら重要なのがパラメータ調整。

色々と考える必要があるみたい。

主に以下の3つ。

 

●素性のスケーリング

大きい値が支配的にならないように。

値の正規化みたいなもの。

libsvmではコマンド一発でスケーリングしてくれる。

 

svm-scale -l 0 -u 1 -s scale_data feature1 > feature1.scale

 

カーネル関数

思考停止でRBFカーネルを使えばいいっぽい。

ただし、データ数<<特徴量の場合は線形カーネルのほうがうまくいく。

 

●cパラメータ、γパラメータ

cパラメータ:誤り時のペナルティのパラメータ

γパラメータ: RBFで用いるパラメータ

 

 

どうやらeasy.pyを使えば、スケーリング、パラメータ調整などをやってくれる様子。

とりあえず何かしらのデータセットについて試してみたい。

 

 

参考サイト様

qiita.com

 

d.hatena.ne.jp