libSVMのパラメータ調整について
で、どうやら重要なのがパラメータ調整。
色々と考える必要があるみたい。
主に以下の3つ。
●素性のスケーリング
大きい値が支配的にならないように。
値の正規化みたいなもの。
libsvmではコマンド一発でスケーリングしてくれる。
svm-scale -l 0 -u 1 -s scale_data feature1 > feature1.scale
●カーネル関数
思考停止でRBFカーネルを使えばいいっぽい。
ただし、データ数<<特徴量の場合は線形カーネルのほうがうまくいく。
●cパラメータ、γパラメータ
cパラメータ:誤り時のペナルティのパラメータ
γパラメータ: RBFで用いるパラメータ
どうやらeasy.pyを使えば、スケーリング、パラメータ調整などをやってくれる様子。
とりあえず何かしらのデータセットについて試してみたい。
参考サイト様