はじめに
- 筑波大学オープンコースウェアの機械学習を視聴させていただいたときのメモです。
視聴メモ
(前回の復習)精度と再現率のコントロール
- 指標が二つあるとどうすればよい?
- 精度も再現率もほどほどに = 正解率が高い
- ROC曲線の下の面積 = AUC(area under the curve)を性能指標として用いる
(前回の復習)マルチクラス分類
- structured output
- 惜しさ、を考慮する
- 猫とチーターは惜しいが、犬は遠い
カーネル
- 線形モデル(超平面)で分離しようとしても、限界がある
- 特徴量生成関数をかますことで、あえて次元を高くする
- -> 単純なモデルで学習する
- 回帰のときは、線形だけでなく、多項式回帰を使って非線形も使用したが、分類は超平面だけ?
- -> カーネル
- 交互作用項を持つ多項式特徴量を導入すると、組み合わせの数だけ数が増えてしまう
- (つまり)特徴量の考え方
- SVMカーネル版