scikit-learnのTfidfVectorizerで単語ごとのスコアを取得する
from sklearn.feature_extraction.text import TfidfVectorizer def main(): _docs = [ ‘A friend to all is a friend … 続きを読む
from sklearn.feature_extraction.text import TfidfVectorizer def main(): _docs = [ ‘A friend to all is a friend … 続きを読む
SVMはパラメータが多すぎる。全部試すとか手間が掛かり過ぎる。 そんな悩みを解決したいグリッドサーチの使い方です。 from sklearn.svm import SVC from sklearn.grid_search … 続きを読む
SVMなので二値分類です。多値分類でもSVMを使うこともありますが、あれは二値分類の繰り返しなのでやっぱりSVMを使うのであれば二値分類なんだろうなぁと思います。 LinearSVC、線形カーネルのサンプルです。相変わら … 続きを読む
機械学習させるときに用意したデータの9割を学習用データに、1割をテストデータに使ったりします。その分割を手軽にしてくれます。scikit-learnを使いたくてPython書いてるようなもんです。 from sklear … 続きを読む
分類するだけじゃなくて学習したデータを保存もしています。学習データがあったらデータを読み込んで利用します。 import os from sklearn.ensemble import RandomForestClass … 続きを読む