Pythonで標準偏差と偏差値を求めてみる
import numpy as np def main(): _v = np.array([35, 40, 45, 50, 100]) _avg = np.average(_v) _std = np.std(_v) pr … 続きを読む
import numpy as np def main(): _v = np.array([35, 40, 45, 50, 100]) _avg = np.average(_v) _std = np.std(_v) pr … 続きを読む
SVMはパラメータが多すぎる。全部試すとか手間が掛かり過ぎる。 そんな悩みを解決したいグリッドサーチの使い方です。 from sklearn.svm import SVC from sklearn.grid_search … 続きを読む
SVMなので二値分類です。多値分類でもSVMを使うこともありますが、あれは二値分類の繰り返しなのでやっぱりSVMを使うのであれば二値分類なんだろうなぁと思います。 LinearSVC、線形カーネルのサンプルです。相変わら … 続きを読む
機械学習させるときに用意したデータの9割を学習用データに、1割をテストデータに使ったりします。その分割を手軽にしてくれます。scikit-learnを使いたくてPython書いてるようなもんです。 from sklear … 続きを読む
以前は optparse 使ってましたけど、廃止予定だそうです。で、今は argparse 使います。2.7以降はargparseが標準で入ってるそうなので、今時はもうoptparseも使えはするけどargparse一択 … 続きを読む
今更のWord2Vec。 分かち書きしたテキストファイルを読み込ませて学習データを作って保存。保存した学習データを読み込んで類義語を出力するところまで。毎回学習してから類義語抽出っていう訳にもいかないから学習データの保存 … 続きを読む
分類するだけじゃなくて学習したデータを保存もしています。学習データがあったらデータを読み込んで利用します。 import os from sklearn.ensemble import RandomForestClass … 続きを読む
$ import numpy as np $ _array = np.array([1, 2, 3]) $ _n_array = _array / np.amax(_array) * 1 $ print(_n_array … 続きを読む
Requests は「人間のためのHTTP」という謳い文句のhttpライブラリ。確かにとても便利。Python3であれば http.client 使えばいいんですけど、ついついRequestsを使ってしまう。 _resp … 続きを読む
PythonでジョブキューするといえばやっぱりCeleryがスタンダードなんだろうか。RQというシンプルなジョブキューライブラリもあるんですけど、今回はCeleryを動かしてみる。 インストールは簡単。 pip inst … 続きを読む