scikit-learnでトレーニングデータとテストデータを分割する
機械学習させるときに用意したデータの9割を学習用データに、1割をテストデータに使ったりします。その分割を手軽にしてくれます。scikit-learnを使いたくてPython書いてるようなもんです。 from sklear … 続きを読む
機械学習させるときに用意したデータの9割を学習用データに、1割をテストデータに使ったりします。その分割を手軽にしてくれます。scikit-learnを使いたくてPython書いてるようなもんです。 from sklear … 続きを読む
以前は optparse 使ってましたけど、廃止予定だそうです。で、今は argparse 使います。2.7以降はargparseが標準で入ってるそうなので、今時はもうoptparseも使えはするけどargparse一択 … 続きを読む
今更のWord2Vec。 分かち書きしたテキストファイルを読み込ませて学習データを作って保存。保存した学習データを読み込んで類義語を出力するところまで。毎回学習してから類義語抽出っていう訳にもいかないから学習データの保存 … 続きを読む
分類するだけじゃなくて学習したデータを保存もしています。学習データがあったらデータを読み込んで利用します。 import os from sklearn.ensemble import RandomForestClass … 続きを読む
$ import numpy as np $ _array = np.array([1, 2, 3]) $ _n_array = _array / np.amax(_array) * 1 $ print(_n_array … 続きを読む
Requests は「人間のためのHTTP」という謳い文句のhttpライブラリ。確かにとても便利。Python3であれば http.client 使えばいいんですけど、ついついRequestsを使ってしまう。 _resp … 続きを読む
PythonでジョブキューするといえばやっぱりCeleryがスタンダードなんだろうか。RQというシンプルなジョブキューライブラリもあるんですけど、今回はCeleryを動かしてみる。 インストールは簡単。 pip inst … 続きを読む
Non-negative Matrix Factorization(NMFでググるといろいろ出てきます)、非負値行列因子分解です。 集合知プログラミング でも紹介されている特徴を抽出する方法です。推薦エンジンとかにも使わ … 続きを読む
Wikipediaにも「Pythonで書かれたスケーラブルでノンブロッキングなWebサーバ、Webフレームワーク」と書かれたTornadoのデバッグモードをオンにしてファイルの変更を検知してリロードしてくれるようにするや … 続きを読む
from datetime import datetime print(datetime.fromtimestamp(1432049226)) これだけ。