「Pokemon」で検索しても「Pokémon」がヒットするようにしよう
ふと気がつくと前回ブログ書いたのが5か月前という有様。安心してください、生きてますよ。 éとか、英字の上につくダッシュみたいな記号、アクセント記号って呼び方してましたけどダイアクリティカルマークっていうのが正しいんですね … 続きを読む
ふと気がつくと前回ブログ書いたのが5か月前という有様。安心してください、生きてますよ。 éとか、英字の上につくダッシュみたいな記号、アクセント記号って呼び方してましたけどダイアクリティカルマークっていうのが正しいんですね … 続きを読む
import itertools _x = [‘0’, ‘1’, ‘2’] _y = [‘a’, ‘b’, ‘c’] for _i, _j in itertools.product(_x, _y): print(_i, … 続きを読む
from sklearn.feature_extraction.text import TfidfVectorizer def main(): _docs = [ ‘A friend to all is a friend … 続きを読む
import numpy as np def main(): _v = np.array([35, 40, 45, 50, 100]) _avg = np.average(_v) _std = np.std(_v) pr … 続きを読む
SVMはパラメータが多すぎる。全部試すとか手間が掛かり過ぎる。 そんな悩みを解決したいグリッドサーチの使い方です。 from sklearn.svm import SVC from sklearn.grid_search … 続きを読む
SVMなので二値分類です。多値分類でもSVMを使うこともありますが、あれは二値分類の繰り返しなのでやっぱりSVMを使うのであれば二値分類なんだろうなぁと思います。 LinearSVC、線形カーネルのサンプルです。相変わら … 続きを読む
機械学習させるときに用意したデータの9割を学習用データに、1割をテストデータに使ったりします。その分割を手軽にしてくれます。scikit-learnを使いたくてPython書いてるようなもんです。 from sklear … 続きを読む
以前は optparse 使ってましたけど、廃止予定だそうです。で、今は argparse 使います。2.7以降はargparseが標準で入ってるそうなので、今時はもうoptparseも使えはするけどargparse一択 … 続きを読む
日産のLEAFという電気自動車に乗り換えて1年経ったのでどんなもんかブログに書いておきましょう。電気自動車に興味のある方、購入を検討している方の参考になれば幸いです。 なお、このエントリは電気自動車を否定するものではあり … 続きを読む
今更のWord2Vec。 分かち書きしたテキストファイルを読み込ませて学習データを作って保存。保存した学習データを読み込んで類義語を出力するところまで。毎回学習してから類義語抽出っていう訳にもいかないから学習データの保存 … 続きを読む