3月 03
このエントリをはてなブックマークに登録 Yahoo!ブックマークに登録

例えばWindowsクライアントからアップロードされたCSVとかはたいていShift_JISなわけです。Pythonは基本的にUTF-8(Django使ってるから、というのも大きな理由ですな)なので、そのままだとえらいこっちゃになるわけです。

u”ほげほげ”.encode(‘cp932′,’utf-8′)

cp932(Shift_JIS)からutf-8にエンコードしますよ、という指定です。「文字列.encode(‘utf-8′)」でもいいのですが、それだとエンコード前の文字列エンコーディングは自動判定みたいですね。しょっちゅう「こんな文字列エンコード知らない」ってエラーが出ました。

ので、「~から~にエンコードしてね」ってやさしく説明してあげたほうが確実というわけです。

関連性のあるエントリはありません

Leave a Reply

Get Adobe Flash playerPlugin by wpburn.com wordpress themes
preload preload preload