分からんこと多すぎ

何故か就職できたので技術磨く。一人前の多重線形代数使いを目指しつつ、機械学習、データマイニングをやる

はてなブックマークの解析始めつつ、とりあえずpylabを使ってみた

とりあえず簡単にデータを提示してみる。
データは2013/05/30~2013/05/31
2日分

ファイル操作
11.10 shutil -- 高レベルなファイル操作
画像の保存
グラフを画像で保存する - TB-code
辞書のソート
8.3. collections — 高性能なコンテナ・データ型 — Python 2.7ja1 documentation
ipythonのペースト
python - How does IPython's magic %paste work? - Stack Overflow
plotの文字コード
Nobwak's Lair | Just another WordPress site

import matplotlib as mpl
import pylab

d=辞書を入れます

#すでにあるグラフの削除(消さないと重ね書きされる)
pylab.clf()

#フォントの指定(しないと日本語が文字化けする)
pylab.rcParams['font.family'] = 'Hiragino Kaku Gothic Pro'
pylab.rcParams['font.size'] = 12

#円グラフの描画
pylab.pie(d.values(),labels=d.keys())

#グラフの保存
f = 'output.png'
plt.savefig(f)

はてブでアクティブなユーザ20人
f:id:rishida:20130531195449p:plain

はてブでよく使われるタグ20個
f:id:rishida:20130531195456p:plain

とりあえずデータベースに突っ込むけれど、MySQLに入れるとビッグスパースデータが生まれてしまうので、考え中。
mongoDBという代物が良いらしい?