分からんこと多すぎ

何故か就職できたので技術磨く。一人前の多重線形代数使いを目指しつつ、機械学習、データマイニングをやる

ICML2013:疎行列の固有ベクトル計算(sPCA)読んで実装した

大昔に書いた下書きを発見したので公開 論文Fast algorithms for sparse principal component analysis based on Rayleigh quotient iteration Volodymyr Kuleshov著概要疎行列の固有ベクトルを、レイリー商を使う事により高速に解く。著者によると、既存のS…

ゼロから始めるDeepLearning_その4_Restrictedボルツマンマシンとは

はじめにMNISTで全然うまく行かないことが発覚したので、最適化を調べ中きちんと動きました。学部四年生向け。だった。ニューラルネットワーク →(AutoEncoder) →(DenoisingAutoEncoder) →ホップフィールドネットワーク →ボルツマンマシン →Restrictedボ…

ゼロから始めるDeepLearning_その3_ボルツマンマシンとは

はじめに学部四年生向け。ゼロから始めるDeepLearning_その1_ニューラルネットとは - 分からんこと多すぎ →(Auto Encoder) →(Denoising AutoEncoder) →ゼロから始めるDeepLearning_その2_ホップフィールドネットワークとは →ボルツマンマシン(この記事…

ゼロから始めるDeepLearning_その2_ホップフィールドネットワークとは

はじめに学部四年生向け。ゼロから始めるDeepLearning_その1_ニューラルネットとは - 分からんこと多すぎ →(Auto Encoder) →(Denoising AutoEncoder) →ホップフィールドネットワーク(この記事) →ゼロから始めるDeepLearning_その3_ボルツマンマシンと…

ゼロから始めるDeepLearning_その1_ニューラルネットとは

対象とする人ディープラーニングすごい! ←聞き飽きたチュートリアルあるよ! ←ふわっとしすぎて具体的なところが分からんこういう論文あるよ! ←読めるわけないだろそういう人向け。(たぶん学部四年程度向け)ニューラルネット初学者が、書ききるまで怪し…

Rのxtableにおける浮動小数点表記(floating point expression, scientific notation)

R

Rでは,行列をlatexの表形式にして出力してくれるライブラリが存在する.この表に出力する時に,浮動小数点表記(floating point expression)をする方法が日本語で書かれていなかったため,記事にする. library('xtable') data <- matrix(0.0000001,3,2) x…

はてなブックマークをデータマイニングした_2013年_06月-09月

概要TwitterなどのSNSは、自分の興味ある話題を共有できるユーザのグループを見つけ、その人達とオススメ情報を共有するのが、メジャーな使い方でしょう。したがって、私のようなコミュ症は、そもそもSNSに向いていません。 そこで本記事では、はてブユーザ…

RユーザのためのJulia入門(行列編)

Julia(プログラミング言語)が、高速で取っ付き易い言語との噂だったので、Deep押し過ぎのNIPSで折れた心を癒やすために、遊んでみる。なお、本当にRしか書けない底辺コーダーなので、言語の仕様とかは他のページを見てください。この記事は、とりあえずJul…

RecSys2013のBestPaperを読む_Fast_Parallel_SGD

RecSys 2013 (Hong Kong) - RecSysのbest paperが、なんだか面白そうだったので読む。A Fast Parallel SGD for Matrix Factorization in Shared Memory Systems著:Yong Zhuang, Wei-Sheng Chin, Yu-Chin Juan, and Chih-Jen Lin本論文自体は、Matrix Factor…

確率的勾配降下法(SGD)の並列化について

RecSys 2013 (Hong Kong) - RecSysのbest paperが、なんだか面白そうだったので読む。A Fast Parallel SGD for Matrix Factorization in Shared Memory Systems論文の提案手法に関してはこっち RecSys2013のBestPaperを読む_Fast_Parallel_SGD - 分からんこ…

R言語でテンソルを解析する_四則演算編

11/17追記 どうも計算が間違っていることに気がついたので修正中R言語で疎テンソルを扱うために、slamを導入したが、slamでは要素に対する値の代入ができない。例えば、dataという三階のテンソルのi,j,k要素のvalue(値)を10に変更するという処理 data[i,j,…

R言語でテンソルを解析する_bind編

R言語で(数万×数万×数万)からなるテンソルを扱うキチ◯イのために、テンソルを処理してbindする方法を書いておく。R言語ではおそらく、slamパッケージ以外に巨大な疎テンソルを扱う方法が存在しない。 したがって、以下ではslamパッケージを使うことを前提…

グラフ(ネットワーク状)構造のクラスタリング(グループ分け)基礎:The Markov Cluster Algorithm(MCL)まとめた

MCLのスライドan introduction to the MCL algorithmめちゃくちゃ基本らしい。けど微妙に関係ないので、さわりだけ読む。無意味にグラフ理論の基礎に触れつつ、エッジリストから高速にクラスタを組む話をする。元論文は有料だったので諦めた。ので、何か微妙…

htopのCPU付加とメモリ使用量の色の意味

htopのバーの色の意味がわからなかったので調べた。 CPU 緑:通常の優先度の処理の使用量 赤:カーネルの使用量 メモリ 緑:使用中メモリ 青:バッファ(処理速度差緩衝用メモリ) 黄:キャッシュ(使用頻度の高いデータ)

R言語のdo.callとReduceの速度を比較する

R

概要 行列のリストをbindして、巨大な一つの行列にすることを考える。 Rjpwiki的には、do.callでbindするらしいが、実際のところ、do.callとReduceとdoMCのどれが一番速いのか気になったので、比較してみた。実験条件 適当な100*100の行列を100個用意して、…

R言語で因子の組み合わせを全通り作る

Rで様々な因子の組み合わせを作るのに、意外と手こずったのでメモ。例えば、ランチメニューで、Aセット(パスタ2種、飲み物3種)があり、それらの組み合わせを全通り作ることを考える。 A <- expand.grid(pasta=c('ミートソース','カルボナーラ'), drink=c('…

MacOSXで無限容量のDropbox作った

概要 MacOSX側でファイルの変更(作成・変更・削除)があった場合、それを検知し、別のPC(サーバ)と同期する。 ファイルはMac側とサーバ側の両方に実体として残る。 バックアップ、ログなども取れるが、今回は使用しない。 メリット 容量が事実上無制限 デ…

Rで疎な多次元配列を扱う(Matrix,slamパッケージ)

概要 Rで大規模テンソル解析がしたい。 そのために、slamパッケージを使う。 slamパッケージとは、疎な行列、配列を扱うためのパッケージである。 Matrixパッケージ(疎行列)やffパッケージ(ストレージの利用)とは異なり、疎な多次元配列を扱うことができ…

rpy2でpythonからRを叩く

Rでテンソル分解ツール作っちゃったので、pythonからRを使う。 Rだけで良かった説はある。導入 brew install R pip install rpy2 使い方 Rのデフォ関数を呼ぶ import rpy2.robjects as ro #ro.rはRとの接続チャンネル r = ro.r matrix = r['matrix'] >>> pri…

はてなブックマークの解析始めつつ、とりあえずpylabを使ってみた

とりあえず簡単にデータを提示してみる。 データは2013/05/30~2013/05/31 2日分ファイル操作 11.10 shutil -- 高レベルなファイル操作 画像の保存 グラフを画像で保存する - TB-code 辞書のソート 8.3. collections — 高性能なコンテナ・データ型 — Python …

SciPyをインストールする

pythonでSciPyをインストールするには、numpyとgfortranが必須という備忘録 brew install gfortran pip install numpy pip install scipy それだけ

mysql-python(MySQLdb)を使ってみる

pythonでRSSをもらってきているので、pythonでMySQLを叩く。 MySQL - python入門から応用までの学習サイト pythonのmysqldbの使い方メモ | taichino.com API Documentation homebrewからmysql-pythonをもらってくる pip install MySQL-pythonMySQLのデータベ…

超絶初心者が初めてMySQLを使ってみる

優しい解説はこちら MySQL初心者入門講座 MySQL入門 (全19回) - プログラミングならドットインストール MySQL 逆引きリファレンス

MacOSX10.6.8(snow leopard)でMySQLサーバを立てる

いつも通りhomebrewで作る 参考はこちら。 HomebrewでMySQLをインストールする時に知っておきたいこと | Macとかの雑記帳 HomebrewでMySQL 5.6をインストール。開発用my.cnfもさらす | karakaram-blog 快速MySQLでデータベースアプリ!(3):コマンドによる…

MacOSX10.6.8(snow leopard)でvirtualenvを使いpython環境構築

virtualenvを作って、その中に構築する。 virtualenvは読んで字のごとく、python仮想環境を構築するものである。 モジュールなどの管理、導入が楽。virtualenvの説明は以下 virtualenv - def __mopemope__(self, *args, **kwargs): virtualenvの設定は以下 P…

MacOSX10.6.8(snow leopard)にXcodeをインストールする

余っていたぼろいMacにhomebrewを入れようと思ったら、Xcodeが必要だったので導入。 2013/5/22現在、AppStoreのダウンロードページから入手できるのは、Lion以降用のXcodeであり、SnowLeoperdでは使用できない。 Apple公式開発者用DLページはこちら。ちなみ…

iPad,iPhoneのデフォルトカレンダーとGoogleカレンダーを双方向同期する

Sync Google Calendar with your iOS device - Calendar Help との公式ページを参照して設定したが、 Googleカレンダー → iPadのカレンダー(iCal)は反映されるが、 逆、つまりiPadのカレンダー → Googleカレンダーは反映されない。理由は、iCalを開いた画面…

/server/Lesson01

ドットインストールを見ながら、ローカル開発環境を1から構築する。Webサーバ(Apache?)、PHP、MySQLを入れる。 いわゆるLAMPの構築。VirtualBox Downloads – Oracle VM VirtualBoxから VirtualBox 4.2.12 for OS X hosts x86/amd64(仮想環境)Index of /…

/command/unison/memo02

概要 unisonとは、ディレクトリ同期コマンドである。 要するにコマンド版Dropboxだ。 FreeBSDサーバにunisonをインストールし、ローカルとディレクトリを同期する。参考はこちら。 unisonでファイル、ディレクトリの同期 - ひゃまだのブログ

/html/memo001

本日のhtml/css 本日の記事でやったこと hタグ(スタイルの変更) 箇条書きとページ内リンク

/command/unison/memo01

unisonとは unisonとは、同期コマンドである。 rsyncやscpとは違って、双方向に同期できる(全く同じ内容のディレクトリを作れる)ようだ。要するに、コマンド版Dropboxだ。 もちろん、同じ名前のファイルが存在する時には、残すファイルを選択しながら同期…

/python/numpy/array01

概要 しましま先生の神スライドとSciPy神チュートリアルを見つつ、pythonとnumpyを勉強する。ついでにhtmlを勉強する。 要するにコピペなので、当ページに価値はない。ドットインストールでpythonの基礎勉強した人用。 本で言うなら、みんなのpythonを流し読…