カタカタブログ

SIerで働くITエンジニアがカタカタした記録を残す技術ブログ。Java, Oracle Database, Linuxが中心です。たまに数学やデータ分析なども。

2016-04-01から1ヶ月間の記事一覧

MacでR+MeCabによる形態素解析をやってみた

R

自然言語処理でおなじみの形態素解析ツールMeCabをMac上のRから使えるようにしてみた。今回は環境構築の手順をメモ。 環境情報は以下。 Mac OS X El Capitan (10.11.3) MeCab 0.996 R 3.2.3 (2015-12-10) MeCabインストール MeCabは、macではbrewで簡単にイ…

R言語とImageMagickでgifアニメを作成

R

R言語で分布などをグラフィック生成される場合に、パラメータを少しずつ変えて微妙に変化するグラフィックをアニメーションさせて見てみたくなるときがよくある。 例えば、カイ二乗分布のような自由度ごとにグラフの形が大きく変わるようなものは、自由度を…

【統計】二項分布をR言語で描画してみた

今回は二項分布のヒストグラムをR言語で可視化してみた。二項分布は「コイン投げで表が出る」や、「サイコロを振って1の目が出る」のような事象が一定確率で「成功するか、しないか」の2者択一の試行をそれぞれ独立に繰り返したときに現れる分布(ちなみにこ…

【機械学習】Rで手書き数字データMNISTをニューラルネットで学習してみた

今日はR言語を使って機械学習の入門ということで、ニューラルネットを使ってみた。 今回の目標は、Rを使って機械学習の一連のプロセスである、トレーニングデータの学習によるモデル構築と、それを使ったテストデータの評価までを一通りやってみる。なので、…

【統計】F分布をR言語で実験してみた

前回、カイ二乗分布をR言語で実際に描いてみた。 totech.hateblo.jp 今回はカイ二乗分布とも関連のあるF分布を同じ要領で、Rを使って実際にヒストグラムを描いてみる。 F分布の定義 まずは教科書的なF分布の定義の確認から。 確率変数U, Vがそれぞれ自由度k_…

【統計】カイ二乗分布をR言語で実験してみた

再び、統計の勉強。今回はカイ二乗分布について勉強してみたので、分布をR言語で実際にデータを生成してヒストグラムを描いてみる。カイ二乗分布の標準正規分布の二乗和として定義され、自由度dfごとに分布がある。数式での定義は他の文献に譲るとして、要す…