北野坂備忘録

主にインストールやプログラミングのメモを載せています。

2018-01-01から1年間の記事一覧

岡三マンは何人で構成されているか自然言語処理で解析してみた

Twitterで有名な「岡三マン(@okasanman)」は複数人執筆説があります。 twitter.comそこで、本稿では統計解析環境「R」を用いて岡三マンが何人で執筆されているのか分析してみました。今回は 2018/03/08 から 2018/03/18 までの 796tweet を分析対象とします…

CentOS6でneologdの更新ができなくなった(SSL connect error)

fatal: unable to access 'https://github.com/neologd/mecab-ipadic-neologd.git/': SSL connect errorSSLでhttps接続しようとするとエラー。 curlのバージョンが古い……のではなくてnssが問題らしい。 yum update nssこれで解決した。

Rによる機械学習入門

こちらの本を読んでみました。 Rによる機械学習入門 一言で言うと「詰め込み過ぎ」。 どれくらいギュウギュウかというと、第7章が「仮説検定」なんですが、 ・仮説検定の枠組み ・ノンパラメトリック検定 ・分散分析 このそれなりにボリュームのある3つの話…

Rプログラミング本格入門: 達人データサイエンティストへの道

いい本だったのでご紹介。 Rプログラミング本格入門: 達人データサイエンティストへの道 「本格入門」とありますが「入門」ではなく「本格」派です。初心者向きではありません。内容紹介でも「中級者へ向けて書いた入門書」と書かれてあり「それは入門書では…

「初心者が実践的に学ぶ」とは? ~専門家の誤謬~

岩波データサイエンス刊行委員会メンバーによる連続する2つのツイートを見ていただきましょう。「ベイズ統計を基礎から学ぶ」というと (1)スパムフィルタとかのナイーブベイズ近似をベイズの代表と思う (2)主観確率の公理に詳しくなる (3)無情報事前分布の通…