北野坂備忘録

主にインストールやプログラミングのメモを載せています。

Caffe Make時に必要なprotocのインストール(CentOS)

※CentOSにCaffeを入れるのはまったくおすすめしません。遥かに簡単ですので、Ubuntuを使ってください。 分かりやすい導入記事はコチラ。 http://www.nal.ics.es.osaka-u.ac.jp/personal/k-yamanishi/CaffeUbuntu.html _____________________________________…

トンネルズ&トロールズ

情報処理 2016年01月号 『情報処理』2016年1月号の「自然言語処理の現状と展望」という特集を読んでいたのですが、「言い換え技術」の例文で 「『トンネルズ&トロールズ第5版』はケン・セント・アンドレらによってデザインされた.」 というピンポイント爆…

あなたにとって英語のゴールは?

TOEICのスコアが850を超えるとそろそろ英語学習のゴールのことを考えないといけません。 3パターンほど考えられます。1. 研究のために英語力をつけたい TOEIC850もあれば自分の専門分野の論文を読む分には能力はほぼ不足していないはずです。TOEICの勉強は一…

最後はTOEIC公式問題集

TOEICテスト公式問題集 新形式問題対応編 最後の最後に行きつくのはコレです。最も間違った公式問題集の使用方法 「本番の一週間前に総仕上げとして実戦形式でやってみるぜ!」 ちがあああああああう! やめろおおお!スコア500~700の人 出来が悪くて心に傷…

究極のTOEIC文法問題集(過適合編)

邪道編その2です。 TOEICのスコアが800を超え、特にリーディングで伸びしろが無くなって来た時に頼るべき文法問題集がこちら。 新TOEICテスト 文法問題 でる1000問 こいつは完全にTOEICの特にPart5に特化しています。 この本をマスターすればPart5を異様なス…

公式問題を読む & 耳を育てる

今回は若干「邪道」です。 TOEICテスト 公式問題で学ぶボキャブラリー この本、「ボキャブラリー」目当てで買うとガッカリします。そんなに単語力が上がるとは思えない。 役に立つのは添付のCDと公式問題の長文のほうです。 実はこの公式問題CD、あのTOEICテ…

TOEIC800点を目指す

700点台の人がTOEIC800点台を目指すのであれば、オススメはこちら。 実戦形式の問題がそれぞれ3回分入っています。こいつをそれぞれ3周してスラスラ解けるようになれば本番でも無理なく最後まで到達できるようになるでしょう。 TOEIC(R) TEST800点突破リーデ…

まずは文法書

TOEICの勉強法の話をする前に釘をさしておきますが、TOEICの文法は極端に偏っています。だからこそ簡単に点が取れるんですが。 しかしながらTOEICの文法だけやってると海外の論文を読んだり、自分でアブストラクトを書いたりするときにたいへん困るわけです…

TOEICで865点とった

「今年3月13日のTOEICで865点を取った」という話をしたら数人から「どういう勉強をしたのか、どんな参考書を使ったのか」を目の色を変えてかなりしつこく聞かれたので、もしや情報系でも結構な需要があるのでは?と思いメモを残しておくことにしました。 た…

xgboostについて(メモ)

全く機械学習に興味のない人から「xgboostって何?」と聞かれました。 『くまみこ』のナツが「都会の人はみんなxgboostを使ってるよ」と煽ってくるツイートがツボにハマったそうです。都会の人はみんなxgboostを使ってるよ pic.twitter.com/v6ZfBJ8imN— おら…

naist-jdicとmecab-ipadic-NEologd

UTF-8版のipadicがうまく入らなかったため、mecab用辞書としてnaist-jdicを使っているのですが、どうしてもmecab-ipadic-NEologdが使いたくて試してみたところ、今のところ普通に動いています。 こちらのReadMeの「mecab-ipadic-NEologd をインストールする…

WindowsでAndroid Studioを使うとき、SHARP製のスマホが認識されない場合の対処法

ハンズオン会場でAndroid Studioがノートパソコンに差したSHARP製のスマホを一向に認識してくれず超焦りました。 下記の参考文献を元にGoogle から「Google USB Driver」をダウンロードして必死にインストールしていたのですが、全くインストールしてくれま…

ホップフィールド・ネットワーク

階層型ニューラルネットワークはイメージできるけど、ボルツマンマシンはイメージできない、という人が多いようです。 制限付きボルツマンマシンにいきなり取り組むよりも、もととなったホップフィールド・ネットワークのことを理解してから進んだほうが良い…

Masaaki_Inabaさんの「問題文の意味がわからない人のための 言語処理100本ノック 第9章 ベクトル空間法 (I)」

Masaaki_Inabaさんの qiita.com が超絶に分かりやすく、 「うわあー、すっごーい、わかりやすーい!」 と感動しながら最後まで読んでいたら、参考文献の一番上に 「北野坂備忘録」 って書いてあって3回転ぐらいひっくり返った。

パーセプトロンとディープラーニング

機械学習の勉強にパーセプトロンは避けて通れません。なぜならサポートベクトルマシンもディープラーニングもパーセプトロンから派生してきたからです。 マージンを最大化するパーセプトロンが線形サポートベクトルマシンです。それがカーネルトリックによっ…

文系にシグモイド関数を教えてみた

文系にシグモイド関数を教えるにあたり、Wikipedia風にいきなり数式をぶつけてはいけません。機械学習に出てくる数式の中では最も簡単な部類に属しますが、彼らにSANチェック(0/1D2)を要求してしまいます。 まずは図です。Wikipediaだとこの図がいいでしょう…

「高村本」とは

高村薫の本……ではない。このブログでも何度も取り上げている『言語処理のための機械学習入門』のこと。著者が高村大也 氏のため。 言語処理のための機械学習入門 (自然言語処理シリーズ)機械学習系のブログでは有名な書籍に対しこのような略称と言うか通称が…

「ラグランジュの未定乗数法」の大枠

「ラグランジュの未定乗数法を理解している人よりも、ラグランジュの未定乗数法を理解していないって言ってる人のほうがバリバリTensorFlowを使ってシステムを作っている……」という身近な闇は置いておいて。 なにはともあれ「ラグランジュの未定乗数法」の大…

東証一部上場企業の社長にも分かるように5分で説明

お題が出てた。「線形回帰モデルとSVMとランダムフォレストとDeep Learningの4つの手法の共通点と相違点を、東証一部上場企業の社長にも分かるように5分で説明して下さい」みたいなスキルテストがあったらつらそうだな、とふと思った— TJO (@TJO_datasci) 20…

『ITエンジニアのための機械学習理論入門』

ITエンジニアのための機械学習理論入門 まず、この本は「機械学習入門」ではありません。 タイトルどおり「機械学習理論入門」です。 機械学習の「理論」を学びたい人向けの「入門書」です。ですので、機械学習入門として「はじめてのパターン認識」を読んだ…

機械学習・データマイニング・テキストマイニングを勉強しようと思う初心者に送る入門書と送らない書籍一覧

この一年間機械学習・データマイニング・テキストマイニングの本をいろいろと読んできましたが、機械学習の大御所が紹介している本の中には「あなたは分かるだろうけど、俺たち初心者にはコレまだ理解できないよね?」というものもありました。 そこで、あく…

はじめてのパターン認識

はじめてのパターン認識 うーん残念。なぜこの本を最初に読まなかったのか……。 いろんなところで紹介されていますが、深層学習を始める前にランダムフォレストまでの基本的な機械学習(この本で言うところの「パターン認識」)の流れを学ぶにはこの本が一番…

(めも)パーセプトロンの語源

パーセプトロン(perceptron)の語源はパーセプション(perception)。 パーセプションには「知覚」と「認識」の意味がありますが、パーセプトロンが視覚と脳の機能をモデル化したものである以上、日本語的には「知覚+認識」が語源になるのかな?

本日の聞き間違い

Rachel(レイチェル)を「レイシャル」って言うのやめてくれませんかねぇ……。人名って気づかなかったよ。イギリスではそう発音するのか……?アメリカ人ははっきり「チェ」と発音してたしなぁ……。

『深層学習』:機械学習プロフェッショナルシリーズ

深層学習 (機械学習プロフェッショナルシリーズ) 深層学習に関する本ってあまり読んだことないんですが、この本はすごく分かりやすかった。 私はRNNと制約ボルツマンマシンを勉強したくてこの本を読んだんですが、畳込みニューラルネットワーク(CNN)の話も分…

t-SNE再訪

言語処理100本ノックの99番はこういう図を期待していたのではないか。 どのみち密集している中央部分は全く判別がつかないんですが。 プログラムは以下のとおり。 #!/usr/bin/env python import codecs import re import copy import numpy as np from sklea…

言語処理100本ノック 2015年版 (96-99)

96. 国名に関するベクトルの抽出 word2vecの学習結果から,国名に関するベクトルのみを抜き出せ. 国名って以前やりましたよね。 81で作った国名リストがあるのでそれを使います。 問題はU.Sみたいな前のリストに入れていない国名をどうするか。 後の設問を…

言語処理100本ノック 2015年版 (90-95)

前回90番のプログラムを載せ忘れていたのでまずはそこから。 #!/usr/bin/env python from gensim.models import word2vec data = word2vec.Text8Corpus('80.txt') model = word2vec.Word2Vec(data, size=300) voc=model.vocab.keys() if __name__ == "__main…

イラストで学ぶ機械学習

イラストで学ぶ 機械学習 最小二乗法による識別モデル学習を中心に (KS情報科学専門書) 期待していたのとちょっと違いました。 「機械学習に関するイラストが豊富に載っている」のではなくて、「RPGツクール以下の謎疑似ファンタジー風イラストが大量の数式…

本日の聞き間違い

カナダ人がアップルーボウ(林檎弓)と言ってきたので書いてもらったらapproval(賛成)だった。アプローバルじゃないんだ……。