北野坂備忘録

主にインストールやプログラミングのメモを載せています。

2016-03-03から1日間の記事一覧

言語処理100本ノック 2015年版 (85-89)

(追記)このあたり見事にしくじってますが、後日リベンジしております。 kenichia.hatenablog.com 85. 主成分分析による次元圧縮 84で得られた単語文脈行列に対して,主成分分析を適用し,単語の意味ベクトルを300次元に圧縮せよ. 単語の意味ベクトルを300…

言語処理100本ノック 2015年版 (83,84)

83. 単語/文脈の頻度の計測 82の出力を利用し,以下の出現分布,および定数を求めよ. f(t,c): 単語tと文脈語cの共起回数 f(t,∗): 単語tの出現回数 f(∗,c): 文脈語cの出現回数 N: 単語と文脈語のペアの総出現回数 単語tと文脈語cの共起回数は、ソートをすれ…

言語処理100本ノック 2015年版 (80~82)

第9章: ベクトル空間法 (I) enwiki-20150112-400-r10-105752.txt.bz2は,2015年1月12日時点の英語のWikipedia記事のうち,約400語以上で構成される記事の中から,ランダムに1/10サンプリングした105,752記事のテキストをbzip2形式で圧縮したものである.この…