非負値行列因子分解(NMF) - ぐうたらした日記

オライリー「集合知プログラミング」で特徴抽出の解説があり面白そうなので試してみた。
Pythonはご遠慮したいので.NETかJavaかなのだけど、最近はやりの言語なのに行列演算を扱えるライブラリは標準装備されてないのねぇ。。
Java+JAMAを使ってみた。

上記のA〜E君5人のそれぞれ4教科のテストの点数の表を行列に変換してNMFを行う。
特徴数は2、繰り返し数は5000回で実行。

特徴の行列の計算結果は、

特徴	国語	数学	理科	社会
特徴1	7.7	78.2	71.5	15.9
特徴2	98.7	1.5	10.4	89.7

次に重み行列の計算結果は、

特徴の行列から、特徴１が理系型、特徴２が文系型と読める。
重みの行列から、
A君は特徴１と特徴２を同じくらいもっているので平均型。
B君は特徴２に偏っているので文系型。
C君、D君も同じく文系型。
E君は特徴１に偏っているので理系型。

と、いう分析でいいんじゃろか。。
もっと面白い例ないかなぁ。