Google PageRank Algorithm
今のGoogle SearchのScoringにどのくらいの大きさで影響を持っているかは不明ではあるが,Googleを有名にしたアルゴリズムであることには間違いないですね.
収束性まで理解するのは少し数遊びに強くないといけませんが,scaleを気にしないcodingは容易です.単に繰り返しAdjancy Matrix(隣接行列)を収束するまで累乗していくだけです.
しかし,Scaleのためには幾つか大事な点があります.
- Adjancy Matrixの要素が,疎であること(ゼロが多いこと)を利用してデータとしてフルマトリックスで持たないこと
- 行列計算を公平にしないこと
- 各行や各列ごとに要素の更新頻度の違いを見て,行列計算の更新頻度を行や列ごとに変えます
- Googleさんお得意の分散処理
PageRankの簡単に勉強するなら,
にある資料も良いかも知れませんが,何といっても今は
が一番分かりやすいです.
やその前後のエントリでは,実践しています.私はまだラプラシアンのところが勉強不足ですが、、、
また
に紹介された本を買ってみました.
Google's Pagerank and Beyond: The Science of Search Engine Rankings
- 作者: Amy N. Langville,Carl D. Meyer
- 出版社/メーカー: Princeton Univ Pr
- 発売日: 2006/07/03
- メディア: ハードカバー
- 購入: 6人 クリック: 50回
- この商品を含むブログ (11件) を見る
まだ全部読んだわけではありませんが眺めたところ,学部生のゼミレベルでも何とかいけるくらいで書いてあるように見えます.この辺をちゃんと吸収したい人には非常におススメです.
それとAmazon.co.jpはローソンで受け取れることを最近に初めて知りました.私にとっては便利です.