このページは、新しいURLへ移転します。 移転理由は、ヤフージオシティーズの無料ホームページスペースの廃止通告が一方的なされたためです。 自分が死んでからも、ウェブページが存続するようにと、わざと、 無料ホームページスペースを使用していたのです。
新しいURLは、内容はほぼ同じですが、デザインをきちんとしましたので、遥かに読みやすいです



ページランクの定義式
背景色をお選びください
ページランク算出理論
現実のページランクについて
グーグルの順位決定方法
その他

(1)ページランク定義式(出所:論文 HTML版)

PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))

@PR(A)は、ページランクの計算対象のウェブページAのページランクです。
APR(T1)〜PR(Tn) は、AページにリンクしているTページのページランクです。たとえば、Aページに5つのページがリンクしていれば、それぞれT1からT5の各ページを意味します。
BC(T1)〜C(Tn)は、リンク元であるTnページに含まれる他のウェブページへのリンク数の総数を意味します。
Cパラメーターdは、
ダンピングファクターの略です。上記論文では、通常0.85に設定する旨明記しています。

(2)ページランク定義式(厳密な定義式。出所:英文Wikipediaのページランク解説ページ)

なお、単なる表記方法の差にすぎませんが、定義式として次のように表記される場合もあります。(図の出所:英文の同Wikipedia)

 

@N は、グーグルがページランクの計算対象とする全てのウェブサイトの数です。
A1-d/N となっているのは、ページランクは総和が1になるように計算されるからです。上記(1)の定義式で反復計算して、総和が1になるように計算されるのです。

(3)注意点(勘違いされやすい点)

@ページランクを意図的に上げようとされるご努力をされている場合について、分かりやすく端的に言えば、リンク相手方のトップページのページランクは、無関係であり、外部ウェブサイトとリンク関係にある相手方のリンク元ページ(ウェブサイト中のリンク専用ページ)のページランクのみが、計算対象です。

A内部リンクの扱いについては上記特許文書にて、A modification to avoid drawing unwarranted attention to pages with artificially inflated relevance is to ignore local links between documents and only consider links between separate domains.

意訳:意図的に増加させた内部リンク(=関連)によって、ウェブページへ不当な関心を引き寄せることを防ぐ修正(方法)は、ウェブサイト内の内部リンクを無視し、別々のドメイン間のリンクのみを(ページランク計算対象として)考慮することである。

と明記しており、ページランク計算上は、無視されていると考えざるをえません。逆に言えば、ウェブサイト内で、内部リンク関係に基づき、ページランクが、比喩的に言えば、再配分されていると考えざるをえません。ページランクの計算方法の原理の例をご参照。

B上記の定義式は、あくまで単なる定義にすぎません。実際の算出には、他の重要な要素が加味されています。現実のページランク算出に際して考慮される諸要素を参照ください。

Cいわゆるリンクファームの場合のぺナルティー(インデックスされない)は、ページランク算出と無関係です。(リンクファームとしてぺナルティーが課される前は、ぺージランク算出との関係では、パラメーター d が相当低い数値であろうという推測が成立するだけです。)

(5) ページランクの定義式の原文引用

上記の引用と同じく文字化けしているかもしれませんが、以下に、同論文の該当箇所の英語の原文(HTML版)を引用します。
(このウェブサイトのエンコーダは、全てShift-Jisに設定していますので、ブラウザによっては、いずれの英文の引用も、ひどい文字化けをきたしているかもしれませんので、その場合には、上記のリンク先を参照ください。)

Cited from [The Anatomy of a Large-Scale Hypertextual Web Search Engine]

2.1.1 Description of PageRank Calculation

Academic citation literature has been applied to the web, largely by counting citations or backlinks to a given page. This gives some approximation of a page's importance or quality. PageRank extends this idea by not counting links from all pages equally, and by normalizing by the number of links on a page. PageRank is defined as follows:

We assume page A has pages T1...Tn which point to it (i.e., are citations). The parameter d is a damping factor which can be set between 0 and 1. We usually set d to 0.85. There are more details about d in the next section. Also C(A) is defined as the number of links going out of page A. The PageRank of a page A is given as follows:

PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))

Note that the PageRanks form a probability distribution over web pages, so the sum of all web pages' PageRanks will be one.

PageRank or PR(A) can be calculated using a simple iterative algorithm, and corresponds to the principal eigenvector of the normalized link matrix of the web. Also, a PageRank for 26 million web pages can be computed in a few hours on a medium size workstation. There are many other details which are beyond the scope of this paper.

 

参考 

リンクファームとは?
日本語では、「多数の相互リンクを意味する」と誤解されている場合も多いようですが、英文のWikipedia にもあるとおり、リンクファーム内部において、参加しているウェブサイト全てが完全に相互リンクしているウェブ上のグループを意味し、ほとんどの場合には、自動プログラムによって運用されています。
(英文ウェブサイトのリンクファームの場合、圧倒的多数は、リンク自体が、サイト訪問者へ分からないように完全に隠されていますが、まれにトップページ間の通常の相互リンク形式による場合があり、この場合には、完全なスパムとはいえないでしょう。いずれにしろ、通常の相互リンクと異なるのは、参加者相互が、完全に相互リンクしている点です。)

日本語ウェブサイトのリンクファームの実情を知りたい方は、http://ameblo.jp/at-seek/ を参照ください。(あえて、リンクしていません。)

なお、現在は、このリンクファームは、グーグルによって、参加者への重大なぺナルティーが課されたたため閉鎖されています。圧縮したリンクテキストをページに貼り付け、一挙に極めて多数の相互リンク(数千件)を得ることができるという内容だったようです。