クラスタリング係数
ある人の友人たちは、互いに友人同士でもある——この「友人の友人は友人」という傾向は、人間社会の直感的な常識だ。クラスタリング係数とは、この傾向を数値として厳密に表現する指標であり、ネットワークの局所的な密度を測る基本的な道具だ。
「友人の友人は友人」を測る
クラスタリング係数は0から1の値をとる。あるノードの隣接ノード全員が互いにつながっていれば係数は1で、誰ともつながっていなければ0だ。直感的には「友人グループの凝集度」を示すが、これは人間関係だけでなく、ウェブのリンク構造、タンパク質相互作用、空港路線網にも適用できる。
数学的には、あるノードvのクラスタリング係数は「vの隣接ノード間の実際のリンク数」を「可能な最大リンク数」で割った値として定義される。この単純な比率が、ネットワークのトポロジーについて驚くほど多くのことを語る。アルバート=ラズロ・バラバシは複雑ネットワークの中で、スケールフリーネットワークがランダムグラフより高いクラスタリング係数を持ちながら、平均距離は同程度に短いという一見矛盾した性質を持つことを実データで示した。
小世界性のもう一つの柱
ダンカン・ワッツとスティーブン・ストロガッツが1998年に定式化した小世界ネットワークの概念は、二つの要素から成り立つ。短い平均距離と、高いクラスタリング係数だ。前者だけなら完全にランダムなネットワークでも達成できる。しかしランダムネットワークはクラスタリング係数が低い——「友人の友人は友人」という傾向が弱い。現実のネットワークは、この二つを同時に満たすという点でランダムネットワークとも規則的格子とも異なる。
同型性という概念は、異なる領域の構造的な対応関係を記述するが、脳・生態系・言語・インターネットが同じ小世界的性質を示すことはまさに構造的な同型だ。クラスタリング係数という単一の指標が、これほど多様な系を横断して意味を持つのは、局所的な密度が普遍的な組織原理と結びついているからかもしれない。友愛数のような数論的な概念とは異なる文脈だが、「互いに関係し合うもの」の組み合わせ論的な豊かさという点では共鳴するものがある。
局所的密度と情報伝播の速度
クラスタリング係数は情報の伝播パターンに直接影響する。高いクラスタリングを持つネットワーク(密なコミュニティが多い)では、情報はコミュニティ内で素早く共有されるが、コミュニティを越えた伝播は遅い。低いクラスタリングでは逆の傾向が現れる。
社会学的には、この性質が「強い紐帯(密なコミュニティ)」と「弱い紐帯(橋渡し的関係)」のトレードオフとして現れる。マーク・グラノベッターが示したように、新しい情報や仕事の機会は弱い紐帯を通じて伝わることが多い——クラスタリング係数が高すぎると、コミュニティ内は結束しているが外部からの新しい情報が入りにくくなる。ネットワークの設計において、どの程度のクラスタリングが最適かは目的によって変わる問いだ。
凝集性と孤立のトレードオフ
クラスタリング係数の高さは、コミュニティの内的な信頼と協力を高める一方で、他のコミュニティとの断絶を生みうる。社会学者ロバート・パットナムが描いた「結束型社会関係資本」(ボンディング・ソーシャル・キャピタル)と「橋渡し型社会関係資本」(ブリッジング・ソーシャル・キャピタル)の区別は、クラスタリング係数の高低と深く対応する。
凝集したコミュニティは情報の深化に貢献するが、「エコーチェンバー」として同質的な情報しか循環させなくなるリスクも持つ。クラスタリング係数という指標は、こうした社会的・認識論的な問題を数値として可視化する手がかりを与えてくれる。ネットワークの局所的な密度を測ることは、社会的な凝集と孤立のダイナミクスを理解する入り口でもある。
この概念を扱う本
概念ネットワーク
線の太さは共通する本の数を表しています。ノードをクリックすると概念ページに移動します。
この概念を扱う本(1冊)
アルバート=ラズロ・バラバシ
本書では小世界ネットワークの二つの特徴のうちの一つとして導入される。スケールフリーネットワークはランダムグラフより高いクラスタリング係数を持ちながらも平均距離は短いという、一見矛盾した性質を持つことが実データで示される。