«前の日記(2009-08-18 (火)) 最新 次の日記(2009-09-03 (木))»  

まちゅダイアリー


2009-08-21 (金)

Twitter で following / followers の比(ウェルチ数?)を対数グラフにしてみた

Twitter での、フォローしている人の数 (following) とフォローされている人の数 (followers) の比率ってどれくらいなんだろうと、ふと気になった。 Web で調べたら、以下のような記事を発見した。

有名人のTwitterフォロー数などは、この1万人に1人というケースが多い。

フォローされている人数をフォローしている人で割った数が、世界で一番多い人は、元GE会長のジャック・ウェルチだ。

フォロー数は、たったの9人でトップ。「ウェルチのフォロー数」は、1:18,835人  

約2万人から1人が選ばれていることとなる。

そこで、フォロワー÷フォロー数=フォローの価値としてこれらを、ここで「ウェルチ数」と名付けてみた。

試しに、自分がフォローしている684人に対して、この following / follower 比率をグラフ化してみた。 x軸はフォローしている人とフォローされている人の比率の対数。 0だとフォロー数=フォロワー数になる。1だとフォローしている人の10倍の人からフォローされていて、2だと100倍、3だと1000倍…となる。 x軸の値を0.1刻みで集計し、合計人数をy軸にプロットしている。 結果は以下のグラフ。綺麗に0を中心とした左右対称のグラフになっている。

ちなみに、4を越えているのは @mainichijpedit 。following が 6人で followers が 80,357人。 有名なアカウントの人は、だいたい1~2の間くらい。

follow / follower graph

念のために断っておくけど、(有名な人は値が大きくなる傾向になるが)別に値が大きければいいと主張するつもりはない。 自分の好きな人だけを follow できるのが Twitter のいいところだから。 twitterで7000人にフォローされる方法。あるいはtwitterスパム注意報という、意図的に follower を大きく見せる話もあるしね。

集計は Ruby でさくっとスクリプトを書いた。 実行すると friends.txt に following-follower 比と Twitter アカウント名の一覧を出力し、 data.csv にグラフの元データとなる CSV データを出力する。 friends.txt はソートされていないので

sort -n friends.txt

と自分でソートする必要がある。 また、自分の follower 一覧を取得するのに Twitter API を使っている。 1回の呼び出しで100件しか取得できないので、例えば1000人をフォローしている人は API 制限 (150回/hour) を10回分消費することになるので注意。

参考

follow、被followの比率を円グラフで表示という記事があった。 こっちも面白そう。

ソース

Tags: twitter