読者です 読者をやめる 読者になる 読者になる

外套とdoyagao

短剣は銃刀法に触れるので、ドヤ顔で

ザックリと振り返る、はてな匿名ダイアリー(増田)のこれまで

よ、仕事納まったか?紅白始まったな。
「刺身の上にタンポポをのせる仕事」が予測変換できて驚いたのでこのへん適当に流すが、
ヒマじゃないのに暇な時間という不思議な状態に何度かなったので、ちょっとデータをとってた。

で、今年を振り返る前に、まずは「はてな匿名ダイアリー(以後、増田と呼ぶ)」を振り返っておこうと思う。
(帰無仮説とか信頼区間とか小難しいことは言わずに、グラフでザックリとね)

まずは増田ザックリ振り返り

まず、増田の投稿数を振り返ってみよう。
f:id:dyg:20141231210332p:plain
図1. 増田投稿数推移(月次データ)

月別集計は日数が異なるので微妙な区分けではあるんだが、まあ観て欲しい。
誕生日である2006年9月24日~2014年12月10日までのデータだ。
一見して判る通り、産声を上げてから急増し、2008年に一度目の急落を起こした後、復帰するも順調に減少を続け、何故か2013年から一転して増加に転じている。(2010年の7月と8月は、アタックのせいで急増している。典型例が2010年07月20日の916投稿。自動投稿ツールの遊び場にされている)

これ実は、はてなブックマークの歴史と重なる部分が多いのだ。
f:id:dyg:20141231205915p:plain
図2. 増田投稿数推移(年次データ)

年次で投稿数を見てやると顕著だが、2009年を頂点として、2012年には半減している。絶対数としての書き込み投稿数が減っているのだ。これが、2014年12月半ばには、既に2009年を抜いている。
二軸としてはてブ率(全体の投稿に対して、ブックマークが一つでも付いた増田をエントリー数と置いて、その比率)を付けてみている。

f:id:dyg:20141231205917p:plain
図3. 増田のエントリー数と総ブクマ数推移

図3は、増田エントリー数(ブックマークが1つでもついた増田)の年次推移になる。グラフを重ねたかったので、2軸にブクマ総数を折れ線でつけてみている。
増田エントリー数は、2008年を頂点としてなだらかに減り、2013年から急増していることが判るだろう。また、ブックマーク総数が2008年のリニューアル以後、ほぼほぼ投稿数と比例関係で動いていたが、2013年からブーストされていることも判る。

ちょっとはてなブックマーク全体の話

f:id:dyg:20141231205923p:plain
図4. 月次hotentry総ブックマーク数

ここで、はてなブックマークの月次hotentry総ブックマーク数データをみてみよう。hotentryは毎日50個が載る、いわばその日の殿堂入りのデータだ。(htmlで取得してやるとなぜか最下位が取れないのだが、まあ大勢に影響は無しとしてまとめている)
増田とは逆に順調に成長し、2012年の1月に頂点を極めるが、ここで重要なのは2013年の急落部分だ。
非常に重要なので、この部分を拡大してみよう。
f:id:dyg:20141231205928p:plain
図5. 日次hotentry総ブックマーク数(2012-10-1~2013-9-30)

2013年1月7日が3万超えで、それ以前も基本的に3万前後を超えている。
2013年1月10日の1万5千ブクマになり、以後同じように推移している。
思い出す人も居るだろうが、2013年1月8日は、はてなブックマークリニューアルの日だ。この日はまだ新しいホットエントリーとしては機能しておらず、実質的に機能しだしたのは1月9日から。この日は、はてなブックマークのリニューアルが改悪だとして盛り上がり、2万のブックマークを集めている。
単純計算で、3万/日x30日=90万 vs 1.5万/日x30日=45万。月次のデータもそれを裏付ける。

このリニューアル後の総ブックマーク数の急減は、失敗だと思うだろうか?実は意図的なものだ。
このグラフにも現れる、http://b.hatena.ne.jp/hotentry/20121206が典型例になるが、「まとめ」やそれ以外にも、3000超えの大御所が君臨している。これをはてな運営は問題視していた。
非常に重要なインタビューが現在も残っているのでITmediaに感謝しながらリンクを貼りたい。
ユーザーの反応に「完全に狼狽した」 はてなブックマーク、リニューアルの意図と背景 (1/2) - ITmedia ニュース

従来のホットエントリーは、ユーザーが作る「聖域」のような扱いで、ブックマーク数が多いものを順番に並べる素朴なアルゴリズムを採用していたが、上位の記事には、英語学習法のハウツーなど「ライフハック系」と呼ばれる記事が極端に多いなど、偏りも指摘されていた。
(中略)
リニューアルでは、「ツールのポータル」という見方からいったん離れ、「メディア」としてのはてブの魅力を高めることを意識した。

つまりだ、はてな運営は、はてなブックマークdiggdel.icio.usといったソーシャルブックマークとしてではなく、はてブユーザーを使ってキュレーションするメディアサイトにしたいと指向していたわけだ。そうすると、はてなブックマーク数が多いものや、アクセス数でソートしていては具合が悪い。いつ観ても同じ奴ばっかり上位を占めてんな、では、ランキングとして意味はあっても、多くの人が毎日訪れるサイトにはなりづらい。ユーザーの聖域に手を入れて、運営が調整可能な「メディア」にしたかったわけだ。

表1. はてなブックマークリニューアル前後hotentry基本統計量

Before After
平均 22965.74 15783.82
中央値 (メジアン 21660 15537
最頻値 (モード) 10356 16311
標準偏差 9822.89 2310.65
最小 5999 10490
最大 73064 30877
標本数 2295 703

結果、1日のホットエントリー平均は、2万3千から1万6千へと下がり、最頻値が平均に近づいた。標準偏差からも読み取れるように、バラつきが小さくなっている。最大値が下がり、最小値が上がった。
例えて言うなれば、富裕層からの所得移転が起きたわけだ。つまり、はてブ格差が是正された。
(俺は増田しか興味が無いので2006年9月24日からしか取っていないが、はてなブックマーク創建から確認すれば他にもポイントはあるだろう)

全体を踏まえて、増田エントリーの振り返り

f:id:dyg:20141231205931p:plain
図6. 増田エントリー数のカテゴリ別推移

さて、増田に戻ろう。エントリーのカテゴリ別推移だ。本来はさっきちょこっと出した積み上げ棒グラフが良いんだろうが、まあ論文じゃないしわかりやすさ重視で折れ線グラフにしている。category-lifeが常に多く、2012年を底に大きく躍進しているのが判るだろう。

f:id:dyg:20141231205935p:plain
図7. 総ブクマ数のカテゴリ別推移

そう代わり映えはしないのだが、さっきのがエントリーに載った本数で、こっちはブクマ総数だ。2008年まではエントリー数に比べてブックマークがさほどついていない、というのは傾向として読み取れる。この2008年まで、2012年までというのは、はてなブックマークリニューアルの時期と奇妙なほどに一致する。というか、モロに影響をうけている。

雑なまとめ

さて、駆け足にはなったが、はてな匿名ダイアリー(増田)は、はてなブックマークに大きく影響を受けているというのはわかっただろう。
んなもん、説明されんでも判るわ!とか言われそうだがまあ落ち着いてくれ。
俺が言いたかったのは、はてなブックマークのサイトは、単なるはてなユーザーソーシャルブックマークの積み重ねというわけではなく、はてな運営が調整している結果生み出されているということだ。
特に、はてな匿名ダイアリーに関して言えば、リニューアル前はほぼ終焉に向かいつつある、安定した末期症状といえた。これを救い、「自分のブログは読まれないが、増田なら読んでもらえる」という面白い状況を創りだしたのは、間違いなくはてな運営だ。
今回は、はてな匿名ダイアリー(増田)は、はてなブックマークに大きな影響を受けていることを(因果関係や有意さを示すのは面倒なので)ザックリとグラフで振り返ってみた。
次回は、少し横道にそれて、はてなブックマークトリビアだ!
間に合うのか振り返り!