外套とdoyagao

短剣は銃刀法に触れるので、ドヤ顔で

データで振り返る2014年のはてな匿名ダイアリー(増田)

さて、仕事始まったかな?
特に正月が忙しかったんだコッチは!な皆さん、お疲れ様です。
はてな匿名ダイアリー(以後、増田と呼ぶ)は、時流に乗せるのがコツの一つでもあるので、番組改編期のような凪の時にはエントリしずらいのが特徴ではあるので、少しこっちに記事を上げておこうと思う。
テクニカルなエクスキューズで恐縮だが、興味が無い人には何の意味もないので、検索で流れ着いた人は「はー、こんな世界もあるんだなあ」くらいに呆然として頂ければ幸いで御座います。

さて、昨年末に増田の総体としての振り返りをして、増田は「はてなブックマーク」、つまりは「はてな運営」に多大な影響を受けるという話をした。次は、2014年の増田を振り返ろうと思う。*1

2014年の増田概況

今回は、2014年の増田の総ブックマーク数から振り返ってみよう。
f:id:dyg:20150107211823p:plain
図1. 増田総ブックマーク数

あいも変わらず月別集計だが、細かい部分はどうせ誤差がでるので、まあ観て欲しい。
2014年1月1日~2014年12月31日までのデータだ。
一見して判る通り、1月から順調にブクマ数を伸ばし、8月に急落し安定する。*2
ワリと判りやすいのだが、まあブクマ数が落ちてるとは言っても、投稿数も落ちてるんでしょ奥さん、とか思うだろ。
しかしそうでもない。
f:id:dyg:20150107211822p:plain
図2. 増田の投稿総数と総ブックマーク数

投稿総数とブクマ総数のグラフを重ねてみよう。
ここでのポイントは、8月、9月の段階的な投稿数減少だ。7月末(単なるカンだが、7月25日あたり)を境に、突如としてブクマ数が減っているが、投稿総数は急には減っていない。
つまり、投稿総数が減ったからブクマ総数が減ったのではなく、ブクマが伸びにくくなったから投稿者が離れていったのではないかと推測できるわけだ。11月から投稿総数が戻しているのもポイントになる。5月に減ってるのも気になるけど、ちょっと理由不明。
f:id:dyg:20150107211821p:plain
図3. 増田の総投稿数とエントリーあたりのブクマ数推移

こっちは、月別の投稿数と、1エントリーあたりのブクマ数*3のグラフだ。
自分でもグラフにして驚いたんだが、結構センシティブに動いてるぞ増田諸君。君ら敏感だな。
1エントリーあたりのブックマーク数が伸びれば投稿数が伸び、減れば減るという、まあ「増田人気だそれ書けやれ書け、いまいち乗らないぞ撤退だ」な感じ。
6月を頂点として9月まで減り、その後10月から戻してきている。投稿総数は遅行指数と言っても良いかもしれない。増田の「景気」が良くなれば増え、悪くなれば減るわけだ。

なにがあったのか?

7月末になにかあったかな、とザーッと投稿を見ていくと、どうやら粘着さんが垢BANされてたようだ。
匿名ダイアリーの記事への不自然なブックマークに対する通報 - はてな情報削除・発信者情報開示関連事例 - 機能変更、お知らせなど
ドンピシャで7月25日なんだが、1人が執拗に攻撃していた事でこんなに影響を受けるってのはチョット無理筋だ。(8月は4000程度投稿数が減っているので、130記事/日も1人で書くか?という話)
で、なんかないかなーとプレスリリースを観に行くと、「BrandSafeはてな」が、8月19日付けで発表されている。
はてな、フリークアウトとアドベリフィケーション機能「BrandSafe はてな」を共同開発。DSP「FreakOut」に搭載し、広告主のブランド保護に貢献 - プレスリリース - 株式会社はてな
どーも、こいつのテスト場として増田を使ったのじゃないかな、と予想する。7月25日頃から3週間データ取りして、満を持して発表という予感。ちょっと発表内容の方向性と増田とが一致していないので直接は利用されて無いとは思うのだが、他に思い当たることがない。(いくつか検証の方法は思いつくものの、力押ししか思いつかないので棚上げ中)

増田あれこれ2014

まあ、全体像としては7月末にまたなんか運営がやったね、結構増田影響受けやすいね、9月が増田景気の底だったね、程度の話になるので、後は個別にデータを観ていこう。

カテゴリ別の話

f:id:dyg:20150107211827p:plain
図4. 増田カテゴリ別投稿数

さっきの全体像でエントリー数に触れていないのにはワケがあって、セルフブックマーク(セルクマ)であっても数に入っちゃうから、あんまり意味のあるデータにならないからだ。が、カテゴリ別で見ようとするとブクマされてなきゃ分類もクソもないので、そこには目をつぶって観てみよう。
あいかわらずlifeが常にトップ独走、itがだいぶ離れての2位堅持。意外にsocialが頑張っているが、データ云々言えるほど絶対数が多くないので、まあ誤差の範囲内の上下動しか無い。*4
こうしてみると、総ブックマーク数を7月末に急落させたというよりも、バブルを沈静化させたという言い方のほうが適切だったかもしれない。
f:id:dyg:20150107211826p:plain
図5. 増田カテゴリ別ブックマーク数

エントリー数と比較して、8月9月のブックマーク数は、無理やり押さえつけている感じだ。
7月の増え方は、まあ、たぶん「はてブオフ会」の影響で増田にはけ口を求めた人が多かったんだろうと思う。(このへん詳細な分析をやっても良いのだが、たぶんゲンナリするだけなのでやらない。件名だけでお腹いっぱいです)

投稿時間に観る増田生活リズム

f:id:dyg:20150107211825p:plain
図6. 増田投稿時間別エントリー数

ちょっと面白いデータを観てみよう。投稿時間別のデータだ。*5
5時が投稿数の底で、徐々に増えていき、10時から一気に増える。以後12時の山、17時の山があり、22時に一挙に増え、1時から急減する。
だいたいみんな、0時には寝て、10時には通勤通学を終えるんだろうな、という感じ。意外に着実に生活している。
1エントリーあたりのブクマ数を観ると、3時が如実に低く、5時、14時、23時にピークがある。まあグラフで観るほどは面白く無いので、ちょっとしたトリビアでしかない。どの時間帯でもブックマーク数は伸びる時は伸びる。

実は、2014年の12月中旬に取ったデータだと、火曜日を頂点として土曜日に向かって投稿数がはっきりと減る面白データだったのだが、年末怒涛の追い上げで平均的に落ち着いてしまったので割愛。

はてブ数の敷居に観る増田

f:id:dyg:20150107211824p:plain
図7. はてブヒストグラム(1~20まで)

まずは1はてブが大きな壁になる。意外なことに3ブクマが最も多く、急激に減っていき10からなだらかに落ちていく。10以下が全体の32.18%を占め、このグラフに現れている20までで全体の49.39%となっている。中央値は21であり、平均が70、最頻値は当然3だ。中央値の半分未満が「貧困」と呼ばれるのであれば、相対的な基準として増田で10を超えることが一つのステップになるだろう。21以上ならはてブが付けられた選ばれし増田のうち、更に半分より上だ。

まとめ

2014年は、7月末に「何か」があり、増田の総はてブ数が半減した。これが10月からは改善されて、徐々に増田に人が戻ってきているという状況。*6
バブルを引き締めてるような気がしなくもないので、1エントリーあたりの投稿数を「はてブ政策金利」みたいな指標として用いるとモデル構築できるような気もするがきっとそんな卒論が通る大学は無いので無駄なデータだあな。
意外にもみんなまともな生活を送っている(逆に言えば、活動時間帯に増田に投稿してる)のがわかる。相変わらず10ブクマが大きな壁であり、21を超えれば上位層への仲間入りだ。
これ以上はエントリの中身を観て話をしないといけなくなるので、データで振り返る増田としてはこんな感じ。
予想していたよりも「はてな運営」が増田を調整する力は強いようだ。また、増田への投稿者もブックマーク数を気にしているみたい。うーん、意外に増田も世知辛いね。
といったところで今回は別にオチもないのでこんなところで!

*1:痛恨の極みなんだが、2015年になってからデータを拾い直したので、かなり「整理」されてしまっている。12月中旬に取った時と投稿総数で-6000とおよそ-17/日が消えてる。再現性を尊重して整理後の値を用いている

*2:元々「なんかお盆辺りから急に伸びねぇぞなんだこれ。お、10月頭で戻った」と運営担当者に変更でもあったんかいなとデータを取ろうと思ったのがきっかけ

*3:はてブにページが作られた(1ブックマークでもついた)ものをエントリーと呼び、総ブクマ数をエントリー数で割った値

*4:カテゴリは後で変更されることが少ないように思うので、自動分類の精度が出てると推測

*5:ただし、エントリー数データなので、ブクマされているという偏りはある

*6:大きな傾向は変わらないものの、2014年12月中旬に取ったデータと、2015年1月初旬に取ったデータに随分差がある。年末棚卸し的な大整理かな……