dh memoranda

徒然なるままに日暮らしブログに向かいて...

December 2004

ping server の仕様をちょっと変更

ping.bloggers.jp のグラフが、先日から伸びてきていますが、「ウェブリブログが対応!」とか「雑誌でブログ特集」という理由だけではないようです。夜の時間帯は、ちょっとパフォーマンスが落ちてきていることもあって、ちょっとだけ手をいれました。

  • 一部のURLを登録前に変換
    weblogUpdate.ping で送信する url はサイトの url のはずなのですが、いわゆる permalink が送信されるブログ・システム、サービスがいくつかあります。作者に連絡が取れたものについては、修正をお願いしたりしていますが、すべて連絡がとれたわけではないので、勝手ながら、こちらで受信時に変換するようにしてみました。心あたりのあるシステムの管理者の方は、ご修正いただきますよう、お願いいたします。
  • BBS からの大量 ping の掲載を一時的にフィルタリング
    ping.bloggers.jp の通常のメインページと changes.xml などから、BBS の更新情報とおぼしき更新情報の掲載をフィルタリングするようにしました。データは保持していますので、API のフィルタリングオプションを利用すれば、閲覧は可能にしています。
  • changes.xml, index.rdf を頻繁に取得するサイトへの送出制限
    changes.xml はデータを即時反映していますので、基本的には頻繁に取っていただいて構わないのですが、一部、度を超えていると思われる特定のサイト(5-10秒間隔で3600秒分の更新情報を取得するとか、ひたすら毎秒取得するとか...)について、一度に送信するデータの送出量や、送信間隔に制限を加えました。短期間に取得する場合は、last=N のオプションを設定して、取得するデータ量を取得間隔に合わせていただけると助かります。詳しくは、ping.bloggers.jp API をご覧ください。
    心あたりのあるシステム管理者の方は、ぜひ、節度ある取得をお願いいたします。

今後も継続した安定運用のため、皆様のご理解とご強力をお願いします。

ブロガーの平均寿命

InternetWeek2004 のなかで行われた日本UNIXユーザ会のセミナー「Web and Internet Applications Day」でパネリストをしてきました。

BB Watch

詳しいレポートは Broadband Watch をご覧いただくとして、ping.bloggers.jp のログを集計してみましたので、その中のネタからいくつかご紹介。集計は 2004年10月31日 までのデータを利用しています。

  • 平均寿命: 38.2日
    初めて ping したその時間から、最後に ping した時刻までの差を寿命とみたてて、各ブログごとに計算したときの平均値。寿命が1秒以上の全ブログの平均は 60.8日、中間値が 5.2日でした。現在も生存中のブログも、集計時点までを生存期間と見なしているため、実際はもっと大きい可能性が高いです。
  • 平均投稿間隔: 3.6日
    寿命が一秒以上のブログについての、寿命/投稿数の平均です。良く考えると「投稿数-1」が正しいような気がしますが、その場合だと 4.9 日まで伸びます。
  • 三日坊主率: 47%
    全ブログのうち、上記の寿命が 3日間以下のものの比率です。ちなみに、60日を超えたブログは25%です。

各種のレポートでも、比較的短期間で飽きてしまうユーザーが多数いることが報告されていますし、今回の集計結果はそれと同一の傾向を示していると思います。しかし、一旦はじめられたら、比較的継続していることが、上記の数字からも伺えます。