伊藤直也さんの講演@ソーシャルブックマーク(SBM)研究会

20081206(Sat.)1410-1512


メモ量が多めでとりとめなくなっています.すみません.


伊藤直也さんははてブの方。今日のメイン発表の一つです。

  • はてなブックマーク2の説明
    • 運営と技術の両サイドを話すつもり
    • はてブの統計
      • 3MUU/月 (UU: Unique Users) by Google Analyticsのセッション数
      • 0.2M Accounts(最近やっとこうなった)
      • 国内サイトでははてブの一人勝ち(だいたい7〜8割くらい),2ndはlivedoor, 3rdはdel.cio.us,他にyahoo, choix, fc2, buzzurl
      • 国外だとdiggやdel.cio.usが大きくなる
      • 男性62%, 女性38%
      • 20-30代が大きい
      • 女性に限ると25−29歳が多い(3割)
      • はてなはIT系は多いけどダントツというわけではないよ,という主張
    • リニューアル直後の傾向
      • ユーザ純増数: 300人/日 -> 400人/日 くらいになっている
      • 利用回数はリニューアル後上がっている3.1UUくらい
      • お気に入りユーザ数が少し上がっている
      • 広告収益がある特定の広告(Googleと連携した自動広告など)が3倍になった
    • 目標 in 半年
      • No. Users 0.2M -> 0.3M
      • No. UU 3M -> 6M
    • リニューアル理由
      • システム的な理由(検索, テキスト分類, お気に入り機能などの追加)
      • 旧サービスのイメージを受け継ぎつつ新しい機能の導入
      • Preferred Infrastructureさん(PFI)との提携
        • 懇親会で太田さんとも話したけど,しっかりした方でした.
        • Sedueを利用
        • Compressed Suffix Arrays
      • メディア,コミュニティ,機能の3軸
      • 衆愚問題への対応
      • コミュニティは分散するべき
      • twitter, mixi, facebookのSocial Graphを取り込みたい
      • 検索,機械学習を導入
      • tf・ifd+はてブメタデータ(時間・誰など)+多数のヒューリスティクス
  • 今後
    • 精度向上
      • 誰が何ををフィードバック
      • you mean 機能
    • ブックマーク->Web->非Webの世界へ
  • テキスト分類
    • Complement Naive Bayes
      • SVMと同等の精度,実装が簡単
    • Cosine Similarity (Pearson相関係数)
    • 前回の東工大さんの発表と似たようなもの
      • タグの類似度は精度が高い
    • ブックマーク数だけの評価の限界
    • テキストを扱う企業なのでそこに踏み込み
  • 今後
  • 感想
    • まだ私は処理が早くなった以外のリニューアルの体感をしていないので,もう少しいろいろと試して差を理解したいと思う
    • 技術的に思ってたよりすごいっす.結構納得性の高いものをセンス良く盛り込んでいるみたい
  • QA
    • Q(東工大の方): タコつぼ化対策で,問題ない人がフィルタリングされる心配はないか?
      • A: 今のところ納得性の高い感じ
    • Q: テキスト参照はどこまでやっている
      • A: 本文を対象としているがキーワードははてなダイアリーに絞っていた. キーワードには改善の余地はあり。
    • Q: ランキングアルゴリズムの多様化はある
      • A: リテラシーの高い人のみ向けになりそうだったり、あるべき論として、ユーザが楽な検索になるべきと思っている
    • Q(id: kirara397さん): 出力画面のチューニング
      • A: 今のところ考えていない. しばらくはgreasemonkeyでやっているものを利用して下さい
    • Q: お気に入りの使われ方の傾向
      • A: active user数が増えた.ビジュアライズすることでpositiveにまわっている
    • Q: キーワードに関する工夫
      • A: 特にすごい工夫をしていない
    • Q: Usersの伸びと,コスト
      • A: その点ははてなは強いので大丈夫と思っている.特に既存機能とは切り分けているので,既存機能に悪影響を与えることはない.