ページ内ジャンプ:

アレゲなニュースと雑談サイト

mhattaによる 2007年12月12日 8時00分の掲載
ネカマがばれる?部門より。

Anonymous Coward曰く、

ITproの記事によると、リクルートの子会社であるブログウォッチャーは、2008年2月を目処に「プロファイルパスポート」というシステムを立ち上げるそうだ。
東工大の奥村学・准教授の研究をベースにした独自技術で、ブログやSNSといった消費者発信型メディア(CGM)に書き込まれた文章を分析し、書き手の属性や行動パターンを判定。これをプロファイルパスポートに反映させ、書き手に合った広告を配信するという仕組みらしい。「おいしい」「まずい」という言葉の使用から評判の良し悪しを判定したりできるそうだが、タレコミ子が気になったのは、「文体から書き手の性別を90%以上の精度で自動判定できる」というところ。性別によってよく使う言葉、使わない言葉があるということだが、自分が異性だと判定されたらちょっとショックかも。

関連ストーリー

ブログの死亡率 56 コメント
マス化する2ch 100 コメント
この議論は賞味期限が過ぎたので、保存されている。 新たにコメントを書くことはできない。
表示オプション しきい値:
  • 3~4年前くらいに、メール文面を入力するとその文章の要点を抽出したり、書き手が送り手にどういう印象を持っているかを判断してくれるジョーク交じりのcgiプログラムがあったように記憶しています。
    調べてみてらほとんど情報が残っていなくて、携帯用のアプリで似たような仕組みの有料サービスがあるぐらいのようですが……。

    当時は友人同士で面白がって使っていたんですが、時代が変わると商材になるんですね(もちろん、分析の精度とかは段違いなのでしょうけど)。
  • Anonymous Coward : 2007年12月12日 8時23分 (#1264265)
    ではまず、土佐日記を試してみましょう。
  • つまり (スコア:2, すばらしい洞察)

    ofl (28734) : 2007年12月12日 8時18分 (#1264263)
    ネカマ判定装置?
    • ネトゲに実装して欲しいよねぇ。

      #性別の違う複数のネトゲのアカウントを持ってる人間を知ってるのでID
      • Re:つまり (スコア:3, 興味深い)

        raf (9322) : 2007年12月12日 16時15分 (#1264599) 日記
        まったくだ。
        ネカマやってたわけでも無いのにオフに行ったら、
        「お前男だったのか!!!」と、言われたこと多数。。。。。

        まー、どんなところで女だと思ったのかを聞いてみたところ、
        言葉遣いよりもその人の反応する話題で見当つけるみたいですね。

        ファッションやらスイーツ(笑)やらの話題に
        それなりに応対してるとそれだけで間違えられるみたいです。
        普通に生活してたらなんとなく耳目に入ってくる程度の情報で
        適当に応対してるだけなんですけどね。(・・
        --
        -- 星を目指さない理由は何もない -- 「MISSING GATE」by 米村孝一郎
      • 2個のコメント が現在のしきい値以下です。
    • Re:つまり (スコア:2, おもしろおかしい)

      Anonymous Coward : 2007年12月12日 10時10分 (#1264330)
      馬鹿、逆だ。
      普段読んでる小気味よくてサバサバしたBlogを、実は綺麗なおねーさんが書いてたりしたら色々とワクテカするだろ!

      # 次は、綺麗かどうかを判別する技術が必要だな
    • Re:つまり (スコア:2, おもしろおかしい)

      Pravda (33859) : 2007年12月12日 12時09分 (#1264429) 日記
      ネカマ判定装置?

      こういう技術が一般化すると、今度はネカマ支援ツールが出てきたりして。

      文中で「素敵な装身具」と書いたりすると、
      ツール「この箇所は『かわいいアクセサリー』と言い換えるべきです」
      ネカマ男「おおそうか、なるほどね」

      #「リボンの騎士」のサファイア[王子|姫]はどんな文章を書くのだろう?

    • 1個のコメント が現在のしきい値以下です。
  • Anonymous Coward : 2007年12月12日 19時06分 (#1264703)
    発信者の文体を分析して発信者に合った広告を……どこに載せるの?
    トラックバックspamかなぁ……
  • Anonymous Coward : 2007年12月12日 8時15分 (#1264259)
    つまり常に男と判定すればOK

    # 要はblogの9割ってspamじゃないだろうかと
  •  絵文字使いまくりの中高生のケータイブログとか、2ch文化にどっぷり浸ったネット中毒者のブログとかになるともはや文法すら一般的な日本語と異なることもままありますが、そういうのはどこまで判別できるんだろう?

    #そういう連中はそもそもターゲットではないのかもしれないが……。
    --

    //ソリッドファイター完全版 [fukkan.com]復刊賛同者募集中/

  • いかつい顔をしてて、筋肉質で、みるからに武道派な人でも、
    実はかわいいものが大好きだったり、手芸が趣味だったり、
    ぬいぐるみサイト作ってたりするんです。
    会社で軍曹の異名を持つあの人だって、
    週末にはスイーツ食べ歩きしてるかもしれないし、
    携帯の待ち受けが子猫の写真だったりするかもしれないんです。

    そっとしておいてあげてください。

    #このコメントに特定のモデルはいません。多分。
  • メーラーにこの技術を実装して欲しいわね。

     ・本文の文体が女性っぽい && 本文に「○○○(卑猥な言葉)」が含まれる
       → Junk フォルダに移動
     ・本文の文体が女性っぽい && 本文に「食事」または「映画」が含まれる
       → 優先度を「最高」に設定
     ・本文の文体が男性っぽい && 本文に「飲み会」が含まれる
       → サーバから削除

    …みたいなメッセージフィルタが作れれば素敵。
    誰か Thunderbird の Add-on とか作ってくれないかしら?

    #特に意味もなく女性っぽい文体で書いてみたのでID
  • eoh (28525) : 2007年12月12日 8時34分 (#1264269) 日記
    良くある話です。
    そのうち、免疫がつきますよ、きっと。
    --
    言葉は刃物。使いようでどうにでもなるものさ。
  • geln12 (18637) : 2007年12月12日 8時41分 (#1264275) 日記
    それについては過去ストーリー「 偽論文判別プログラム」 [slashdot.jp]を参照。英語だけだけどね。
  • 直しました。多謝。
    --
    mhatta was here
  • yukichi (12361) : 2007年12月12日 8時54分 (#1264278)
    書き手の性別を判断しているわけじゃなくて、好き勝手に想像していることが多いんですよね。昔、
    1. 僕がある女性を(「わたし」と書いているにかかわらず)男性だと思い
    2. その女性が別の男性をずっと女性だと思っており
    3. まったく無関係なある女性が僕のことを女性だと思っていた

    なんてことがありました。

    # 別に三角関係とかじゃなくて
  • Re:男性ですが (スコア:1, おもしろおかしい)

    Anonymous Coward : 2007年12月12日 9時09分 (#1264283)
    描いてた絵で女性と思われてたことなら。
    昔からいわゆるショタ絵ばっかり描いてたせいか。
    最近では珍しくもないけどなー。
  • リアルで会うと言葉使いや、仕草や、挙動からおねえマン扱いされるんですが、
    どうしたらよいですか?
  • いやうずら [din.or.jp]とかだと判別つかないかも。

    # 中国語の部屋の問題が解けるのか(違います
  • yukichi (12361) : 2007年12月12日 13時32分 (#1264507)
    ちょっと意味が違うんだけど、コメントとかで言い争いになったときに「貴殿は」とか不要なまでに丁寧な敬語を使う人って、何を考えているのかと思う。対等に話したいときにそういう態度取られると、わざと距離取っているって思います。まあ、わざとやっているのか、そうでないのかわかりかねますが。
  • Anonymous Coward : 2007年12月12日 15時25分 (#1264571)
    >> #ITProの「性別は90%以上の性別で判別できる」に笑った。
    >45% は男性、残りの 45% は女性ということですねっ

    違う違う、「90%以上の性別」なんだから「性別」というカテゴリー分けには
    少なくとも10個のカテゴリーがある、ってコトだよ。

    単純な「男(異性愛)」と「女(異性愛)」で2個、
    「男(男性体のままの同性愛)」と「女(女性体のまま同性愛)」で2個、
    「男(女性体になって男性を愛したい)」と「女(男性体になって女性を愛したい)」で2個、
    「男(女性体になって女性を愛したい)」と「女(男性体になって男性を愛したい)」で2個、
    で、8つ。あと何だ?

     

    ああ、「こんな可愛い子が女なわけないじゃないですか」と
    「こんな凛々しい子が男な分けないじゃないですか」かな。
    これのうち、見分けるのが難しい「残り10%の性別」ってどれだろう?
  • 8個のコメント が現在のしきい値以下です。