hylomによる
2008年11月21日 13時45分の掲載
リアルタイムで陰口が検出されるのもそれはそれで嫌だ、部門より。
リアルタイムで陰口が検出されるのもそれはそれで嫌だ、部門より。
あるAnonymous Coward 曰く、
富士通研究所が、「Web上の掲示板やブログ、SNSなどに書き込まれる企業や製品の風評情報をリアルタイムで検知する技術」を開発したそうだ(マイコミジャーナルの記事)。
記事を見る限り、クローラで記事を集めて、指定したキーワードを高速抽出する、といったもののようだ。しかし、「ネット上の悪評を検知するシステム」というのはよく聞く話だが、うまくいっているという話は聞いたことがない(たとえば犯行予告検出システムとか)。まぁ、もしうまくいって「悪口を書いたらすぐに捕捉される」ようになってもそれはそれで嫌ではあるが……。
関連ストーリー
Googleによる新たな知識発見? 98 コメント
結局は経営方針次第 (スコア:2, 興味深い)
すぐにアクションが起こせる身軽さの無い企業では、導入してもムダというものでしょう。
そしてそういう身軽さのある企業というのは規模が小さいため、そもそも話題自体が少ないので、
こんなシステムを導入してまで風評を集める必要が無い、と。
コメントを書く
Re:結局は経営方針次第 (スコア:2, おもしろおかしい)
まだまだ工作しますよー
御期待下さい。
コメントを書く
親コメント
じゃあこのコメントが消されたりオフトピになったら効果があったということで (スコア:2, おもしろおかしい)
コメントを書く
意味解析は? (スコア:1)
例えば、"A社の製品Bは使い勝手が悪い" と "「A社の製品Bは使い勝手が悪い」と言われるが、私は良いと思う" では、全く異なる意味になります。
パターンマッチの工夫でそれは対応できるのでしょうか。
世には意味解析エンジンも存在しますが、確か富士通では無いと記憶しています。
# 上記のどちらでも、とにかく検知したいというのであれば問題ないですが
コメントを書く
Re:意味解析は? (スコア:2, 参考になる)
"良い" positive 1
"悪い" negative 1
とかカウントされてくから。
それよりも
「A社の製品Bは素晴らしいよね。○ニータイマーとか付いてるし(プ」
「A社の製品Bほど他に良いものはみたことないですね。分かります。」
なんて書き方の場合、人間が見れば明らかに揶揄表現で反対のことを意味すると分かるが、今の解析ではどちらも positive とカウントされるんですよ。
それが一番やっかい。
コメントを書く
親コメント
Re:意味解析は? (スコア:2, おもしろおかしい)
うまく相殺されてそれほど問題はないのでは?
「べっ、別にA社の製品なんて欲しくないんだからねっ!」
「製品Bなんて売れるわけないじゃないよ。どっ、どうしてもって言うなら私が買ってあげてもいいけど…」
これらがnegativeとカウントされればいいので。
コメントを書く
親コメント
Re:意味解析は? (スコア:2, 参考になる)
最近の自然言語処理の流れをみていると、人手をかけて学習用コーパスを大量に整備するよりも、Webから大量にコーパスを集めてきてそのうちの一部にのみ人手でラベルをつけて、あとは半教師あり機械学習でがんばるという例が増えています。
このようにコーパスが大きいと形態素解析や構文解析、意味解析などに時間がかかること、Webの表現ではあまりよい性能で解析できないこともあって、単なるN-グラムやbag of wordsで乗りきってしまうということもされてますね。
うまく機械学習器を調整することができれば、他が多少はいい加減でもweb as corpusが巨大であるという点で解決してしまうことができるようです。
まぁ計算機資源は非常に食うのですが...
ギガバイトのオーダーになってくると茶筌かけるだけで一苦労。
コメントを書く
親コメント
Web上の風評を気にするより (スコア:1)
お金を使った方がいいと思います。そもそも問い合わせ窓口の対応が
許しがたいものであるから、Web上に書き込まざるを得ないので。
コメントを書く