パスワードを忘れた? アカウント作成
10591184 journal
日記

aitoの日記: 2014/1/27 EMM研究会@東北大学 1日目まとめ

日記 by aito

セッションの前に栗林先生が「電子透かしコンテスト (IWIHC)」のアナウンス。
http://www.ieice.org/iss/emm/ihc/
同じくセッション前に新見先生がEMM特集号の宣伝。
http://www.ieice.org/iss/emm/cfp.php

・音響学教育のための教材開発 ○青木直史(北大)
あいかわらずフリーダムな青木先生。今回は言語聴覚士養成カリキュラムのための音響学の教材について。言語聴覚士の試験では言語学と音響学で得点の1割。言語学・音声学・音響学・聴覚心理学関係の出題範囲の紹介があったが、結構難し気なことをやっているんだなあ。この後、実際にやっている講義の紹介。最初はサイン波の話だが、学生は計算が苦手で、周期と周波数の関係ぐらいでも嫌がる学生が多い。サイン波の重ね合わせによる波形の生成、位相の話。この辺で十分難しいが、音楽の話だと食いつきがよい。さまざまな波形の音のところではファミコンの音の話などをする。あとはウェブサイトの話 http://floor13.sakura.ne.jp/ と、今度書く本の話。

・音声信号処理に基づく英語プレゼンテーション音声の特徴分析 ○今井美和花・松永竜太郎・小嶋徹也・吉本定伸・堀 智子(東京高専)・野口ジュディー・津多江(武庫川女子大)
英語のプレゼンの学習システム開発が目標。想定としては、合成音声とプレゼン音声とを比較して、直すべきところを指摘するようなものらしい。この発表ではプレゼン音声の特徴を調べている。対象音声は1名が朗読調とプレゼン調で読んだ音声(+合成音声)。朗読音声よりもプレゼン音声の方がポーズが多い。また、対数周波数レンジを音節ごとに分析。音節長は、強調する単語についてはプレゼン音声の方が長くなる。音声データから特徴を自動抽出したいが、音節セグメンテーションが難しいので、音節核を自動抽出することを検討。フォルマント周波数を抽出して、それに基づいて発話の中の音節核部分を認識する。音節セグメンテーションが目的ならば、音声認識器のforced alignmentを使うべきだというコメントをした。

・遠隔レンダリング型聴覚ディスプレイの試作 ○岩谷幸雄・庄子拓也・川崎誉洋・千葉順子(東北学院大)・大谷 真(信州大)・土屋隆生(同志社大)
最初に聴覚ディスプレイの基本的な説明。今後の聴覚ディスプレイはネットワークに対応させる必要があるだろう。構成要素として、音源とレンダリングモジュールはクラウド上に置く可能性がある(センサとスピーカはユーザ側にある必要がある)。レンダリングモジュールが遠隔にある場合、人間の頭部運動に対する検知源(75ms)以内にレンダリングと通信をする必要がある。試作システムでは、端末はASUS MeMO padでサーバ側はJava servlet (tomcat)、通信はHTTPを使う。端末の処理速度が遅いので、条件によってはローカルでレンダリングするより速くなる。全体では100msぐらいかかっているが、その大部分はAndroidでの音出力の問題らしい。音像定位実験では良好な結果。思った以上にうまくいっていてちょっと驚いたが、Netduettoとかも使えるので(あちらの遅延は30msぐらい?)まあ可能なのかな。

・錯視を生じさせる幾何学模様が表面に描かれた立体物の印象 ○大谷智子(東北大)
錯視パターンのシールが貼ってあるLEGOブロックを使ったワークショップ。錯視を使ったデザインはいろいろあるが、錯視がどうデザインに使えるのかについての定量化や体系化はほとんど行われていないので、そのためのデータを集めるための方法論を検討。錯視ブロックを使った作品作りのワークショップをした後、評価語を選んでもらって、SD法により分析。例で挙げられたワークショップのテーマは「私のピラミッドを作ろう」。高学年では、小さい構造から始めて、それを観察して拡張するような傾向が見られた。作品での錯視ブロックの使い方の定性的分析。印象評定と印象空間の作成をしようとしているが、人数が少ないので実際の定量化はこれからのようだ。

・[招待講演]ソーシャルネットワークのプライバシーと個人の特定 ○吉浦 裕(電通大)
SNSのプライバシー問題。SNSによる個人情報漏洩、知人の情報の漏洩、犯罪者によるターゲット調査、興信情報など。先行研究として、実態調査、攻撃研究、防御研究がある。
 実態調査として、「日本のTwitterユーザの4割はプライベートな内容だけしか書かない」とか「Facebookの公開範囲はだんだん狭くなっている」とか。
 攻撃研究は、SNS上のテキストや画像解析、複数のSNSの照合解析など。
 防御研究は、公開範囲の自動推薦や自動警告、開示情報の匿名化など。
Background checkのプライバシー問題(企業による就職希望者や社員の素行調査や交友関係、思想調査)。2011年には調査したうちの91%が就職希望者のSNSを調査している。

ABC (Automatic Background Checker):履歴書情報とSNSの発言(Twitter)を比較して個人を特定する技術。
ユーザプロフィールが匿名化されていても、発言内容を履歴書と照合し、100人の中から一人に絞り込むことが可能。つぶやきが100件あるとかなりの絞り込みが可能。
方法としては、履歴書と「つぶやき集合」(100ツイート=1文書)との文書類似度を比較するという割と単純な方法。ただ、そのまま比較すると、ツイートの中には履歴書の単語(在学している大学、卒業学校など)がそのまま出現することは少ない。そこで直接関連のない単語間の関連度(hidden term frequency)をWeb検索によって計算する。具体的にはツイートの中からキーワードを抽出してWeb検索をし、出てきた単語の順位によって重みをつける。このような関連度で文書ベクトルを作ってコサイン類似度を計算する。実験の結果、社会人については100件のつぶやきから95%程度の精度で特定が可能。学生の場合はネットスラングが多くてそもそも形態素解析が難しく、また履歴書と関係ないツイートが多いので難しい。ツイートが1000件あるとなんとかなる。関係ないツイートが多くても、数が集まればだんだん本人が特定されてくる。結構じわじわくるね。
今後は逆のマッチング(ツイートから履歴書を当てる)つまりプロファイリングをする予定。また、発言から履歴書を特定されにくくする技術もあり得る。

次は、発言から個人情報の漏洩を自動検知する技術。
SNSで漏洩する個人情報は多様で、そのための表現や、秘匿したい情報もユーザによって多様。そのため、機械学習を使うことが難しい(データが集められないし、集めたときには個人情報がすでに漏洩している)。そのため、技術目標は「ユーザごとに異なる個人情報を学習なしで検知する」。手法としてはABCの手法を転用し、ツイートの内容とさまざまな個人情報との関連を調べて、関連度が閾値以上の場合に警告する。F値は0.8弱。結構いけている。

最後は、顔画像の匿名化。関連研究として、出会い系サイトの顔写真とFacebookプロフィールとの照合や、道行く人の顔とFacebookをマッチングする研究などがある。
顔の特定に関する安全性と、匿名性-自然性がコントロールできる方法を開発する。基本的な考え方は、顔空間からランダムに顔を生成し(匿名顔)、本人の顔との類似度から、特定される確率を求める。元の顔との違いが大きいほど特定されにくくなる。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
typodupeerror

身近な人の偉大さは半減する -- あるアレゲ人

読み込み中...