パスワードを忘れた? アカウント作成
11540886 journal
日記

aitoの日記: 9/3 音響学会1日目まとめ

日記 by aito

スペシャルセッション「音楽と音のデザイン」1

・音楽と音のデザイン(岩宮眞一郎)
スペシャルセッションの趣旨説明と企画全体の概略。
従来の音楽伝達(楽譜→演奏家→演奏場→聴衆)では「音づくり」の過程はなかった。しかし現在のポピュラー音楽では、音の加工・編集などの音づくり(デザイン)が不可欠。
現代音楽の世界では、調性が従来のクラシックから変化し(ミュジック・セリエルなど)、またミュジック・コンクレートや電子音楽など音楽素材が拡大してきている。演奏者は自分で音から作るようになった(新しい音、おもしろい音の追求)。そのため音のデザインが重要な要素となった。
さらにコンピュータによる「音場のデザイン」、メディアアートのような芸術とデザインの境界分野、インタラクティブ音楽のようなものも一般的になってきた。
いずれもテクノロジーの発達と深い関わりがある。

・音楽制作における音づくりとミュージシャンにとっての音(布施雄一郎)
音楽テクニカルライターの人。元ローランドの技術者。
現代ではポピュラー音楽は全リリースタイトルのおよそ2/3。ポピュラー音楽の音には、楽器の選択、音づくり機材(アンプ、エフェクタ)の選択、録音方法、ミックス、聴取環境などの要因が関係する。すなわち、ミュージシャン・エンジニア・リスナーの3者がそれぞれ音づくりに関係する。(この講演では前2者に焦点を当てる)
エンジニアの音づくりには、「できるだけ生に近い(補正的)音づくり」と、「積極的に音を加工する」音づくりの2つがあり、ポピュラー音楽では後者が主流。
90年代に入ると、PCM音源が発達し、音色数が膨大になり・デジタルエフェクトなどのツールが多様化する。ここから、「音づくり」から「音選び」へと作業が変質する。
これまでの取材では、ミュージシャン・クリエーターはみんな「いい音」を作りたいと言うが、「いい音」の解釈は様々。いい音には「生に近い」「音のクオリティ」「音の好み」などの解釈があり、ミュージシャンの多くは「いい音」を「好みの音」という意味で使っている。
バンドの演奏では、そのままでは互いにじゃまをする帯域があるので(アコースティックギターの中音域など)、録音の際には調整が必要になり、生の音とは全く違う音が「原音」として記録されている。
若いミュージシャンには、音色や帯域などだけでなくさまざまな挑戦をしている人たちがいる。たとえばサカナクションやSEKAI NO OWARIはバイノーラル録音の音楽をリリースしている。また実ホールでの録音、心臓音や花火などのサンプリングなどを利用している。これらは技術的には新しいものではないが、ミュージシャンが技術を利用することによって一般のリスナーに認知されつつある。
ライブ音響は最近大変改善している。音響的には最悪な東京ドームなどでも、かなりいい音で演奏ができるようになってきている。ライブの音響は、一般的なポータブルオーディオに比べて良い音楽体験を提供していて、最近はライブを見てからCDを買うという消費行動の人が増えている。
ハイレゾオーディオについて。従来はオーディオマニアのものであったが、昨年SONYがハイレゾ対応ウォークマンを発売したことで状況が変わりつつある。MORAの会員はハイレゾ対応後に急増していて、しかも20代・30代が増えている。今の若い人は生まれたときから圧縮音源しか聞いていないので、ハイレゾの音は新鮮だったのかもしれない。ミュージシャン主導でハイレゾを主導する動きやハイレゾ対応ウォークマンの新製品などもあり、新しい動きがありそう。ハイレゾは「音の良さ」を一般の人にアピールするために良い機会。

・ポピュラー音楽における和音進行デザイン(三浦雅展、櫻井美緒、江村伯夫)
セッションの中で唯一招待でない発表(乱入)。SerraらのMillion Song Datasetによる研究では数十年前からコード進行は変わらないということであったが、それが本当か詳細に調べた。1960年代からの音楽が対象で、XFフォーマットのMIDIデータ中のタグに含まれるコード名を調査した。
孤立コードは全パターン中の約89%が出現。2コード進行や3コード進行は全パターン数より遙かに少ないが、年代ごとに種類数は増加している。
コードを個別に見ると、I,V,IVなどのトライアドが最多で、2000年代には1970以前には見られなかったコード進行(一時転調、古典和声から外れたものなど)が出現する。また各年代によって好まれるコード進行がある。
4音以上からなる和音はほとんどが7thだが、それを除くと1970代以前はあまり出現しなかったのに対して2000年代には頻出する。

☆☆☆

音声B[感情音声]
・Study on perceived emotional states in multiple languages on Valence-Activation space (JAIST)
異なる言語での感情の知覚にどういう差があるかを調べる研究。対象は中国語・日本語・ドイツ語で、評定者は日本人・中国人・ベトナム人。評価は興奮軸と価値軸の2次元それぞれで5段階評価。「ニュートラル」な音声の位置が3言語でわずかに違っている。それ以外の感情については、曲座標で見たときの角度は言語によらないが、ニュートラルからの距離は言語によって有意に異なっていた(中国語の距離が小さい)。

・Valence-Activation2次元空間での感情表現に基づいた感情音声合成(JAIST)
先週北九州で聞いたのと同じ話(だと思う)。V-A空間上の座標からSTRAIGHT分析された音声の感情パラメータを変換する関数を推定し、再合成した音声が元のV-A空間上の位置と同じところに知覚されるかどうか調べた。その結果、negative-inactiveの音声の自然性が低い。また、合成音はV-A空間上で意図した分布よりだいぶ原点に近づいている。

・感情が聴取による話者認識に及ぼす影響-聴取結果の考察並びに韻律的特徴との比較-(上智大)
人間による話者の知覚に感情がどう影響するか。評価法はABX法。平静と比べると、喜びの表情の認識性能が悪化し、悲しみ・怒りは上昇する。特徴的な話者がいると、その話者については認識性能が高い。勾坂先生からだいぶ厳しい意見があった。

・単語アクセント型ごとのF0波形に着目した単語音声の感情変換(筑波大)
宇津呂研。音声の感情の変換。能書きが長い。ある感情の話速とF0軌跡をアクセント型ごとに平均し、変換元音声の話速とF0軌跡を同アクセント型の目標感情のものと入れ替える。目標音声に十分近いかどうかの主観評価実験を行ったところ、結果は3.8/5。

このあと「感情音声」研究について匂坂先生から厳しめのコメントがあり,フリータイムにディスカッションがあった.匂坂先生の意見にはおおむね同意.

☆☆☆
ポスターセッション音声A・B

河原先生・篠田先生と立ち話をしていたらポスター見る時間がなかった.

・エンマコオロギ(Teleogryllus emma)を誘引する為の疑似誘引歌の作成(国士舘大学)
エンマコオロギの鳴き声の分析と,それをもとに人工的に合成した音でコオロギを呼ぶことができるかの実験.研究目的が「昆虫と会話すること」というところが実にロックだ.

・音声の持つ感性情報のマルチモーダルな表現を目指した母音の聴覚印象による連想色の感性的分析(早稲田大)
匂坂研.男性のさまざまなF0パターンの5母音を聞かせて,連想する色を答えさせた.F0の高さはおおむね色の明るさに関連していて,色相はF1-F2平面上の母音の位置と対応がつくらしい.

☆☆☆
聴覚・音声

・話速とポーズが非母語話者の聞き取りやすさに与える影響(東北大)
うちの研究室のハフィヤン君が発表。日本語に不慣れな外国人が日本語分を聞くときにポーズをどのように入れたらよいか。話速が適切であれば、すべての文節間にポーズを入れるよりも、構文的に部分木が切れるところにだけポーズを入れた方がよい。

・聴取関連特徴に基づく非母語話者の促音聴取難易度推定(早稲田大)
日本語非母語話者による促音の聞き取りの精度は発話速度や音韻のラウドネスに依存する。そこで、発話速度関連特徴(Onninn継続時間長など)、音韻のラウドネス、音韻特徴(摩擦音など)の回帰によって非母語話者の促音の正答率を予測する。

・非負値時空間分解を用いた発話リズム変換の検討(NTT CS研)
磁気センサで取った調音器官の動きを個々の音韻とその強さに分解する手法(非負値時空間分解)を使ってこれまで発話リズムを抽出してきたが、今回は音声信号のみから同様の方法で発話リズムを推定する。ここでいう発話リズムは分解によって得られたアクティベーションのことを指しているらしい。音声の特徴量はLSP。通常のNMFと違い、アクティベーションに単峰性を仮定する。ここで抽出した発話リズムをネイティブの発話リズムに置き換えて「本人の声で良いリズムでしゃべった音声」を作る。

・残響を付加した音声に対する聴性脳幹反応による単語了解度の低下に関する検討(九大)
聴性脳幹反応(ABR)は聴取した音の包絡に似た波形になることがわかっている。今回はさまざまな残響を畳み込んだ音声(親密度コントロール済み)を若年者と高齢者に聞かせ、単語了解度を測定したところ高齢者の方が単語了解度が低かった。次に残響を畳み込んだ音声を呈示してABRを測り、その振幅の実効値と単語了解度の関連を調べた。その結果、若年者については創刊がなかったのに対し、高齢者では直接音と残響音に対するABR振幅実効値の変化率が単語了解度と相関を持っていた(残響音に対するABR振幅が小さい方が聞き取りがよい)。変化率の違いには内耳の機能(外有毛細胞関連)が関係しているのではないかと考察。

☆☆☆

このあとウェルカム企画「ギターエフェクタによるサウンドメイキング術」.北大の青木先生と札幌在住のミュージシャン塚原義弘氏が掛け合いで話をしながらエフェクタの音作りを実演する.出演エフェクタはディストーション,ディレイ,トーキングモジュレータ,ワウ,フランジャー,コーラス,ルーパーなど.青木先生の掛け合いは相変わらず絶妙で,塚原さんの即興演奏は素晴らしい.これだけ自由に音を作りながら演奏できたら楽しいだろうなあ.

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
typodupeerror

人生の大半の問題はスルー力で解決する -- スルー力研究専門家

読み込み中...