←前へ  次へ→

音処理「声をはっきりと聞かせたい」


コンプレッサー&リミッター

テレビCMのナレーションなどの声というのは、ほとんどの場合はコンプレッサー+エキサイターなどを使って、声を目立たせているものです。CMなので出来るだけ目立たせないといけないので当然ではありますが。

コンプレッサーというのは、「音のトータルのレベルを押さえつつ、出来るだけ大きく聞えるようにしたい」などの時に使うモノです。直訳すれば圧縮ですね。圧縮といっても保存のためのモノでなくて、音圧レベルを圧縮するというような感じでしょうか。
具体的に言えば、「大きなレベルは小さく、小さなレベルは大きくする」エフェクトです。コンプレッサーで処理すれば、音量を平均化して一定にする事ができるのでピークレベルぎりぎりで使えますので結果的に大きめに聞えます。

が、しかし、、、RexEditのオーディオフィルタには無いですので、別途処理が必要になります。僕の場合はナレをwavで取り込んで、デジオンサウンドで不要部分をカットしますので、最後にデジオンサウンド標準のコンプレッサーを掛けています。あまり強烈に掛けるとダイナミックレンジが損なわれるので実際に聞きながら適度に使う。慣れていない人もおおいかも? まあ慣れるまで何度でもトライしてください。でないと耳が覚えないでしょうから。

リミッターは、、、まあ上限を制限するためのエフェクターです。コンプとにたようなものですね。

ちなみにプレミアには標準装備です、、、。


エキサイターでメリハリを、、、。

エキサイターというのは、「声をエキサイトさせる」エフェクターです。冗談のような話ですが、、、、。具体的にどういう処理かというと、人間の声に含まれる倍音成分を若干歪ませたりレベルアップしたりして、ハリの有る声質にすることです。

倍音成分というのは、元になる周波数の2倍、3倍、4倍、5倍〜(ずーっと続きます)、、、の事です。人間の声の場合は基音の2倍の周波数の音量はだいたい1/2の音量です。3倍は1/3。4倍は1/4。5倍は1/5程度(個人差がありますし、実際には倍音意外の周波数も出ます)。

仮に人間が、440Hzの「あー」という声を出せば、その倍である880、3倍の1320、4倍の1760Hz〜などの周波数成分が同時に聞えています。これは人間の可聴範囲内で延々と続きます。もちろん元が440なので音程はA(ラ)と言うことは変わりませんが、常に倍音が含まれていて、その倍音成分の違い(組み合わせ)が人の声の違いと言うことになります。モノマネで良く似ているのはこの倍音成分も非常に近いはずです。

逆に440Hzだけであれば、それは声としては聞こえません。たんなる信号音でしかありません。いわゆるサイン波というものです。時報の音ね。

この倍音部分を若干歪ませたり、レベルを上げると、人間の声はハリが出ます。基音に対して3倍や4倍あたりの周波数を歪ませたところで、もともとあまり音量がないので大勢には影響はありません。これで全体のレベルをほとんど変えることなくよく通る声になりますのでCMなどでも良く使われると言うことです。これがエキサイターの原理です。ただしやりすぎると小田和正的な気持ち悪い声になりますが、、、。

元素材が仮にアナログカセットテープだとすれば高域成分はだいぶ落ちます。高音域がでてなくて、この倍音成分が無くなる事が音を悪くする要素となります。このような場合もイコライザーで高域を少し持ち上げたあとエキサイターで処理すればかなり改善されます。録音状態の悪い聞き取りにくい声も幾分改善できますが、さすがにノイズはカットできませんので、ノイズごとエキサイトしてしまうのでご注意ください。ノイズは別途専用ソフトでか波形編集で取り除いてください。


人の声と同じような倍音特性を持つストリングス系の楽器(バイオリンなどね)やディストーションギターなどもエキサイターを使えばきらびやかな音になります。(あまりやるとうるさくなりますが、、、)。ちなみに、、、アイドル系の歌手の場合は、、、かなり使ってあると思います(笑)。カラオケボックスのアンプに付いているのもまあ同じようなモノです(エキサイターを掛けたあとに、コーラスなどを少し加えてステレオ処理すると、誰でも綺麗な声になったりします)。

で、トータルレベルを押さえて良く聞えるようにしたいのであれば、コンプレッサーを掛けて、エキサイターでハリを出すとよろしいです。もちろんイコライザーで前処理は施します。これは基本中の基本。ナレや話声の場合は低域を若干下げて、1kHz付近を少し上げておきます。(状況にもよりますが、、、)

↓だいたいこんなグライコの処理をします。(Rexのグライコです)


が、エキサイターはデジオンサウンドにもないので、必要な場合はヤマハの「SPX-900」という外部エフェクターを使っている。SPXは、知ってる人は知ってると思いますが、知らない人は全くしらないか、、、。まあ、昔からある有名なエフェクターです。今なら中古屋に行けば2万くらいで手に入るのかな、、、、?。別にSPXでなくてもいいけど、、、、マルチエフェクター(複数のエフェクトを同時に処理出来るもの)であればなんでもよいと思います。WINのダイレクトXプラグインがあればRexからダイレクトに使えるのでそれでもよろしい。(エキサイターのプラグインが有るかどうかは知りませんよ)


←SPXは、パラメトリックイコライザー+コンプレッサー+エキサイターを同時に使えます。(リバーブも使えますけどこの場合は当然不要です)



僕の場合は、DVテープでナレを撮るとすれば、それをRexオーディオで取り込む時にSPX経由のアナログ接続で取り込む。その過程でイコライザ+コンプレッサー+エキサイターを掛けています。ですのでキャプチャーされたものがすでに最終的な音となります。

ちなみにこういう外部エフェクターというのは、常にリアルタイム処理なので(当たり前ですが、、、なんかPCベースで考えると全てがおかしくなる)エキサイターでの声質調整とコンプレッションレベル調整は聞きながら出来ますので簡単です。デジオンだと何度も設定しなおしてプレビューしないと出来ないので不便この上ない。まあ慣れの問題もあるけど、、、SPXの方が僕は使いやすいのです。(デジオンサウンドのデジタル処理よりはSPXの方が当然音は良いです)

しかし、、、これはナレなど声だけの場合は問題もないですが、AVIファイルだとアナログキャプチャーになるので問題です。一度DV接続でAVIにキャプチャしておいて、必要な所のSE(声)だけを別途アナログで取り込む必要があります。つまり、どうしてもエキサイターが欲しい時は部分的にSPXを通した音をキャプチャーして、Rex標準のメディアインポータを使って音の差し替えを行う事になります。面倒ですが、、、。

意外と音声ってないがしろにされがちですが、聞き取りにくい声と言うのは無いのと同じ事です。ですので出来るだけ努力はしてみましょう。しかしそれでもだめなら、、、文字でも出しておくとか(笑)。僕もたまにそういう事をやるけど、、、。


●おまけ

マイクでのナレの収録というのは近づけば近づくほど低音域のレベルが上がります。これを「接近効果」と申します。あまりにマイクと近いとこの接近効果のおかげで低音が膨らんでしまいます。最終的なレベルに問題がなければ構わないですけど、多くの場合はレベルをやたらと上げてしまうことになります。ですので多くの場合はグラフィックイコライザーで低音はかなり下げてしまいます。人間の声ならば一番左(60Hz以下)は下げきってもいいくらいですね。ちなみに60Hzというと、ほとんど耳でなくて体で感じる周波数です。人間にとっては実際には聞こえない低周波も20kHzに近い高周波も、実は聞こえています。聞こえているというか体は感じています。聞こえないといっても長時間大音量で聞かされていると、、、、体調が悪くなると思います(笑)。

●おまけ2

48kHzとか32kHzとかのサンプリング周波数について。
DVフォーマットはこの2つがフォーマットととして定められています。この周波数というのはデジタルサンプリングの量子化のための周波数の事ですね。ではいったいどこからこういう数字になっているのでしょうか、、、、。

人間の可聴範囲(聞こえる周波数ね)は20Hz〜200000Hz(20kHz)と言われます。が、実際には50〜16000kHz程度でしょう。よっぽど耳のいい人以外はこれくらいです。この実際に人間が聞こえる範囲を考えると、デジタルサンプリングレートは16000(16kHz)の倍にあたる32kHzで大丈夫という事になります。これ以上サンプリングレートをあげてもデータ量が多くなるばかりであり、実用性が低いとの判断で32kHzです。これがDVの普通モードになっています。家庭用ムービーの場合はマイクの性能も録音状態も悪いので、これで十分だと思います。

しかし実際には16kHz以上の聞こえない周波数であっても、上記に書いたような、音色(音質)を構成するための倍音成分が存在します。ちゃんとしたマイクで収録すればその差は普通の人でもわかるくらい違います。これを考慮して考えると22kHzあたりまでは必要となり、これが音楽CDのサンプリングレートである44.1kHzという数字になっています。DVでは更に広域まで対応できる48kHzでサンプリングしているので、理論上は24kHzまでの音が出せる事になります。

もちろんデジタルの場合は、圧縮の方式によっても音は変わるので、同じ44.1のサンプリングレートであっても、無圧縮のCDと約1/4に圧縮しているMDではかなり音が変わってしまいます。高いサンプリング周波数はスペック上、高域まで出せるというだけの事であり、実際の音の善し悪しとは違います。なぜならば音には密度がありますので圧縮すればするほどそれが失われてしまい、データ量は小さくなるけれど、結果的にスカスカの音になります。画像で言えばBMPとJPEG圧縮のようなものです。CDと同じサンプリングレートであっても、MDやMP3の音は高級オーディオで聞くと明らかにスカスカに聞こえます。が、もともと音の悪いラジカセ程度だとわからない。そういうフォーマットなのです。

ですから単純にサンプリング周波数だけで比較はできないのですけど、同じ圧縮方式であれば周波数が高いほうがいいに決まっています。DVならば48kHzの方がいいのに決まっていると言うことです。

ちなみにカセットテープとかアナログレコードとかの旧フォーマットには圧縮も限界もありませんので、頑張ればいくらでもいい音になる、、、。メタルテープならば頑張ればCDよりもいい音になると思います。がそこまでつきつめるとそのための機械も相当高くなります。CDなどのデジタルのフォーマットの方が音がいいと思われるかもしれませんけど、金を掛ければアナログフォーマットの方がいい音になる可能性があるのです。デジタルの場合は安物でも高価なものでも基本は同じです。サンプリング周波数と圧縮方式により「記録フォーマットの上限」があるので、どう頑張ってもそれ以上の音にはなりえません。ただしノイズには無縁なのでそういう意味では良い音という評価になりますけど、ノイズの量と音質の善しあしとは意味が違います。(素人の皆さんは誤解されてる場合が多いですけど)

まあ、実際に人間が聞く場合は最終的にはスピーカーというアナログなモノを必要としますので、そのあたりに金をかけるか掛けないかで音の良さが変ると言う事ですね。人間の耳の分解能力というのは意外にも優れており、訓練次第ではデジタルフォーマットの限界を越えられる、、、こともあります。


←前へ : Rex 補完計画へ : 次へ→