初心者がDPでOzoneを使いこなすために13〜Genetal Control2

前回

www.terrax.site

常時下記を開けるようにしてください。

docs.izotope.com

ディザリング
Dither
RXでのディザー作業
ダウンコンバートによるノイズはなぜ生まれるか？
ノイズを消すノイズ?
動画で学ぼう
ディザリングとDigitalPerformer
CodecとDither
DC オフセット
Bit Meter

ディザリング

ファイルのbit数を落として書き出す場合(32→24、24→16や8)などで発生してしまう微細な量子化ノイズを目立たなく抑え込む作業です。「ディザーすると元より音が良くなる」のではありません。

このDitherの話はデジタルデータについて丸っと知識の確認ができる話題の一つです。決してDitherが重要だと言いたいのではなくて、デジタルデータへの初心者の見識を確かめる話題として最適なので、がっつり書きます。

私も自信がないので、随時記事は勉強してアップデートします。

Dither

この話題は以下の二つの音質を聞き分けられる環境で音楽を作る人のためのトピックといえます。
音量をあげた人は後で下げるのを忘れないように！！

<A>

<B>

音量をあげた人は下げるのを忘れないように！！

後半0:12あたりから音が消えます。微細なノイズが聞こえる人はわかるでしょう。

（上がB=元音源、下がA=ディザー後です）

元々は上記の下側の音源を下記ディザー設定で24/48kHz→16bit/48KHzに下げた音源との比較です。

画面右側静音部分のノイズ（いわゆる環境ノイズ＝ノイズフロア）が-80dBFS以下の世界であることに注目してください。

人間は-20dBFS以下の音を通常音量で聞き分けることは難しいです。

一般の人は絶対持っていないような精緻なスピーカーと音響環境がないと、このノイズを聞くことは難しいです。

次にこれも聴いてみてください。

これがちょっと粗いな、とか聞き分けられる環境を持っている人はディザーしないと音楽制作は満足できないでしょう。

今爆音でノイズを聴いた人は音量今すぐもどしてから記事に戻って。

今の音は、下記の設定で先の元音源をRXでダウンコンバート(24→16)をした精度です。

楽曲によってはこのシンプルディザーが一番いい場合も当然あるかも。

何せ一般には聞き取れない世界なので...

いずれにせよRXが(自分のようななんちゃって)マスタリングにも重宝することは間違いありません。目で見てわかる、というのはとっても大事。

この際ですから下記で、ダイナミックレンジとSN比の違い等も確認しておいてください。

引用

紹介図などによってはダイナミックレンジいっぱいに信号がある場合の最大信号とノイズの比であるPSNRをSN比と呼んでいる場合もあります。

性能を示すためにできる限り大きな比率を示す、という意図もあるかと思いますので実効値のS/Nなのか、最大信号とノイズ比なのかも厳密には確認する必要があるのでしょう。

引用

24bitの世界は144dBの最大ダイナミックレンジの可能性を持っています。同じ計算で、

16bitの世界は16×6=96dBの同ダイナミックレンジの可能性を持っています。

ノイズフロアがある（この部分に音楽音があってもノイズでかき消されてしまう）ので24bitで-120dBFS、16bitで-90dBFSあたりが現実的な音楽音のダイナミックレンジになります。

最大音量と最小音量の差を、

24bit=2の24乗=16,777,216の階段に分けるか

16bit=2の16乗=65,536の階段に分けるかの差によって、どのくらい現実の音を正確な電圧でデジタルデータに落とし込めるかが変わります。

ありがちなミスとしては

・データは16bitだったのに、作業する側が24→16だと思い込んで不必要なディザリング作業をしてしまう（ノイズ増える）

・適切な位置（作業段階やプラグイン挿入箇所）でディザリングせず、逆にノイズが増えた

・DPのように勝手にディザリングしてくれているのに、さらにディザリングを重ねてノイズを増やす

みたいなことが起きないように注意する、となります。
聞こえない領域であるぶん、ちゃんと目で見て確認しないと誰も気がつかない、なんてこともあるでしょう。

また、16bitを24bitのデータにする、みたいな作業の時は必要ありません。大きいbit数であれば、小さいbit数の音源はほぼ完全に元データを再現できます(後述)（ノイズもコピーされます、16→24がノイズを減らすわけではありません）。

とにかくIzotopianはRXがあるとよくわかります。

いただいたある楽曲のラスト部分ですが、通常曲の最後ってこんな感じで暗黒になっていると思います。右の目盛りは今-35dBFSぐらいまで可視化しています。人間の耳では-20dBFSあたりより小さな音はほとんど知覚できませんから、このくらい拡大して音がなければ、高いスタジオで聴かない限り何も聞こえません。

おっさんには何も聞こえません。いやむしろ自分の耳鳴りしか聞こえません。

次に、その右の目盛りあたりでalt+スクロールでデータを拡大します。

「-90dBFS」ぐらいまで見れるように拡大すると、あら不思議、ギリギリまで微量なノイズが乗っているのがわかります。これはノイズをフェードアウトしてくれてますね。

こういう24bitの曲を8bitにまで落としてダウンコンバートすると、

こんなノイズが顕現します。これがダウンコンバートした際のデジタルノイズです。24bitのデータを8bitの箱に収まるようにデータを配置し直す時に出るノイズです(後述)。

このノイズは目盛りで言うと-38dBぐらいですから、コンポなどのステレオで爆音にすると聞こえてます。イヤフォンでも静かな部屋なら聞こえるかも（耳がこわるからやめて）。

流石に耳に聞こえるノイズはなんか嫌ですよね。

こういう激しいダウンコンバートの時に、音楽無音時に聞こえるデータを消すのもディザリングの技術です。

ちなみにRXはディザリング処理のついでに、上記のように音楽音がそもそも響いていない部分そのものを分析してデータ自体を削除してくれます。
それが視覚的に確認もできます。

このカット作業自体はディザリングではなく、RXが優秀なだけです。

これを手作業でやるのは大変です。音楽音のお尻を切り取ってしまいそう。

DPのデータでもみてみましょう。

通例のオーディオデータ0dBFSが左、そこのバイトボリュームを-50dBFSまで下げたのが右です。ここまで下げるともうどんなに拡大しても波形データなんて見えませんよね。

ディザーで扱うノイズは-90dBFSとかの世界ですから、とても微細な世界のノイズを扱うのがディザリング、といえます。

RXでのディザー作業

ファイルを投げ込んで、右メニューからDitherを選び、下げたいbitを選択して被せるノイズ強度等を選びます。

ここでnoneとかも選択肢に入れてditherしては画面の-dBFSメモリを拡大してノイズが実際に減ったか確認いただければ、どの設定が最適か判断できます。

この辺は経験が物を言いますので、最初はひたすらデータをコピーして学んでください。データが混乱しないように、必ず元データをコピーして行なってください。ディザーしたデータをアンドゥしたりしていると、そのアンドゥ作業自体がデジタルノイズになってしまう可能性がゼロではないので。

あなたの環境とミックスの癖で生まれるノイズ（このノイズ量が個人の作業スタイル・使用プラグインでそれぞれ違う）を最も安定させてくれる設定を見つけてください。

これは自分で見つけないと。みんな作業環境や作業癖が違うからです。

場合によってはどうやっても大きなディザーノイズになってしまって、dither行わない方が良い音源(?)などもあり得ます。それはプラグインの優れるもありましょうが、ご自身の作業癖がデジタルノイズを作っている可能性もあり、それが悪いからどう、とはなかなか断言しづらいものがあります。

ご自身でご自身のデータを確かめてください。

余談ですが、RXでもサンプル点まで拡大して

一個一個自分で手作業でいじれたりするので、手動でトゥルーピーク破壊音源?とかを作ることもできます。どうしても気になるところは自分で平らにすることもできます。

でも１秒間に20000-40000以上の点があるので作業自体が非現実的ですが笑、もうどうにもならんという時は最後の手段です。どうしても消せないクリップノイズとか、0.1秒のノイズなら400ポイントくらい作業したらクリアーにできます笑（ポイントレベルで消すとデータの接合部がおかしくなる時もあるので、よく練習しておいてください。そこまで拡大しなくても大体はうまく消せます。）

ダウンコンバートによるノイズはなぜ生まれるか？

例えば上のデータをダウンコンバート(24→8)したとき、下のデータのようにカクカクしてしまったとします。さっきのそれぞれのbit数での階段の話。

サンプリング数が少ないために正しい場所にデータを落とし込めず、さっきまで滑らかなカーブだったのが、カクカクして歪んでしまいます。

こういうカーブはいわば、サチュレーションとか、ディストーションをかけたような結果と類似してきます。つまり元の波形が歪むわけです。

歪めば微細な歪みノイズになります。これがコンバートでも発生します。これが量子化ノイズです。

ディザリングでこのノイズを抑えよう、というわけです。

4. 量子化エラー。

そもそもアナログ波形のラインは常にデジタルに都合よく整数値で記録されるはずもなく、整数値しか置けないデジタルサンプリングは、絶対に実音と誤差が出ます。

アナログ音はデジタルにした瞬間量子化ノイズが発生する運命にあります。

引用

赤いラインがデジタル配置によるズレが作るエラーの合計波形です。

これが音声の波形として認識されると音（量子化ノイズ）になってしまうんですね。

引用

ダウンコンバートすることによってサンプリングできる位置の選択肢が減って、波形が崩れ歪みになり、ほんの微かなノイズになります。

それらが集まって、微細なノイズとしてとっても小さい実際に音として記録されます。

最近は192KHzとかのサンプリングレートもあるのでかなり良い音で再現ですることが理論上は可能です。そのかわり１曲のデータが昔のCD1枚分みたいなサイズになるかも、ですが。

レートが高ければデータも大きく扱いづらくなります。5曲のデータで4GBとか笑。

ノイズを消すノイズ?

このノイズを極力均して目立たなくするためのノイズにマスク/フィルターがディザリングなのですが、ノイズを消すのにノイズを加える？？って、もう凡人には理解できません。

「ノイズ」というと変ですが、絵で見るとわかりやすいです。

これが元画像256色

それを16色にダウンコンバートするとガサつきます。

そこでディザリング。引用

つまりコンバート後に使える１６色しかないバリエーションのデータ配置を、そのデータに応じてバラバラに配置するように命令する命令データを投げることでより自然なタッチに仕上げてくれるわけです。

下記は公式情報ではありませんが、私でもなんとなくイメージつきました。

www.youtube.com

引用

8bitのデータを1bitにすると白と黒以外は消えてしまいます。これがダウンコンバートによる劣化です。

引用

そこにディザー処理をすることでの残すべきデータの輪郭をはっきりさせ、その後不必要なデータを消すことで、通例では消えてしまったデータをディザー処理により浮き立たせることができます。

これらは上記動画からの引用です。

この、小さいファイルサイズでもそれなりにしっかり聞こえるからディザー便利、となるのが本来のディザリングの意義なのでしょう。

引用さらにここに「ノイズシェープ」の選択がバッチリうまくいけば、さらに整います。現在はかなり自動的に色々やってくれるのでノイズシェープまでこだわることもなかったりします。職人中の職人はまた違う次元で仕事しているのでしょうが。

ノイズシェーピング
ディザーノイズシェーピングの積極性を設定します。可聴範囲のノイズが少なくなり、非可聴範囲のノイズが多くなるようにディザリングされたノイズスペクトルを整形することにより、より効果的で透明なディザリングを提供することが可能です。このシェーピングの積極性は、None (シェーピングなし、単純なディザ) から Ultra (約 14 dB の可聴ノイズ抑制) までの範囲で制御できます。ノイズシェーピングを増やすと、ビット深度が高くても信号のピークがわずかに高くなる可能性があります。

ヘルプからの引用です。

初心者こそ、ちょっとお高いですが、RX(standard以上)を活用してディザリング後の状況を確認すると良いです。オーディオオカルトや変な慣習に巻き込まれなくて済みます。

繰り返しますが、右上のようなノイズが全体にあるとすると、

-60dBFSの小ささで鳴らしている音、記録されている音はノイズにかき消されている、ともいえます。だからそういう小さな音を扱うような音楽（クラシック、環境音楽、自然音）で、十分なダイナミックレンジが必要な場合はディザリングも色々工夫されるのでしょう。

またこれも引用ですが、デジタル処理で1dBあげて、やっぱり違う、とまた1dB下げた時、それがたとえアンドゥによる作業でも、デジタル処理が行われると、ノイズフロアなどのレベルをはじめとした量子化誤差が生じて、完全には元に戻らない場合が考えられます。

場合によっては細かく考えて試行錯誤やったが故にノイズフロアのある部分は持ち上がってしまうことも考えられます(マキシマイザーのページを参照ください)(これは機器や作業により全然違うかもですので個人で視覚的に確認ください)。

マスタリングなどの作業を厳密に行う意識高い系ゆえに、試行錯誤した結果、質感がかわった、みたいな笑えない話が起きないとは断言できません。

都市伝説レベルの話ですが、できる限りいじらない、できる限り吟味して作業を行う、というのは音を変えすぎない、という意味でも適切なのかもしれません（試すなら適切な完全バックアップコピーをとって）。

ちゃんとやった感を出さないといけない、と思うくらいなら何もしないほうが音が良い、みたいな状況もあるかもしれませんよｵﾄﾞﾛｵﾄﾞﾛｼｲ。

<参考>サウンドとオーディオ技術の基礎知識

動画で学ぼう

下記の動画で勉強してください。18:30ぐらいからディザリングの話が聞けます。

www.youtube.com

「量子化ノイズが耳に聞こえるまでディザリングしなくていい」

という、すごく現実的なお答えが聞けます。

注目が25:00くらいからのOzoneのDither機能を使った実演で、ノイズシェープの意義や、ノイズがノイズとしてでしてまう現実、その使い方までわかりやすいです。

www.youtube.com

合わせてこちら。

繰り返しの内容もありますが、19:00過ぎくらいからDitherの業界事情が聞けます。

動画での青木氏によるディザリングに対する要点は以下のとおりです。

質問：32bitのデータを24bitにするときにディザリングは必要か？

回答：二通りの回答の道筋がある

＜してOK＞

・人間の耳に聞こえる聞こえないにかからわずデータ数値処理の上で意味がある作業はやっておきたいと思うタイプの方はやられたら良い。

＜しなくても良いのでは？＞

・24bitデータをアナログに落としてもDAコンバータが扱える範囲を超えた情報になっている。人間が聴覚知覚できる範囲にディザリングする範囲が存在しないので、ディザリングをやっても(データの上ではディザリングがなされるのでデータ的には整理されている)やらなくても聴覚体験にはまず無関係だろう。ディザリングをしてもしてなくても聴覚体験では区別がつかない。

この二つの結論を分けるのは、「音楽の力」と「商業音楽のクオリティ」の話に似ていますね。例えノイズが載っていても音楽が魅力を失うことはありません。ラジオから流れてきたら電波が悪いところで電波のノイズが乗っていても名曲は名曲の感動を人に与えます。

一方で商業音楽文化クオリティを競う、という点ではとことんまでテクノロジーを結集させて良い物を作るのは人の誇りや意地でもあります。

実際の音というよりも普段の心構え的な。

www.terrax.site

青木氏の話もこのあたりを混ぜ込んだニュアンスになっている印象も受けました。

なかなか難しいですね。

・青木氏は16bitに落とす場合でもディザリングいらないと思ってる派

・8bitに落とすときはディザリングの意義を感じる

・ピークが-60db以上の波形を扱う（めちゃくちゃ音の小ささを表現する音源）場合はダイナミックレンジが狭くならないよう、できる限りディザーしてノイズの影響を減らしたい

・24bitファイルは品質もそうだが、データが小さく、程よく扱えるPCとストレージに優しいフォーマットだ。

詳しく知りたい方はこちらを。

note.com

引用します。

ビット深度を落とす際楽曲の終わりやフェードアウトの消え際等で一瞬音がブツブツ言うのが気になってしまったときに初めてディザリングをして下さい。それ以外の場面での恩恵は無いといっていいでしょう。

まずはこの感覚を把握した上で、集中してバウンスしたデータを聞いていて、違和感、ノイズ、などを感じなければ、現状のあなたの中ではディザリングは必要ない、と言えてしまいます。心配ならやれば良い。

無知なまま作業としてディザは必要だから、と受け入れてはいけない、という面もあります。

ディザリングとDigitalPerformer

DPで48KHz-24bitで作成した楽曲プロジェクトがあったとします。

ここでCDに焼くデータにするために44.1KHz 16bitというデータにする、とします。

www.izotope.com

下記は引用です。

オーディオをより低いビット深度にバウンスする場合を除き、ディザリングは常にオフにする必要があります。

理想的には、ファイルをより低いビット深度 (32 ビットから 24 ビット、または 24 ビットから 16 ビット) にエクスポートする場合、オーディオマスタリングの最終段階でオーディオのディザリングを 1 回だけ行う必要があります。

ただし、最新のDAWのほとんどは内部的に 32 ビット浮動小数点以上で動作するため、マスタリング用に 24 ビット WAV ファイルをエクスポートする場合は、ディザリングも行う必要があります。

一般に、オーディオを 24 ビット以下にバウンスする場合にのみディザリングする必要があります。

32 ビット浮動小数点以上のファイルをエクスポートする場合は、可聴量子化歪みが発生しない十分に高い解像度であるため、ディザリングについて心配する必要はありません。

ここでは潔癖な感じの作業タイプ向けの指示です。

32bitフロート処理は勝手に内部で行われているので、32bitで構成されたプロジェクトを24bitのままバウンスする時もDitherやった方が良い、ってことですね。

そもそもいつ32bit float処理が行われているか、って気がつかないと思います。

一応用語の確認で、みんな大好きSleep freaksさん。

sleepfreaks-dtm.com

でもOzoneがあれば安心(?)です。包括的なDitherツールがあるからです。

でもその前にDigital Performerもガンギマリにすごいんです。

DITHER

(前略)Digital Performer’s mixing and processing engine employs 32-bit resolution. When 16-bit or 24-bit digital audio first enters Digital Performer, its bit depth (resolution) is raised to 32-bits. From then on, as the audio is mixed and processed, it remains at 32 bits until it leaves Digital Performer. The Dither command, when checked, makes Digital Performer use dither whenever it must reduce the bit depth of audio. For example, if you bounce your mix to disk as a 16-bit, 44.1 kHz AIFF audio file to later burn a CD, Digital Performer converts your mix, which internally is being processed in 32 bits, to 16 bits during the bounce operation. If the Dither command is checked, dither is employed to help reduce the inherent quantization distortion that occurs when audio bit resolution is reduced.

(訳)

ディザ
Digital Performer のミキシングおよび処理エンジンは 32 ビット解像度を採用しています。

16 ビットまたは 24 ビットのデジタルオーディオが初めて Digital Performer に入力されると、そのビット深度 (解像度) は 32 ビットに引き上げられます。

それ以降、オーディオはミキシングおよび処理され、Digital Performer から出力されるまで 32 ビットのままになります。ディザーコマンドをオンにすると、Digital　Performer はオーディオのビット深度を下げる必要がある場合に常にディザーを使用します。

たとえば、ミックスを 16 ビット、44.1 kHz AIFF オーディオファイルとしてディスクにバウンスして後で CD に書き込む場合、Digital Performer はバウンス操作中に内部で 32 ビットで処理されているミックスを 16 ビットに変換します。

Dither コマンドがチェックされている場合、オーディオビット解像度が低下したときに発生する固有の量子化歪みを軽減するためにディザが使用されます。

内部処理は自動的にやってくれているんですね。

そのためにはオーディオメニューのディザーをオンにしておいてください。

www.soundonsound.com

記事によれば、オーディオメニューのディザー処理は、

・16 ビットを超えるオーディオを16 ビットプロジェクトにインポートする場合、インポートされたオーディオにディザリングが適用される

・サウンドバイトウィンドウでハイレゾオーディオファイルを手動で選択し、ミニメニューのConvert Sample Format コマンドを使用してそれを16ビットに変換する場合

・シーケンス内で16ビットのサウンドバイトを選択し、オフラインプロセスで「プラグインを適用」するときの余計な高調波ノイズを減らすため、サウンドバイトにディザリングが適用される。

二重ディザーになる可能性もありますので、上記の使用に気をつけて行かないといけないあたり、それはそれでちょっと面倒ですね笑。

マスタリング時は、一旦ディザーメニューは外し、書き出し用のMW Limiterのディザーを使うとより確実です。

ここも自動化せいや！！て声が聞こえてきそう笑

この時

ポストフェーダーの青紫ラインより下にMW Limiterは入れてください。

マスターフェーダーを通った後で変化が起きないように、一番最後の最後の信号にディザーをかけるためです。

（マウスでつまんで移動できます＝プリとポストを跨ぐと間に挿してあったプラグインは消えてしまうので、別トラックにコピーしておくなどして気をつけて）。

64bit float処理もしてくれます。

MasterWorks Limiter は 64 ビット浮動小数点解像度でオーディオを処理し、ノイズを追加することなく可能な限り最高の忠実度を提供します。

これは、24 ビットオーディオファイルの忠実度を維持できることを意味します。さらに、MasterWorks は最終ミックスを必要な解像度にディザリングします。

プロジェクトが24bitで作られている時、ここに通る前の音は全てDP内で24bitプロジェクトに合わせてフォーマットが整えられます。

CodecとDither

ここでできないコーデック処理を行うとき、Ozoneが必要になります。

1.完成したミックスを入れ、そこにOzoneだけを挿してDitherをオンにします。

2.CDにするなら1を16(CD）を選びます。

Auto Blankingは0.7秒の無音時はノイズ発信をミュートしてくれるそうです。ブレイクのある曲や、長いブレイクがある曲用ですね。

Dither Amount

Strong : 完全に除去(の予定)

Medium: 推奨設定

Low : ノイズが残る可能性あり

Off : ノイズが残る可能性あり

Harmonic Suppression

ディザoffの時に可能な限りノイズを抑えてくれるのでonがまずは有効です。

Limit Peak

逆にがっつりディザをかけると、時々低いレベルでノイズピークが生まれる可能性があるので、それを抑えてくれるオプションです。

いずれのオプションもRXエディターなどで波形の詳細をがっつり分析できるようになるまでは、必要に応じてonにして下さい。

DC オフセット

安価なインターフェース等の録音や何からの電流異常で、波形の中心がずれてしまうエラーです。こうなると元々クリップする予定になかった音がクリップしてしまいます。

DPにもそういう場合に波形を中心に戻してくれるDC Notchという可愛らしい名前のプラグインがあります。挿しておくだけでDCオフセットが起きた時だけ働く、という健気なプラグインです。

OzoneではマキシマイザーやVintage Limiterという特定のプラグインが入っている時だけDCオフセットのメーターが使えるようになります。

その場合メーター下のFilterを入れておくと良いらしい。

赤い波形をクリックするとリセットされます。

Bit Meter

元の曲が24bitなので、外側が24まで点灯しています。

それを12bitにディザーしたいので、そのようにセットすると、灰色の点滅部分が12bitまでにおさまってくれてます。

クライアントが24bitだと言ってデータを送ってきても信用するな？ここで見てちゃんと24までついてるか確認しろ、的なことをジョナサン・ワイナー氏がマスタリング講座で教えてくれました。

でも実際そういうの誰でも経験あると思います。みんな疲れてるし笑。

macの場合はオーディオデータアイコンをコマンド+Iで見れますけどね。

Noise Shaping

24 ビットとノイズシェーピング:

基本的にディザーノイズにEQを適用して聞こえにくくするようなものです。

ビット深度が 8 ビットまたは 16 ビットの場合、これはかなりの違いを生む可能性があります。

ただし、24 ビットでは、ディザーノイズは非常に静かなので、通常のリスニングレベルでは、ノイズシェーピングを行わなくても聞こえません。

それでも、量子化歪みは除去されますが、その音質の性質上、聞こえる可能性がはるかに高くなります。

これについては、先のIzotopeの対談動画の中の検証部分で述べられていますのでご参考ください。

www.youtube.com