前回
それぞれのモジュールで統一した機能の表記は省いていますので前回以前のページや下記をいつでも参照できるようにしてください。
Ozone操作の設定基礎+デジタルの基礎知識の記事その1です。
自分もよく把握していない部分もあるので随時加筆修正いたします。
I/Oパネル

I/Oパネル=in/outパネルです。
左がOzoneに入ってきた音の状態=in
右がOzoneを通った音の状態=out
です。
最初の段階で音が小さいから、と、このフェーダーの位置を変える必要はありません。まずはそのままで作業してください。
下記に色々設定について書きますが、本当に不満を感じるまで基本的には初期値のまま使ってOKです。

赤字の値が+になったらクリッピングを示唆しています。
内部では、それらの値もちゃんと鳴らせるような仕組みが働いている場合が多いですが、赤くなれば、Ozone上でも歪んで聞こえている状態になります(音楽によってその顕現に差があります)。
入力または出力信号が 0 dBFS を超えると赤色で表示されます。
赤色部分をクリックするとリセットされます。
ここが赤くならないようにすることでより安全な設定となります。
また、フェーダーをいじってもフェーダー玉をクリックすればリセットされます。
多少の瞬間的音量爆発でもプラスにならないようにピークを余裕を持って設定する、というのが基本姿勢ですが、なにぶん耳では聞き取れない「割れ」なので、
・多少プラスになっても気にしない(他の視聴環境では割れることもあるかも)
・絶対ここがプラスにならないようにする(どんな環境でも正常使用で割れる心配が極力減る)
的なそれぞれの個人の信念があると思いますので、そこは経験で自分のポリシーを決めてください。ガンガンプラスになっても音で判別ができないので、マスタリングエンジニアにでも聞かせない限り音の割れは誰にも気が付かれない可能性もあります。
「いや、この割れはサチュレーションさ」
と言われたら返す言葉もない、というのが音楽の世界です。
外国人の友人知人などは、結構赤くなっても気にしません。事実こうしたプラグインは余裕を持って設定されていることが多く、「耳で感じなければ気にしない」タイプの人もいます。
本人の信念で数値設定をすることがとても大切です。
ラウドネスノーマライゼーションをそこまで恐れなくても、配信サービスは年々あらゆるトラブルに対して「アップする人が何もしなくてもちゃんとなってる」的な配慮が進化しています。個人でやる人は自分なりに最新の技術情報を勉強してください。
いずれ本当に人間は何もしなくても良くなりそうな進化の勢いです。
現状でもyoutubeやspotify、多くの人が音量、音質気にせず聴けているんじゃないですか?
I/Oオプションから。

基本的にはPeakかRMSまたはPeak+RMSで良いと思います。
peakは瞬間的な音の突出したデータを正確に表示してくれるメーターです。人の耳では聞き及ばない瞬間ピークを記録してくれるので便利です。要はこのピークが割れないように0以下に設定できれば無難です。
RMS(root mean square)は平均値(実効値)です。
例えば歌のボリュームが1秒ごとに
1,2,3,4,3,2,1
と変化したとします。この時間の流れの平均値をどう計算しますか?という時に用いられる慣例となっているのがRMSです。
まずそれぞれを二乗します。
1,4,9,16,9,4,1
その後全部足します。
1+4+9+16+9+4+1=44
項目数で割ります。
44/7=6.285714...
その平方根を取ります。
2.5071326...
エクセルでも計算できます(参考)。

より正確な値が一瞬で出せます。
なんでこんな計算をするか、というと、音楽の波形は正の値と負の値があるから、
そのままの平均では0になってしまうので、上手に平均が出せるように正の値にして計算できるrmsが利用されていると考えられます。

こんな感じの7秒間の数値のばらつきがあった時(縦に時間の流れ)の平均値(rmsと書かれた横の値)を見ていただくとRMS平均のニュアンスがイメージできるのではないでしょうか。
値が1を持つようなデータでも平均は130.9って笑、この7区間を平均したらこうなります。
もちろん実際は人が違和感なく認識されるよう計算されているわけですが。
(それぞれのメータープラグインでも若干表示される値が異なることもあります)

これはpeak+RMSにしたときです。赤枠の薄い灰色がpeak値です。濃い灰色がRMS値です。
瞬間的なピークは人間が感じ取れないアナログ波形のスピード/瞬間的に発生したものも記録します。波形の尖った頂点部分です。

人はこのピーク値の時間が短いとその音の大きさを適切に認知できません。RMSのごわっと鳴り連なっている波形部分の音量感をその部分の音の大きさとして感じてしまうのだそうです。
RMSはこの人間の耳が感じとれる音量認識を模したデータと考えてください。
VUメーターなども300ms=0.3秒の平均値が表示されます。
つまりそれ以下の時間感覚で大きい音が瞬時に発せられても、人は適切に感じ取れないんです。
でもメーターの方では明らかに記録してくれます。人間が認識しづらいんだから、放っておけばいいじゃないか、と言うかもしれないですが、そのエラーがどこでどんな環境で割れ、クリップを感じさせるかわかりません。
少しでも快適な視聴体験になる確率を増やすために、こうした瞬間的ピークに配慮することはすなわち顧客サービスに該当する、という発想ですね。
この技術も今後もっと進化しそうです。

この歯車マークからi/Oオプションも変えられます。

10(ppm)とは10ミリ秒=0.01秒のピークプログラムメーターとしての値、という意味だと思います。CPUも食います。
300(VU)というのは今述べた、300ms(VUメーターの針の値ですよ)という意味です。

VUメーター表示例です。ここにもVUとPPM等の切り替えができます。
また下記にてピークの値を何秒表示するかも設定できます。
これは計算した値を表示し続ける時間のことです。設定してみればわかります。大きくすればするほど、それまでの時間で最大の値を表示し続けます。

K-systemはBob Katz氏提案のメーターです。peak値に心理的にとらわれないような設計とのことで、メーターに左右されすぎて落ち着かない人でK-ystemが見やすい、という方はお使いください。
でも現代っ子はpeak+RMSメータで見ても柔軟にデータをいじれると思います。
これは昔のメーター自体が、エンジニアのクリエイティブの発想の元になっていた、というクオリアを持つタイプの人にとっての弊害を平準化するために生まれたメーター、であるとかないとかの記事が下記で触れられています。
今お使いのメーターでクリエイティビティを阻害されない方は気にしなくていい話かも、です。
ラウドネスについての復習
地味ですが良い動画です。
大音量を目指すのではなく、最初から最も大きいラウドネスを目指して必要な作業を施す、という発想がないとマスタリングによって音楽が劣化してしまうのだ、と明瞭に教えてくれます。
MOMENTARY : 400ミリ秒間のラウドネスの計算値
SHORT TERM : 3 秒間のラウドネス計算値
INTEGRATED : 曲全体のラウドネス値の平均値
ラウドネスの計測はLUFS(ラウドネスフルスケール)という単位になります。

人は高い音と低い音を異なる音量感で聴くために、RMS値のように、どの音域も同じ音量数値で示すと、人間の聴感覚には沿ってくれていない、ためにラウドネス値という別の概念があります。
そしてこのLUFS値がストリーミング再生においては現状重視されています。
下記をご覧ください。
異なる周波数の音が同じ大きさ(音圧レベル)に感じられるための条件を示した曲線です。「等ラウドネス曲線」=フレチャー・マンソン曲線

(引用)
例えば、
100 Hzの音を40フォンに感じるには約60dBSPLの音圧レベルが必要
1000 Hzの音を40フォンに感じるには約40dBSPLの音圧レベルが必要
低い音は、より大きな音圧で鳴らさないと全体が同等な音に聞こえないように人間の耳はできています。
(上記青い線は、古いデータに基づく40フォンのライン、科学の進化とともにこうしたデータも変わります。赤い線はより最近のデータに基づく計算による)
まだ人間が裸足だった頃、人間が生き残るのに敏感に適切に周囲の音を感じ取れるように進化したら、こういう聴感覚のラインを描くところに落ちついた、という程度で理解してください。
これは例えば、RMSメーターでは通常の音量感が出てるのに、聞いててなんかBメロ静かすぎるな、とか感じる場合は、使用されている音高のラウドネスの問題かもしれない、とわかっていれば、そこをいかに処理するかが問題だとわかります。
変に音量だけ上げ下げしても、上記の表に従って考えないと、ここを上げたらこの音割れたし、ここもデカい、みたいな話になります。ミックスはさまざまな音高の音が乱立した結果全体の音量が定まるので、どの音域が小さく感じるか、を考えないといけないんですね。
Tonal Balance Controlなどの音量波形もこの形になっています。これは「低音デカくね?」じゃなく、この波形にしないと、人はバランスの良い音源と感じない、ことを意味しています。
多くのヒット音楽がこの形をしている、ことをこのプラグインは示しています。

・低い音ほど大きくしないと聞こえない
・2k-4kHzは人間が一番敏感な音域なのでこの帯域がうるさいと耳が痛い

(引用;Genx Beats)
2-4kHzに触れるバイオリンとかピッコロとか、ドラム関連の音で耳に痛い時がありますね。
低音が聞こえないからと音をあげればRMS値ではメーター上割れてしまいます。
聞こえ方の問題と、数値上の問題と、いろいろ関わりがあるので、ミックスに戻って再考する必要がある時もあるでしょう。
true peak

Ozoneは初期値では、True peak(楽曲のデータをアナログ信号に変える時、デジタルデータの隙間に消えていたピークカーブがアナログ波形化して、それがデジタルデータのピークを超えることがある、という時の実際の楽曲のオーディオデータの上でのピーク値)を検出しません。現代でのサンプリングの詳細さで、truepeak気にする必要あるんかいな、とか思ってしまうほどですからね。
粗い説明で恐縮ですが、下記の緑点がデジタルデータの認識ポイントである時、この緑デジタルデータをいざ出してオーディオ化(アナログ波形化)した時、波形がカーブを描く時、元々のデジタル値のピークよりも上の位置(より強い音圧)にカーブを描いてしまうと、その飛び出た部分はデジタル時のピーク値よりも大きな音(これが本来の最終ピークの意でtrue peak)ゆえ、いわゆる割れた音になってしまいます。そうするとせっかくばっちりデジタルではミックスできたのに、スピーカーから流したら音が割れてたなんてことが起きます。そこで、あらかじめ赤いポイントを想定して(アナログになった時を想定して)ピーク値を設定するのがtrue peakの思考です。-0.1とかピーク値を低めにするわけです。

このTrue Peak計算表出は現状のクオリティだとCPU負荷があるのと、Ozone自体がTrue peakの-2dbくらいの余裕を見ているためディフォルトではオフになってます。
CPUに余裕がある作業時はonにして作業しても良いです。現代ではtruep peakが発生する、と言うより、単純に元波形がデカすぎ、と言うことがほとんどだと思います。
onにすると0.5dbくらいとか若干上がってピーク分が表示されます。
それを考慮するか、しないか、個人のポリシーにも関わるところです。激しい音楽の場合は多少の割れなんか気にしないと言う人もいますし、それでソリッドな音楽ができることもあります。クリッピングは絶対的悪ですが、それは商業的精神におけるマナーとしての意味が大きいと思います。考え方によっては ギリギリtruepeak割れを狙って''自然なサチュレート"とか言ってしゃがれた音楽を作るという場合もあろうかと思います。
ただ実際に割れてるものは他の視聴環境でどのように割れるか予想がつかないので、いろんな環境で心地よく聞いてもらうためにもデータ上のクリッピングを回避する、というのが理知的ではないでしょうか。

peak値とラウドネスのshort timeを合わせて表示してくれるものもあるようですので、見たい方はこちらを。
こちらではRX内で曲のラウドネスデータを一瞬でオフライン計測した値を数値で確認しながら、曲の最終チェックを行ったり、ラウドネス値をRXで修正する方法について説明してくれています。これ早くて便利です。ここまで書いてきた表示懸念を一瞬で忘れても良いです笑
全部これでいいじゃん、と思うかもですが、レンダリングで音を潰す必要がある場合、歪みやノイズの可能性があり、音質が変わったり、音が痩せたりする恐れがあるので、できる限りミックスでレベルを整えておく、というのが几帳面日本人的繊細思考ではないかと思います。痩せることを想定して全部赤をつけて割ってるんだ、という海外のミュージシャンがいましたが、雇っているわけではないのでもう個人に任せると、としか言えません笑
ソースのステレオ、ミッドサイドについては

通例ステレオで良いです。

ここをmid/sideにすると、それぞれの成分のpeakとRMSが一目瞭然ではあります。
むしろドラムだけとか、ギターだけの時、どう動くかみたいですね。アンサンブルのミックスの時に見たいですね。
option

リファレンス楽曲を読み込んでいる時、ここにチェックをするとリファレンス楽曲のボリュームイメージがinputインジケーターの方に表示されます。
下のshow reference spectrumは初期値でonになってます。リファレンス楽曲のデータを各モジュールで重なってみることができます。そのデータを見たくない時のみこれを外してくだい。

この+、-で目盛りの値を拡大縮小値に変えることができます。
下記はヘルプの画像を引用しています。

Bypass : Ozoneの全設定をバイパス。
Gain Match : 様々なOzone処理の前後の音量感を揃えるオプションです。
Ozoneを通した後の変化感だけを集中して聴き比べることができます。
下記もご覧ください。
3左.Sum to Mono : ステレオ⇆モノラル変換。モノラルにした時バランスが崩れないかを確認する時使います。特殊な効果音や左右に振った音で聴かせたい!と思う音がちゃんとある程度の効能でモノラルになっても機能しているか、なども確認できます。
3右Swap Channels : 左右チャンネル交換。
時折左右を反転して聴くことで、思わぬ違和感に気がついたりします。特に聴き込んでしまった楽曲の作業の行き詰まりにおいて、左右を反転してみると、目立ちすぎる音、寄りすぎる音、音質の違和感、センター周辺の音で左右に微妙によっていた感、センターの音の奥行き感の違和感に気付けたりします。ただやりすぎると両方に慣れてしまい今度はわからなくなるので、あんまりわからなくなりすぎた音源でやると左右反転した方が新鮮に聞こえたりして作業の目処がつきません。
Reference :リファレンス トラックの再生有効/無効
Codec: コーデック プレビュー。
Dither: ディザー処理有効/無効
時折質問がある内容を詳しく書いておきます。Ditherについては次回。
Codecについて
MP3 や AAC などの非可逆オーディオ形式は、音響心理学的アルゴリズムを使用して、オーディオファイルの聞き取りにくい部分を特定して削除し、ファイル全体のサイズを削減します。このプロセスにより、圧縮ファイルに微妙なアーチファクトから明白なアーチファクトまでさまざまなアーチファクトが発生する可能性があります。コーデック プレビューを使用すると、マスターをエクスポートする前に、非可逆圧縮フォーマットを試聴し、それらによって生じる望ましくないアーティファクトを補正できます。
とあります。
つまりWAVやAIFFのデータをmp3をはじめとしたいわゆる「圧縮」によってデータが歪んでしまって、聞こえがおかしくなる場合があるので、それを変換する前にプレビューしておきましょう。という至れり尽くせりな機能です。
丸iマークが電源です。この時Ozoneはマスタートラックの一番最後に挿した状態です。

256kbpsはモノラルの現状の最高レートです。
Solo ArtifactsをオンにするとOzoneから出力された音がコーデックによってどの部分が変化したかの差分だけを聴かせてくれます。これはなかなかすごいボタンです。
変化の目星や比較聞きする時の目安になります。
これであとは変換先のデータをチェックするだけです。
なお、Ozone12ではAACのコーデックプレビューがなくなっています。

ビットレート
mp3の256kbpsというのはそのmp3のファイルを再生すると1秒間に256キロバイト/s(毎秒)処理/転送する、的な意味です。256キロバイトとは、262144バイトのことです。
1バイトは8bitで、1bitは0と1の二つの数字です。
電波ではこれに波の正負を0と1のデジタル情報にして転送します。
現在5Gとか言ってますよね。これは下りで1秒間に5Gバイト/秒のデータを送信できます(ほとんどの状況では5G以下でやり取りされています)。
スマホで動画見れるレベルです。
5Gbps=5,000,000kbpsですから音楽の再生256kbpsなんて余裕ですね。
CDのデータでも1411kbpsです。
通信速度は5Mbps(5000kbps)〜30Mbps(30000kbps)くらいですから、現状はCDサイズのデータだってリアルタイムで聴けるってことですよね。通信費もったいないけど。
計算方法は後で載せます。
このビットレートでは音声をさまざまな理屈で圧縮します。それぞれ目的の圧縮方法で聴こえに問題が生じないか、Codecで確認してください。
・Ozone11の段階では48 kHz以上のAAC/MP3圧縮のリアルタイムリサンプリングはすんごい処理にCPUを使うので、DAWのバッファサイズをあげてください、とのことです。
・mp3やAACなどの"あとでWAV相応のデータ量に戻せない非可逆エンコーダ"は瞬間ピークを増大させてマスキング効果(データ変換後のノイズを打ち消す処理のためにピーク値があがる)に使う場合があるので、-1 dB ~ -1.5 dB落としてください、とのことです。変換後のクリッピングの危険性もこのCodecプレビューで確認することができる、ということで便利ですね!
truepeakを作ってみよう
これは市販されているループ音源です。そのまんまです。

この中の一つのアタックを拡大して

どんどん拡大。

サンプルポイントが見えてきました。

頂点のサンプルのところを押し下げます。

これで灰色のサンプルポイントの間よりも高いtrue peaができました。ラウドネスを計測するのは灰色のポイントの値です。その間の真のピークは計測されません、

こんなふうに拡大されました。上とし側同じ波形の左だけを加工です。ポイントを一つ下げるだけで、周囲の音像に大きな影響を与えていますね。これはもはやノイズだと思います。
その音源がこれ。
0:02ごろにプチって言ってるの分かります?正確には0:02,35ぐらいなのですが。
これをOzoneで通すと、確かにpeakが赤になり+1.1と表示されていますが、RMSは全く反応していません。

ここにマキシマイザーを入れて、truepeakを検出しても-1.0dBまでに抑えるように指示します。

すると当たり前ですが。出力音はpeakもピーク音があった左チャンネルは-1.0がマックスになっています。時間にして1/1000程度の世界のピークに反応し、下記のようにちゃんとリミッター反応がかかっています。

僕よりずっと優秀。
<参考>
dBについて
音質向上ラウドネスマウントは、ふた昔前の音楽理論/DTM/オーディオマウントに似ています。良かれと思ってやってしまうテロです。
民意を高め、真実を切り開きたい、という気迫や責任感ゆえ、多少の犠牲はやむを得ない、というような爆破テロにも感じます。そんなことしなくても民意は自然に流れるべきところに流れるし、それを諸行無常というのだよ。そこに逆らうものが最初に滅ぶ。
特に"身分の高い人"が誤ったことを言うと、下剋上で下のものがここぞとばかり噛みつきます。あなたは間違いを正したい、というよりあなた自身が認められて上に行きたいのですね。浅ましいです。
そで触れ合うも多生の縁、を忘れた傲慢としか思えません。
実は私もネット黎明期、○○警察でした。ちょっと偉い人に噛みついたのです。やり込めた感は気持ちいいのですが、後日、ホームページの著作権に問題がある、といきなり連絡が来て、著作権に抵触すると考えられるデータを全て改変しなければならない大作業にその後1ヶ月追われました。
googleは検索の役に立たないと言われた時代に、誰が私のHPを察知し、通報したのでしょう。
自分の虚栄心を満たす行動は、他の誰かの虚栄心を満たす対象に自分がなってもいいと宣言しているようなものです。
「間違った知識を広めないでほしい」とか「著名人が誤った認識を持つべきではない」という点は気を使ってあげても良い点です。ズボンのチャック空いてますよ?という話ですから。
ネット時代、基本的には自分で考え、自分が信じた答えを持って、それを元に行動すればいいだけです。
少し待てば、情報は大体数にとって有意義なものが勝手に選別されてゆきます。
他者とは持続可能なやり取りを目指し、互いの違いを認めていくやりとりを工夫していきたいものです。
著名人の間違った情報を鵜呑みにする方が愚かなのです。それらは心理学的な錯覚も入り込んでいることは以前書きましたね。私もそういう錯覚をよくするので人に言える立場ではないのですが。
とにかく自分で考えられるようにならないと、そこで救えてもいつか怠惰心がその身を滅ぼします。
著名人は間違いを認めることが難しいです。苦しい立場に置かれているのが著名人という存在です。
だから当人よりも、それを学んだとみられる人にそっと参考意見として自分の意見を「選択肢」として伝えてあげれば誰も傷つきません。あとは選択する個人の責任です。
その2に続きます。

