音楽教室運営奮闘記

不定調性論からの展開紀行~音楽と教育と経営と健康と

初心者がDPでOzoneを使いこなすために12〜General Control 1

前回

www.terrax.site

それぞれのモジュールで統一した機能の表記は省いていますので前回以前のページや下記をいつでも参照できるようにしてください。

docs.izotope.com

 

Ozone操作の設定基礎+デジタルの基礎知識の記事その1です。

自分もよく把握していない部分もあるので随時加筆修正いたします。

 

I/Oパネル

I/Oパネル=in/outパネルです。

左がOzoneに入ってきた音の状態=in

右がOzoneを通った音の状態=out

です。

最初の段階で音が小さいから、と、このフェーダーの位置を変える必要はありません。まずはそのままで作業してください。

下記に色々設定について書きますが、本当に不満を感じるまで基本的には初期値のまま使ってOKです。

 

クリップされた入力の例

赤字の値が+になったらクリッピングを示唆しています。

内部では、それらの値もちゃんと鳴らせるような仕組みが働いている場合が多いですが、赤くなれば、Ozone上でも歪んで聞こえている状態になります(音楽によってその顕現に差があります)。

入力または出力信号が 0 dBFS を超えると赤色で表示されます。

赤色部分をクリックするとリセットされます。

ここが赤くならないようにすることでより安全な設定となります。

 

また、フェーダーをいじってもフェーダー玉をクリックすればリセットされます。

多少の瞬間的音量爆発でもプラスにならないようにピークを余裕を持って設定する、というのが基本姿勢ですが、なにぶん耳では聞き取れない「割れ」なので、

・多少プラスになっても気にしない(他の視聴環境では割れることもあるかも)

・絶対ここがプラスにならないようにする(どんな環境でも正常使用で割れる心配が極力減る)

的なそれぞれの個人の信念があると思いますので、そこは経験で自分のポリシーを決めてください。ガンガンプラスになっても音で判別ができないので、マスタリングエンジニアにでも聞かせない限り音の割れは誰にも気が付かれない可能性もあります。

「いや、この割れはサチュレーションさ」

と言われたら返す言葉もない、というのが音楽の世界です。

外国人の友人知人などは、結構赤くなっても気にしません。事実こうしたプラグインの垢は余裕を持て設定されていることが多く、「耳で感じなければ気にしない」タイプの人多いです。私の知人が大雑把な人が多いからかもしれませんが面白いな、と感じます。自分の耳に自信がない、なんて言ってるのは日本人くらいなのかな、と感じます笑。自分など「自分お耳なんて当てになるもんか」とか言って笑われます。

"じゃあーお前生きてる意味ねーだろ”

ぐらいに言われます笑、風俗だなぁ。。

 

本人の信念で数値設定を決めていくことがとても大切です。

ラウドネスノーマライゼーションをそこまで恐れなくても、配信サービスは年々あらゆるトラブルに対して「アップする人が何もしなくてもちゃんとなってる」的な配慮が進化しています。個人でやる人は自分なりに最新の技術情報を勉強してください。

言うれ本当に人間は何もしなくても良くなりそうな進化の勢いです。

現状でもyoutubeやspotify、多くの人が音量、音質気にせず聴けているんじゃないですか?

 

 

 

I/Oオプションから。

基本的にはPeakかRMSまたはPeak+RMSで良いと思います。

peakは瞬間的な音の突出したデータを正確に表示してくれるメーターです。人の耳では聞き及ばない瞬間ピークを記録してくれるので便利です。要はこのピークが割れないように0以下に設定できれば無難です。

 

RMS(root mean square)は平均値(実効値)です。

www.terrax.site

例えば歌のボリュームが1秒ごとに

1,2,3,4,3,2,1

と変化したとします。この時間の流れの平均値をどう計算しますか?という時に用いられる慣例となっているのがRMSです。

まずそれぞれを二乗します。

1,4,9,16,9,4,1

その後全部足します。

1+4+9+16+9+4+1=44

項目数で割ります。

44/7=6.285714...

その平方根を取ります。

2.5071326...

エクセルでも計算できます(参考)。

より正確な値が一瞬で出せます。

なんでこんな計算をするか、というと、音楽の波形は正の値と負の値があるから、

参考

そのままの平均では0になってしまうので、上手に平均が出せるように正の値にして計算できるrmsが利用されていると考えられます。

またこんな感じの7秒間の数値のばらつきがあった時(縦に時間の流れ)における平均値の値の感じ(rmsと書かれた横の値)を見ていただくとRMS平均のニュアンスがイメージできるのではないでしょうか。値が1の時に平均が130.9って判断笑、ちょっとイメージ湧きませんが、rmsでこの7区間を平均したらこうなります。実際はもっと細かい区間を計算するので人が違和感を意識できるような見当違いな値として認識されることはないのですが。

(それぞれのメータープラグインでも若干表示される値が異なることもあります)

だから平均値はあくまで平均値です。

 

これはpeak+RMSにしたときです。赤枠の薄い灰色がpeak値です。濃い灰色がRMS値です。

瞬間的なピークは人間が感じ取れないアナログ波形のスピード/瞬間的に発生したものも記録します。波形の尖った頂点部分です。

人はこのピーク値の時間が短いとその音の大きさを適切に認知できません。RMSのごわっと鳴っているボリューム感が生まれる波形部分の音量感をその部分の音の大きさとして感じてしまうのだそうです。

RMSはこの人間の耳が感じとれるスピード感の認識データを模していると考えてください。VUメーターなども300ms=0.3秒の平均値が表示されます。つまりそれ以下の時間感覚で大きい音が瞬時に発せられても、適切に感じ取れないのです。メーターの方ではそれが明らかに記録されるので、そういう人が認識しづらい尖ったピークを感覚ではなく、視覚的データとして正確に把握する必要が出てきたんですね。

人間が認識しづらいんだから、放っておけばいいじゃないか、と言うかもしれないですが、機械はそのピークを認識して、全体の音量も大きい、と認識してサブスクサーボスなどで自動的に切り詰めてしまう場合が出てしまうので、ミックス段階で尖ったピークを抑える必要があるんです。

でもこの認識と技術も今後進化しそうですね。

認識できないなら、一般の人は気にしないから、ラウドネスに影響を与えないデータとして任意に切り捨ててくれるから、「もうエンジニアはtrue peakを気にする必要はないです」という日がすぐきそうです。

 

 

この歯車マークからi/Oオプションも変えられます。

10(ppm)とは10ミリ秒=0.01秒のピークプログラムメーターとしての値、という意味だと思います。CPUも食います。300(VU)というのは今述べた、300ms(VUメーターの針の値ですよ)という意味です。

VUメーター表示例です。ここにもVUとPPM等の切り替えができます。

また下記にてピークの値を何秒表示するかも設定できます。これは計算した値を表示し続ける時間のことです。設定してみればわかります。大きくすればするほど、それまでの時間で最大の値を表示し続けます。

 

 

K-systemはBob Katz氏提案のメーターです。peak値に心理的にとらわれないような設計とのことで、メータに左右されすぎて落ち着かない人でK-ystemが見やすい、という方はお使いください。

でも現代っ子はpeak+RMSメータで見ても柔軟にデータをいじれると思います。

 

これは昔のメーター自体が、エンジニアのクリエイティブの発想の元になっていた、というクオリアを持つタイプの人にとっての弊害を平準化するために生まれたメーター、であるとかないとかの記事が下記で触れられています。

www.izotope.com

 

今お使いのメーターでクリエイティビティを阻害されない方は気にしなくていい話かも、です。

 

ラウドネスについての復習

www.youtube.com

www.youtube.com

地味ですがとても良い動画です。

大音量を目指すのではなく、最初から最も大きいラウドネスを目指して必要な作業を施す、という発想がないとマスタリングによって音楽が劣化してしまうのだ、と明瞭に教えてくれます。

 

MOMENTARY : 400ミリ秒間のラウドネスの計算値

SHORT TERM : 3 秒間のラウドネス計算値

INTEGRATED : 曲全体のラウドネス値の平均値

ラウドネスの計測はLUFS(ラウドネスフルスケール)という単位になります。

人は高い音と低い音を異なる音量感で聴くために、RMS値のように、どの音域も同じ音量数値で示すと、人間の聴感覚には沿ってくれていない、ためにラウドネス値という別の概念があります。

そしてこのLUFS値がストリーミング再生においては現状重視されています。

 

下記の青字のラインのように20ホンの1000Hzの音が低い音を高い音と同じような音量に感じるには、音量を変える必要があります。

(引用)

人間の耳が生きるのに必要の音を敏感に適切に感じ取れるように進化したら、こういう聴感覚のラインを描くところに落ちついた、という程度で理解してください。

これは例えば、RMSメーターでは通常の音量感が出てるのに、聞いててなんかBメロ静かすぎるな、とか感じる場合は、使用されている音高のラウドネスの問題かもしれない、とわかっていれば、そこをいかに処理するかが問題だとわかります。変に音量だけ上げ下げしてもこっちが割れて、ここが出ない、みたいな話になります。

Tonal Balance Controlなどの波形もこの形になっていますね。多くの音楽がこの形をしている、ことを意味しています。

・低い音ほど大きくしないと聞こえない

・2k-4kHzは人間が一番敏感な音域なのでこの帯域がうるさいと耳が痛い

(引用;Genx Beats)

2-4kHzに触れるバイオリンとかピッコロとか、ドラム関連の音で耳に痛い時がありますね。

低音が聞こえないからと音をあげればRMS値ではメーター上割れてしまいます。

聞こえ方の問題と、数値上の問題と、いろいろ関わりがあるので、ミックスに戻って再考する必要がある時もあるでしょう。

 

true peak

Ozoneは初期値では、True peak(楽曲のデータをアナログ信号に変える時、デジタルデータの隙間に消えていたピークカーブがアナログ波形化して、それがデジタルデータのピークを超えることがある、という時の実際の楽曲のオーディオデータの上でのピーク値)を検出しません。現代でのサンプリングの詳細さで、truepeak気にする必要あるんかいな、とか思ってしまうほどですからね。

例えば、ですが。下記の緑点がデジタルデータの認識ポイントである時、アナログの波形は、オーディオ化の際にカーブを描くためデジタル値より上にカーブを描いた時を想定して、赤いポイントを想定してピーク値を設定しておかないとデータ上割れてしまう可能性がある。-.0.1とかピーク値を想定して設定します。

このTrue Peak計算表出は現状のクオリティだとCPU負荷があるのと、Ozone自体がTrue peakの-2dbくらいの余裕を見ているためディフォルトではオフになってます。

CPUに余裕がある作業時はonにして作業しても良いです。現代ではtruep peakが発生する、と言うより、単純に波形が大きい、と言うことがほとんどだと思います。

 

onにすると0.5dbくらいとか若干上がってピーク分が表示されます。

それを考慮するか、しないか、個人のポリシーにも関わるところです。

peak値とラドネスのshort timeを合わせて表示してくれるものもあるようですので、見たい方はこちらを。

www.youtube.com

www.youtube.com

こちらではRX内で曲のラウドネスデータを一瞬でオフライン計測した値を数値で確認しながら、曲の最終チェックを行ったり、ラウドネス値をRXで修正する方法について説明してくれています。これ早くて便利です。ここまで書いてきた表示懸念を一瞬で忘れても良いです笑

全部これでいいじゃん、と思うかもですが、レンダリングで音を潰す必要がある場合、歪みやノイズの可能性があり、音質が変わったり、音が痩せたりする恐れがあるので、できる限りミックスでレベルを整えておく、というのが几帳面日本人的繊細思考ではないかと思います。痩せることを想定して全部赤をつけて割ってるんだ、という海外のミュージシャンがいましたが、雇っているわけではないのでもう個人に任せると、としか言えません笑

 

ソースのステレオ、ミッドサイドについては

通例ステレオで良いです。

ここをmid/sideにすると、それぞれの成分のpeakとRMSが一目瞭然ではあります。

むしろドラムだけとか、ギターだけの時、どう動くかみたいですね。アンサンブルのミックスの時に見たいですね。

 

option

リファレンス楽曲を読み込んでいる時、ここにチェックをするとリファレンス楽曲のボリュームイメージがinputインジケーターの方に表示されます。

下のshow reference spectrumは初期値でonになってます。リファレンス楽曲のデータを各モジュールで重なってみることができます。そのデータを見たくない時のみこれを外してくだい。

 

この+、-で目盛りの値を拡大縮小値に変えることができます。

 

下記はヘルプの画像を引用しています。

ラベルが付いたグローバルセクション

Bypass : Ozoneの全設定をバイパス。

 

Gain Match : 様々なOzone処理の前後の音量感を揃えるオプションです。

Ozoneを通した後の変化感だけを集中して聴き比べることができます。

下記もご覧ください。

www.youtube.com

 

3左.Sum to Mono : ステレオ⇆モノラル変換。モノラルにした時バランスが崩れないかを確認する時使います。特殊な効果音や左右に振った音で聴かせたい!と思う音がちゃんとある程度の効能でモノラルになっても機能しているか、なども確認できます。

3右Swap Channels : 左右チャンネル交換。

時折左右を反転して聴くことで、思わぬ違和感に気がついたりします。特に聴き込んでしまった楽曲の作業の行き詰まりにおいて、左右を反転してみると、目立ちすぎる音、寄りすぎる音、音質の違和感、センター周辺の音で左右に微妙によっていた感、センターの音の奥行き感の違和感に気付けたりします。ただやりすぎると両方に慣れてしまい今度はわからなくなるので、あんまりわからなくなりすぎた音源でやると左右反転した方が新鮮に聞こえたりして作業の目処がつきません。

 

Reference :リファレンス トラックの再生有効/無効

Codec: コーデック プレビュー。

Dither: ディザー処理有効/無効

時折質問がある内容を詳しく書いておきます。Ditherについては次回。

 

Codecについて

MP3 や AAC などの非可逆オーディオ形式は、音響心理学的アルゴリズムを使用して、オーディオファイルの聞き取りにくい部分を特定して削除し、ファイル全体のサイズを削減します。このプロセスにより、圧縮ファイルに微妙なアーチファクトから明白なアーチファクトまでさまざまなアーチファクトが発生する可能性があります。コーデック プレビューを使用すると、マスターをエクスポートする前に、非可逆圧縮フォーマットを試聴し、それらによって生じる望ましくないアーティファクトを補正できます。

とあります。

つまりWAVやAIFFのデータをmp3をはじめとしたいわゆる「圧縮」によってデータが歪んでしまって、聞こえがおかしくなる場合があるので、それを変換する前にプレビューしておきましょう。という至れり尽くせりな機能です。

 

丸iマークが電源です。この時Ozoneはマスタートラックの一番最後に挿した状態です。

256kbpsはモノラルの現状の最高レートです。

Solo ArtifactsをオンにするとOzoneから出力された音がコーデックによってどの部分が変化したかの差分だけを聴かせてくれます。これはなかなかすごいボタンです。

変化の目星や比較聞きする時の目安になります。

これであとは変換先のデータをチェックするだけです。

 

ビットレート

mp3の256kbpsというのはそのmp3のファイルを再生すると1秒間に256キロバイト/s(毎秒)処理/転送する、的な意味です。256キロバイトとは、262144バイトのことです。

1バイトは8bitで、1bitは0と1の二つの数字です。

電波ではこれに波の正負を0と1のデジタル情報にして転送します。

現在5Gとか言ってますよね。これは下りで1秒間に5Gバイト/秒のデータを送信できます(ほとんどの状況では5G以下でやり取りされています)。

スマホで動画見れるレベルです。

5Gbps=5,000,000kbpsですから音楽の再生256kbpsなんて余裕ですね。

CDのデータでも1411kbpsです。

通信速度は5Mbps(5000kbps)〜30Mbps(30000kbps)くらいですから、現状はCDサイズのデータだってリアルタイムで聴けるってことですよね。通信費もったいないけど。

minsoku.net

計算方法は後で載せます。

 

このビットレートでは音声をさまざまな理屈で圧縮します。それぞれ目的の圧縮方法で聴こえに問題が生じないか、Codecで確認してください。

 

・Ozone11の段階では48 kHz以上のAAC/MP3圧縮のリアルタイムリサンプリングはすんごい処理にCPUを使うので、DAWのバッファサイズをあげてください、とのことです。

・mp3やAACなどの"あとでWAV相応のデータ量に戻せない非可逆エンコーダ"は瞬間ピークを増大させてマスキング効果(データ変換後のノイズを打ち消す処理のためにピーク値があがる)に使う場合があるので、-1 dB ~ -1.5 dB落としてください、とのことです。変換後のクリッピングの危険性もこのCodecプレビューで確認することができる、ということで便利ですね!

 

truepeakを作ってみよう

これは市販されているループ音源です。そのまんまです。

この中の一つのアタックを拡大して

どんどん拡大。

サンプルポイントが見えてきました。

 

頂点のサンプルのところを押し下げます。

 

これで灰色のサンプルポイントの間よりも高いtrue peaができました。ラウドネスを計測するのは灰色のポイントの値です。その間の真のピークは計測されません、

 

こんなふうに拡大されました。上とし側同じ波形の左だけを加工です。ポイントを一つ下げるだけで、周囲の音像に大きな影響を与えていますね。これはもはやノイズだと思います。

 

その音源がこれ。

0:02ごろにプチって言ってるの分かります?正確には0:02,35ぐらいなのですが。

 

これをOzoneで通すと、確かにpeakが赤になり+1.1と表示されていますが、RMSは全く反応していません。

ここにマキシマイザーを入れて、truepeakを検出しても-1.0dBまでに抑えるように指示します。

すると当たり前ですが。出力音はpeakもピーク音があった左チャンネルは-1.0がマックスになっています。時間にして1/1000程度の世界のピークに反応し、下記のようにちゃんとリミッター反応がかかっています。





 

<参考>

dBについて

www.izotope.com

<参考>dBがつく単位の歴史

www.sizes.com

音質向上ラウドネスマウントは、ふた昔前の音楽理論/DTM/オーディオマウントに似ています。良かれと思ってやってしまうテロです。

民意を高め、真実を切り開きたい、という気迫や責任感ゆえ、多少の犠牲はやむを得ない、と爆破テロさえ厭いません。

"身分の高い人"が誤ったことを言っていると、下剋上で下のものが噛みつきます。

私もネット黎明期、○○警察でした。ちょっと偉い人に噛みついたのです。やり込めた感は気持ちいいのですが、後日、ホームページの著作権に問題がある、といきなり連絡が来て、著作権に抵触するのもは全て改変しなければならない大作業に追われました。googleは検索の役に立たないと言われた時代に、誰が私のHPを察知し、通報したのでしょう。結局やり合いになり荒んだ気持ちで日々を送ることになります。

「間違った知識を広めないでほしい」とか「著名な人が誤った認識にある」という点を言わなくてもいいんです。正しいと思う情報を自分で考えない方が悪いんですから。

そして少し待てば、情報は大体数にとって有意義なものが勝手に選別されてゆきます。

持続可能なやり取りを構築し、理解を深めていくやりとりに集中頂きたいです。

 

そで触れ合うも多生の縁、を忘れた傲慢としか思えません。

これはすなわち、自分が今ある状況に感謝を感じていないから見知らぬ他人に噛み付くのだ、と感じます。

 

その2に続きます。

www.terrax.site