So-net無料ブログ作成

耳・・・・・のつづき [感想]

アナログ信号(音声)をデジタル信号(音声)に変換するというのは・・・・・

横軸→を時間、縦軸↑を音の大きさ、つまり振幅にとるグラフを考えると、
一定時間ごとにその瞬間の振幅をサンプリングすることですよね。

つまり、波、たとえば正弦波のグラフに等間隔な方形の網目を
オーバーラップさせたイメージで、
その網目の交点に一番近い値に
置き換えていくというイメージがわかりやすいでしょうか。
Image_of_Sampling_Quantization.png
その一定時間→をサンプリング周期といい、
その逆数がサンプリング周波数ですね。
振幅方向の等間隔の分割↑を量子化などといったりします。

縦軸方向↑の話しですが、
図1の場合、鳥渡見難いですが、赤い線をよく見ると、
サインカーブを突き破ったり、足りなかったりと、
サイン波形に忠実ではなく、
一定間隔の階調↑(量子化深度っていったりします)に
合わせるとずれてきますよね。
これが、量子化誤差っていうやつです。
量子化の階調数(深度)が低いと誤差が大きくなるは想像し易いですね。
音声データで言えば量子化誤差はノイズとなってあらわれます。
量子化の深度が高い、深い、細かくなるほど
誤差によるノイズは小さくなります。
(吉野家みたいだね~ とかゆうとりますけど、全然違いますよぉ)
(って誰のフレーズ?)[ふらふら]

音楽CDの場合、
リニアPCMなんて言葉をお聞きになったことがあるかもしれません。
リニアとは文字通り直線的ということで圧縮をしない状態を指します。
聞こえにくい部分も削らない、まったくもって削らない
とでも言った方がいいかもしれません。
PCMはPulse Code Modulationの略ですよね。
図1のように一定間隔のパルスに置き換え、
かつパルスがそれぞれの大きさにコード化されてますよね。
Mは変調ですが、対象物を
ある目的の為に加工変換することに他ならないですよね。

それ~から、こんどは横軸方向→についてです。
っでっ、サンプリング周波数が44.1kHzなので、
約100分の2.27秒のさらに1000分の1秒の間隔で
サンプリングしてるんですね。
めちゃめちゃ忙しいですね。[あせあせ(飛び散る汗)]

で~も、アナログ信号をデジタル信号にする際に、
アナログの情報を完全に取り込むためには、
アナログ信号の最高周波数の少なくとも2倍の周波数で
サンプリングしなければなりません。
これをナイキストの定理とかシャノン・染谷の定理といいます。
頭で考えて予想した方や証明した方ってエライですね。[わーい(嬉しい顔)]

そして、CDの量子化のビット深度数は16bitですよね。
これは2の16乗=65536階調で振幅↑を区切っていることになるんですね。
たぶん、CDはsigned(符号付き)16bitなので、
正の値だとその半分の32768階調ですね。


音というのは空気の縦振動ですね。
つまり伝わる方向に空気が押されたり引かれたりして伝わりますね。
その大きさは、圧力として、だから音圧と呼ばれるんですね。
で音圧の単位はデシベル[dB]ですね。
なぜか基準が20μPa=20μN/m2になってます。
μはマイクロで10-6=0.000001のことですね。
ちなみに、平均の大気圧はよく天気予報でも1013hPaといいますよね。
hはヘクト、102=100ですよね。
正確には標準大気圧は1013.25hPaで、
昔はmbar、ミリバールという単位を使っていたので、
大気圧の数字の桁を変更しない為にhを使ってるんですね。
この基準がギリギリ聞こえる音圧なんでしょうかね。

大きさが2倍の音というのを考えてみますと、
20×log10(2倍)・・・・・・・・①
ここで、以前の記事『対数の暗算?』がお役に立ちます。
①は常用対数ですので、log102≒0.30103(覚え方:沢岩さん)です。
っでっ、20×0.30103≒6.02
よって2倍でかい音①はデシベルで表すと約6dBということになりますね。

よくダイナミックレンジ(DR)という言葉を聞いたことがあるかもしれません。
これはとにかく比較するものであれば定義できるんでしょうが、
音で言えば、やっと聞こえる音から、
これ以上は大きくなっても変わらないと感じるまでの音圧の範囲のことです。
って、どんなんでしょう?
大きすぎて感覚が麻痺するのか、鼓膜が破れて聞こえなくなるのか、
わかりませんが、その音圧の比のことですね。

また、ダイナミックレンジとはちょっと違いますが、似たもので、
ダイナミックレンジと同じと考えてもいいかもしれませんが、
S/N比(Signal to Noise Ratio SNR 信号対雑音比)
というのも聞いたことがあるかもしれません。
雑音など、ノイズに対しての目的の音などの信号の比です。

すんっごぉいマイクでS/N比が120dBぐらいだそうです。
人間の耳は優秀でございまして、
だいたいDRが120dB~130dB強or140dB弱ぐらいといわれています。
(後半はかなり幅があるなぁ[むかっ(怒り)][パンチ])

そしてCDは量子化深度1bitに対して音圧が2倍になる、
っといろんなサイトで書いてありましたが、
どうしてなんだろうと考えると、
2bitって22=4ですよね。
1bitって21=2ですね。
ただ単に、2bit:1bit=4:2=2:1
とそれだけのことでした。
3bitと2bit、4bitと3bit…も2倍ですよね。
あたりまえかぁ~◎┳z
っでCDは、正の値の部分で
0~+32768の範囲(=215)だとすると、15(bit)×約6dBで
約90dBのダイナミックレンジがあるということになります。

これは20×log10Ⅹ≒90・・・・・・・・②
この②を変形すると、
Ⅹ≒1090/20=4.5
ということですよね。
このⅩを満たす値がだいたい32000倍ということですね。
あとの為に②の対数の底を変換しておきます。
log10Ⅹ=log2Ⅹ/log210
logBA=logCA/logCB
よって②は
log2≒90/20×log210
=9/2×log210
=9/2×log1010/log102
=9/2/log102
logAA=1
ここで、log102は以前の記事『対数の暗算?』より
沢井は憎く旧語呂無策や または 沢岩さん
でしたから、
log2≒9/2/0.30102999566398・・・・・
≒14.948676426993・・・・・
≒14.95
Ⅹ≒214.95
となります。

って、これまたややこしくしてますが、
もともと90という数字は15(bit)×約6dBからきてます。
これをもとのくわしい値に直すと、
15(bit)×約6dB=15×20×log102
これが②の右辺になりますね。
②⇔
20×log10Ⅹ=15×20×log102

log10Ⅹ=15×log102

log10Ⅹ=log10215

Ⅹ=215
量子化bit深度とダイナミックレンジはおなじ
ということですよね。
本末転倒のような感じですね。

ダラダラとつづきましたが、結局、
CDさんはやっと再生できる音の
約32768倍大きな音まで記録できるんですって。
これはこれでCDさん、すごいですね。
っがぁ、
DVDさんは24bitなので、23bitとすると約8388608倍になって
人間さんに肉薄しておりまして、もっとも~っとすご~いです。
っがぁ、
ここまで、DVDのスペックを余すところなく再現するor再現できる
機械が存在しないんじゃないのぉ?
っでぇ、
百万倍~一千万倍弱ものダイナミックレンジがある
人間さんのお耳もスゴぉすぎですね。[がく~(落胆した顔)]


この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。

×

この広告は1年以上新しい記事の更新がないブログに表示されております。