ハイレゾ音源ファイルのスペックを理解する

ハイレゾ音源ファイルはいくつか流通していますが、違いをご存知でじゃない方が結構いらっしゃるのではないでしょうか。この記事では、音源ファイルのスペックを判断するための基礎的なテクニカルの内容をかいつまんで書きました。

音源のスペックを示す値

まず音源のスペックを理解する上で押さえておきたいのが「サンプリング周波数」と「ビット数」です。

サンプリング周波数

音は連続的な波ですが、デジタル化するためには、ある程度音を細切れにして抽出する必要があります。そのため、人の耳ではわからないくらいの高頻度な間隔で音を抽出します。

サンプリング周波数は、1秒の間に音を抽出する頻度を表します。サンプリング周波数の単位はHz(ヘルツ)になります。この値が大きければ大きいほど音を高頻度で抽出することになるため、音質が良いといえます。

代表的なサンプリング周波数として、8kHz(通常の電話)、16kHz(VoLTE)、44.1kHz(音楽CD)があります。44.1kHzでは、音を1秒間に44100回の頻度で抽出していることになります。

ビット数

音を抽出したら、それをデジタルデータに落とします。デジタルはデータを0と1で表現する世界なので、音も0と1を使ってデジタル化することになります。具体的には、抽出1回分の音を「何桁かの0と1の組み合わせ」でデジタル化していきます。この桁数をビット数と呼びます。この桁数の分だけ、音を段階で表現することができます。値が大きければ大きいほど音質が良いといえます。

これだけだとわかりにくいので、色の場合を想像してみてください。グレイスケールで考えると、2段階であれば白と黒だけ。8段階であれば、白と黒の間に6段階の濃淡が異なる灰色があります。音もこれと一緒です。

音楽CDの場合は、1秒間に44100回の頻度で音を抽出し、それを16桁の0と1で表現します。つまり16ビットです。16ビットだと、32768段階の音の表現が可能です。ちなみに24ビットだと8388608段階、32ビットだと2147483648段階の音の表現が可能です。

たまにハイレゾ音楽のコミュニティで、「44.1kHz/24ビット音源は、CDの44.1kHz/16ビットと比べてたいして良くない」と表現する方がいますが、実際はCDの256倍細かい段階で音が表現できているため、CDとはばかにできないほどの音質の差があります。

変調の違いを理解する

よくハイレゾ音源と一緒くたに扱われますが、デジタル化する方式は2つあります。「パルス符号変調」と「ΔΣ(デルタシグマ)変調」です。両者はサンプリングとビット化の考え方が異なります。

パルス符号変調

一般的によく使われるのはこちらです。パルス符号変調で代表的なファイルフォーマットはリニアPCMになります。このままだと非圧縮でファイルサイズが大きくなるため、通常はFLAC(Free Lossless Audio Codec)やALAC(Apple Lossless Audio Codec)の形式で圧縮され配信されます。

パルス符号変調では、1秒間に音を適度な頻度でサンプリングし、それを適度なビット数でデジタル化します。よく使われるサンプリング周波数、ビット数は以下の通りです。

・サンプリング周波数:44.1kHz, 48kHz, 88.4kHz, 96kHz, 176.8kHz, 192kHz, 352.8kHz
・ビット数:16ビット、24ビット、32ビット

1サンプルあたりのデジタルデータがそれなりのビット数になるということが特徴です。CD音質は44.1kHz/16ビットになり、これより上のスペックはハイレゾ音源という扱いになります。

ΔΣ(デルタシグマ)変調

こちらはマイナー勢力です。学生時代に物理を履修した方であればご存知かと思いますが、音は疎密波になります。ΔΣ変調では、音の疎と蜜を単純に0と1で表現してしまおうという考え方になります。代表的なのはDSD(Direct Stream Digital)になります。

そのため、1秒間に音をものすごい頻度でサンプリングし、1ビット(0か1かのみ)のみで表現します。DSDにおけるサンプリング周波数、ビット数は以下の通りになります。

・サンプリング周波数:2.8Mhz, 5.6MHz, 11.2MHz
・ビット数:1ビット

サンプリング周波数の単位は、kHzではなくMHzです。Mはkの1000倍になるため、いかにサンプリング周波数が大きいかということがわかります。その分ビット数は1になります。あまり普及していませんが、スーパーオーディオCD音質は2.8MHz/1ビットになります。

まとめ

・音源を示すスペックの値には「サンプリング周波数」「ビット数」がある。高ければ高いほど良い。
・音源のデジタル化では「パルス符号変調」「ΔΣ変調」がある。前者はリニアPCM(多くの場合は圧縮される)、後者はDSDで使用される。

いかがでしたでしょうか?ちょっとテクニカルな内容になりましたが、できるだけ砕いた内容で書いてみたつもりです。この記事が、ハイレゾ音源の選定基準の助けになれば幸いです。

コメント

  1. _dolce より:

    特に「デルタシグマ変調」は知らなかっただけに、面白かったです。

    ほんの数年前まではScmpx playerで44.1kHzから48kHzにコンバートしてたなあとか、いろいろ思い出しました。
    ただ、私の頭の中は、まだサンプリング周波数とビットレートの組み合わせでしか動かないため、もうちょっと調べて(計算して)みないといけないようです。

  2. katgum より:

    コメントありがとうございます。反響いただけるのは嬉しいものですね。私はちょうどPCのオーディオに親しんだのはまさにSCMPXでした。

    昔は、HDD容量制約が厳しかったので「如何に低ビットレートで音質を確保できる物を使うか」が重要でしたが、最近はHDDで容量は特に気にせず「如何に音質だけを追求するか」という選択肢が採れるようになったので、エンコーダの質は気にしなくても済むようになり、随分と楽になったものですね。

タイトルとURLをコピーしました