• English
  • サイトマップ

技術解説 - 音声圧縮技術

「CDの音楽を圧縮してパソコンにためる」、「圧縮音楽をインターネット経由で購入する」と聞いたことがありませんか?
この「音楽を圧縮する」とは一体どういうことを言っているのでしょうか。
ここでは、音楽などの音声を圧縮するときに、どのようなことをしているのか見てみましょう。

「音声を圧縮する」って何?

CDのデジタル音声信号は、1秒につき44100個のデータを並べることで音声波形が表現されています(これをサンプリング周波数44.1kHzと表します)。単純にこのデータ数を半分に減らせばデータサイズも半分にすることができますが、音質は悪くなってしまいます。

音声圧縮技術

そこで、音声圧縮技術では、人の聴覚特性を利用したり様々なデジタル信号処理技術を利用することで、音質をほとんど損ねることなくデータサイズを小さくすることを実現しているのです。

こんにちは。
ここからは、私が簡単に技術の内容を説明しましょう。

文字を例にした圧縮技術解説

最初のひらがなの文章と、漢字を交えた文章を比較してみてください。
あまり意味のない文を省略したり、漢字を使ったり、短い言葉に置き換えることで、元の文章の意味を変えずに文字数が少なくなっていますね。
音声の圧縮でも、このように無くなっても困らない情報を省略したり、短いデータに置き換えることで、データサイズを小さくできます。


では、音声を圧縮する場合に無くなっても困らない情報とは何でしょうか。
それは人にとって「聞こえにくい音」です。音声圧縮技術では、そのような聞こえにくい音をそのまま記録せずに、他の音に変えたり、または音を消したりすることでデータサイズを小さくしているのです。


例えば、駅のホームに電車が入ってくるととてもうるさく、小さな声で話をしても、何を言っているのか聞き取ることができません。

音楽も同様で、たくさんの音が鳴っている中で小さな音が鳴っても、そこにはあまり注意がいかないものです。
そのような音は、ちょっと違う音になったり、または音がなくなったりしても、その違いはよくわかりませんよね。

電車のホームの図

また、こんな例はいかがでしょう。
皆さんはミカンを食べる時、皮をむいて食べますね?
つまり皮はミカンの一部ですが、食べる時には不要です。音楽を圧縮する場合も同じです。音楽をミカンに例えると、音楽全体という意味では中身と皮の両方から成り立っていますが、音楽を聴くという意味では、中身だけあれば良いのです。「聞こえにくい」=「無くなっても困らないもの(皮)」を取り除くことで、データサイズが小さく出来るのです。

ミカンによる解説