※本記事は、2014年に公開した記事を基に加筆・修正したものです。
音とはなにか?
音とは物体の響きや話し声といった「振動」が空気などの媒体をつたわって伝播していくものです。空気の場合、平均の圧力である大気圧を基準として「高い」と「低い」部分が、波として伝わっていく現象が「音」の正体です(水や、金属等でも音はつたわります)
空気には重さがあり、これも振動が「波」として伝わるという現象と大きく関わっています。これはちょうどバネが伸び縮みする性質に似ていますね。
あくまでイメージ
時間あたりの振動の波の数を「周波数」とよんでいます。
私達は鼓膜の振動によってそれを感じているわけですが、人間に感じられる周波数の幅は限られており、耳には聞こえない高周波・低周波というものがあります。
(※)【参考】水中は空気中より5倍近く速く音が伝わるのですね
- 空気中を伝わる音の速さ:340メートル/秒(温度や気圧で変化する)
- 水中を伝わる音の速さ:1500メートル/秒
- 鉄を伝わる音の速さ:5950メートル/秒
なぜケーブルで音が伝わるのか?
あまりに当たり前のことなので普段は気にしませんが、よく考えると不思議ですよね?
電気(交流電流)も実は同じ「波」、、ということは、、、
と思いついた人は凄いですが、実際に「エレキ・ギター>オーディオ・ケーブル>アンプ(スピーカー)」という接続においては
ということが行われているのです。
ちなみにこの電気信号ですが、これにもちゃんと速度があります。したがってギター>ケーブル>アンプ(スピーカー)という過程では実はごく僅かな遅れが生じています。しかしこの電気信号は(信号が通過する媒質によって異なりますが)光の2分の1程度といったとてつもなく速いスピードなので「ほぼゼロ」として扱われる場合が多いのですね。
マイクやスピーカーも同様の原理で「空気振動<=>電気信号」という変換を行っているのですね。
(ダイナミック)マイクの場合

【関連記事】【今さら聞けない用語シリーズ】デジタルとアナログ、サンプリングって何?
エジソンが発明(実用化?)した蓄音機は、集音器(ホーン)から入ってくる音の振動を、直接レコード(当時は蝋管:ろうかん、ろうを円筒状にしたもの)の溝に刻むという方法で音を記録する大発明だったわけですね。
「・・と言われてもイマイチ納得できない!」という方は・・百聞は一見に如かず・・ぜひコレをお試しください!
な・なんと「あなたの声をろうそくやチョコレート(!)に録音できる」そうですよ楽しそう〜
アナログ盤レコードも原理ままったく同じです。
波形
波形は音波だけでなく、電磁波などさまざまな「波動」の伝わり方を表すものです。音の波を表す波形の場合は、横軸が時間的な変化を、縦軸が量(大きさ)を表します。下記の図は音を波形編集ソフトで表示したものです。このように「音」を目で確認できるのは便利ですね。
波形の例:音楽を波形表示

この波形を見て「これは、アシュケナージのラフマニノフピアノ協奏曲2番ですね」と答えることができたらスゴイことですが、さすがにそれは無理でしょう。しかし楽器単体だとなんとなく見当がつくようになるものです・・・なんとなくですが・・・
ベース・・そう言われてみるとそんな気もする・・
バスドラム・・確かに打楽器っぽいですね
ピアノ・・減衰している雰囲気は伝わるような・・・ちなみにステレオファイル(左右)の場合は、このように波形が2つで1セットになります。
データ・サイズはモノラルの倍になります。
ここでは雰囲気だけつかんでいただければ結構です。
音の三要素
- 音の高さ
- 音色
- 音量
これが音の3要素といわれています。シンセサイザーはこの音の三要素を自由にコントロールして音色を作ることができる楽器というわけですね。
音の高さ
1秒あたりの「周波数」はHz(ヘルツ)という単位で表すことができます。
これは20Hzの音。この図の表示範囲はちょうど1秒になります。

1秒間に波形の山が上下する1周期、コレ↓

この山と谷が一組になったものが、1秒でどれだけ振動するかで周波数が決まるわけです。上記の図の場合は1秒間に20個あるのでこれは「20Hz(ヘルツ)」
もし1秒間に20,000回だと20,000Hz。2万ヘルツは20kHz(キロヘルツ)ともいいます。※図では2万も波形を表示できないので一部表示

そして人間が聞くことのできる周波数は15Hz~20,000Hz(20kHz)といわれています。この範囲以外の音ですが、低いものは振動として「感じ」られ、高いものは超音波と言われる場合があります。
ちなみにコレは1,000Hz=1kHz~色々なサウンドチェックで使われます。
なお「15Hz~20,000Hz(20kHz)」という周波数帯域を「可聴域」といいます。可聴域には個人差があり、またこれは年齢で変動します。たとえば20代を過ぎる辺りから、人は徐々に高域が聞こえなくなってくるのですね(泣)
「モスキートーン」という音がありますが、これはある年代以上の人には聞こえない高周波を利用したものです。
音色
例えば先ほどの波形の図示した音は純音と呼ばれており、波の形(波形)は「正弦波(サイン波)」といいます。聴力検査やNHKの時報で使われている「ポー(ピー)」もサイン波です。
非常にシンプルな見た目のこの純粋なサイン波は、実は自然界にはほぼ存在しません。
私達が普段耳にする楽器や音楽、騒音等はもっともっと複雑な音色を持っているのです。そして見た目も複雑です、こんなふうに・・・

これほど複雑な音色の違いを私達の耳は普段から聞き取ってくれているのですね・・・これはスゴイことです。
聴力検査:125~8,000Hz 程度の範囲で数種類の「ポー」を聞きとります(高い周波数が聞こえなくても日常生活に支障はないわけですね)
NHKの時報:「ポ・ポ・ポ・・ピー」・・・440Hz(中央ラ)と 880Hz(オクターブ上のラ)
アナログシンセサイザーの場合
アナログ・シンセサイザーだと「ノコギリ、サイン、矩形」といったこの元になる波形タイプが用意されていて、それを元に音色を作る仕組みになっています。

ノコギリ波

矩形波(くけいは)

【サイン波 ~ ノコギリ波 ~ 矩形波 聴き比べ】
これらの波形ですが、それぞれ
- サイン波:フルート系
- ノコギリ波:バイオリン系
- 矩形波:クラリネット系
のような音色イメージが感じられませんか?
そしてシンセサイザーではフィルターという機能で音色を変化させていきます。
シンセサイザーで音色を加工する際にもフィルターは大活躍(中央に見える大きいノブがフィルター・カットオフ)
ただ、アナログシンセの場合、音色作成は基本フィルターで「削る」だけなので、複雑な波形は生み出すことが困難です。
音量
音量は「音の強さ」をあらわすもので、音によって生じる「音圧」と密接な関係があります。単位はdB SPL(デシベル・エスピーエル:略して単にdBと呼ばれる場合が多い)です。
【関連記事】
【知っておくと便利な用語】音の強さ、大きさ、音圧、dB(デシベル)
下図の上下の波形は元々同じ音なのですが、下の波形の「音量」が大きくなっています。つまり波形で見た場合、縦幅が大きいほど音量が大きいということがお分かりいただけると思います

★
以上駆け足ですが「音の基本知識」でした。
ところでアコースティック楽器の場合は「音の三要素」は時間的に複雑に変化していくのが普通です。
例えばピアノの場合は最初にハンマーで弦を叩く「ゴン(?)」というアタック音が入り、弦の振動音も徐々に弱くなっていくわけですから、明らかに最初と最後の方では音色が異なるわけですね。ノコギリ波や矩形波等を基音とするアナログシンセサイザーでは、こうした複雑な時間的音色変化を生み出すことは難しいので、リアルなアコースティック楽器音色をアナログシンセでシミュレーションするのは非常に大変なのです。
そこでリアルなアコースティック楽器音色を演奏するには「サンプリング」という技術を使用した「PCM音源」内蔵のデジタル・シンセサイザーが必要になってくるわけですが・・・「サンプリング」や「PCM音源」に関しては別記事を御覧ください。
この記事を書いた人

デジランド・デジタル・アドバイザー 坂上 暢(サカウエ ミツル)
学生時代よりTV、ラジオ等のCM音楽制作に携り、音楽専門学校講師、キーボードマガジンやDTMマガジン等、音楽雑誌の連載記事の執筆、著作等を行う。
その後も企業Web音楽コンテンツ制作、音楽プロデュース、楽器メーカーのシンセ内蔵デモ曲(Roland JUNO-Di,JUNO-Gi,Sonic Cell,JUNO-STAGE 等々その他多数)、音色作成、デモンストレーション、セミナー等を手がける。





