初めに

オーディオインターフェイスをなんとなく理解している人がいますが、ほとんどの方が正確にちゃんと理解していないため、使い方を間違えていたり、正確に音声のポテンシャルを活かしきれていない現場がたくさんあることに気が付きました。

今回は、インターフェイスの構造と技術がどのようにコンピュータと音声をやり取りしているのか、をめちゃくちゃ詳しく解説していく予定です。

また、以下を読む前に前作の映像音声の制作の仕方を読んでおくと良いかもしれません。

世界的にシェアを誇る AVID の新型 AD/DA コンバーター お値段なんと 8ch AD/DA 付きで 100万円〜

オーディオインターフェイス概要

オーディオインターフェイスは簡単に言うとアナログの音声信号をデジタルデータに変換しコンピュータに記録させ、その記録したデジタル信号をアナログの音声信号に変換してスピーカやヘッドフォンに出力させる機器です。良い音を録りたい、良い音で聞きたい、という場合はここの予算をケチってしまうと、高音質録音や高音質再生が不可能になります。

結構勘違いされがちですが、高ビットデプスや高サンプルレートで収録しているから音質がいい、というのは イコール 関係になりません。それなりに比例した関係性を持ってはいますが、ちゃんとしたインターフェイスでないかぎり 高ビットデプス 高サンプルレート 収録する利点は殆どありません。容量の無駄です。

コンピュータオーディオの基礎

自然界に存在する音は アナログ です。これを Analog Digital Conversion (ADC と言ったりアナログ・デジタル変換という) して デジタルデータ にします。そしてソフトウェアを使い、コンピュータまたはデバイス上の記録メディア上に保存します。この時必要なものがマイクです。アナログの空気振動を微弱な電圧に変えてこれをオーディオインターフェイスの ADC に送り、ADC はその微弱な電気信号を デジタルデータ へと書き換えています。

再生はその逆で、デジタルデータ を Digital Analog Conversion (DAC [ダック] という名称で有名) してスピーカやヘッドフォンが扱える電気信号 (アナログ信号) に変換してから出力します。このとき DAC から出力される信号は微弱なため、スピーカだけでは音声が上手く再生されません。ですからアンプが必要になってきますがこれは別の話ですので今回は説明しません。

実際の オーディオコンバータ はチップでオーディオインターフェイスの基板上に必要なチャンネル分搭載されいる。

アナログからデジタル、デジタルからアナログへ

音声信号をアナログからデジタルへ変換する場合には、いろいろな技術が使われいます。これらの技術概論を理解していないと、音質の向上や音声の扱い方を理解できなくなります。特に AD/DA の構造や変換方式を理解していないと音質の劣化を生む原因を知らず知らず行っていることがあります。

標本化定理とサンプリング周波数

標本定理とは、簡単に説明すると人間はアナログの情報をデジタルに変換した場合「2倍の情報量がないと再構築できない、ちゃんと人間がそれを認識できない」というものです。今スタンダードな動画の fps は 30 ですが、人間は 15fps くらいでこの世界を捉えていると言われています。しかし、15fps の映像をみると明らかにカクカクした映像を認識できる思います。デジタル化において人間に違和感なく認識させるためには、情報は2倍 (30fps) 必要ということになります。

音声のサンプリング周波数は現在、映像分野でのスタンダードは 48kHz です。単純に考えると 48kHz のサンプリング周波数であれば、48,000Hz までの音声信号を記録できそうな感覚がありますが、先程説明した標本定理から 48kHz の場合、その半分 24,000Hz までの音声信号しか記録できません。

そして音声の AD/DA 変換に直接関わってくるのが、サンプリングのタイミングを調整している クロック というものの存在です。

オーディオクロック

ほとんどの映像関係者はオーディオマスタークロックというものを知らないと思いますが、大きなエディットスタジオにお勤めの方なら、業務用ビデオシンクやマスタークロックジェネレーターの存在を知っていると思います。

ビデオシンクのために使うものですが、精度の高いクロックジェネレーターを使うとディスプレイの発色がよくなるなど言われます。このような現象がオーディオインターフェイスでも起こります。

オーディオインターフェイスの場合、搭載されている AD/DA チップはオーディオクロックの発生させる信号のタイミングに合わせてサンプリングします。48kHz の場合、オーディオクロックは 1秒間に 48,000 回、AD/DA にサンプリングしてくださいアナログ変換してください、という信号を送ります。

オーディオインターフェイス、もとい AD/DA コンバータはオーディオクロックが無いと動作出来ないため、すべての製品にオーディオクロックが搭載されています。しかし汎用オーディオクロックは精度が悪く、AD/DA に直接影響を与えるためこれがオーディオインターフェイスの音質に直接的に影響を与えます。

サンプリングするタイミングがクロック精度に影響するためサンプリングする時間軸にブレが生じる (ジッター) と AD/DA する音質が悪化することは容易に理解できると思います。ビデオ環境でもクロックジェネレーターが必要なことを考えたらオーディオインターフェイスにもちゃんとしたオーディオ用マスタークロックが必要なことは容易に理解できるでしょう。

世界中でトップシェア誇る Antelope Audio 社製マスタークロック Trinity (日本のプロスタジオはほぼこれ)

ジッター

良くこの業界、ジッターという言葉を聞く事があるが、時間軸のズレのことをジッターという。たま~にジッターノイズということを聞くことがあるが、それはジッターノイズではなく、シンク出来ていないときに発生する同期ずれ、シンクノイズだ。

以下の図で解説する。
引用: デジタルなのになぜ音が変わるの? http://kanaimaru.com/PS3/a1.htm

ジッター (Jitter) とは、電気通信などの分野において、時間軸方向での信号波形の揺らぎの事であり、その揺らぎによって生じる映像等の乱れのことも指す。by Wiki: https://ja.wikipedia.org/wiki/ジッター

とある。映像の分野でも重要なクロックジェネレーターだが、音響の分野でも一緒だ。例えばアナログの信号を正確にサンプリングしたい場合、サンプリング周波数の周波数を増やし、クロックジェネレーターの精度を上げる必要がある。図を見て欲しい、正確なマスタークロック とジッターが発生しているクロック ではサンプリングした波形に誤差が生じている。これが音質に影響を与えるということを理解して欲しい。どちらがいい音かは、実際に聞いてみないとわからないが、ジッターが多い方がなんとなく音に悪影響を与えそうだと理解できるだろう。(実際には正確なマスタークロックだからといって音質がいいとは限らない)

以上の様に、オーディオマスタークロックが必要であることを理解できると思う。

レコーダーとオーディオインターフェイスの種類

実際には、収録現場で大掛かりなレコーディングシステムを構築することは非常に難しいので、カメラに付属している端子からレコーディングしたりフィールドレコーディング用のレコーダを使用するのが現実的です。

レコーダーとオーディオインターフェイスは同じ様な振る舞いをするので同じものと勘違いされがちですが、オーディオインターフェイスはコンピュータと接続して使用するものになります。オーディオインターフェイスは基本的にコンピュータが無いとそれ自体でレコーディング、再生できないもので、明確に違うものと考えてください。

レコーダー

オススメピンタイプのレコーダー、B帯無線機を買うより安上がりで音質もカメラに録音するより、こちらのほうが良い。

コストパフォマンスに優れたマルチレコーダー、マイクを4本も挿せるので、これで基本的には大丈夫なはず。

レコーダーの場合、音質向上は基本的に期待出来ません。ポータブルやフィールドレコーディングを前提としてるので、バッテリー持ちや小型化なので設計がかなり簡略化されています。使い勝手や予算、マイクの種類等で適切なものを選ぶといいでしょう。

オーディオインターフェイス

映像現場の場合、編集時に主に使うことになるでしょう。DaVinci Resolve や Premiere Pro などで再生している音声を扱う際に効果を発揮するでしょう。特にオーディオインターフェイスの音質は音声処理の質に大きく影響します。

映像現場の方は最近は Windows が増えていると思いますが、Mac でも使えたほうが良いということで、両プラットフォームに対応しており、コストパフォーマンスと音質を両立出来ている市販のオーディオインターフェイスは多くありません。また USB と Thunderbolt 両接続方法をサポートしている製品は稀です。

上記の両プラットフォームと両接続方法に対応している製品は以下です。

クロックの質と精度が高級機と同じテクノロジーを採用し、AD/DA 品質が良く、世界初の Discrete マイクプリをインターフェイスに搭載、コストパフォーマンスに優れた製品 Antelope Audio 社製 Discrete 4 (11万〜)

日本では圧倒的なシェア率を誇る RME 社製 Fireface UFX+。低ジッタでクロック精度も高く、Windows、Mac 共に USB、Thunderbolt 接続が可能で安定性も高い (ただし 30万円〜 と少しコストがかかる)

業界標準としては AVID 社の Pro Tools と Media Composer になるので HDX 対応品を買う制作会社が多いかもしれません。

  • Antelope Audio Goliath HD、Orion 32 HD
  • Apogee Symphony (HD option card)
  • AVID MTRX (AVID の純正機)
  • Focusrite RED series
  • Lynx Aurora HD

AVID 純正品は余裕で 100万円を超え、アナログ信号を扱えるようにチャンネルを増やすと 200万 300万 かかるものになります。上記のメーカは価格を抑え、なおかつ他チャンネル高品質な HDX system 対応の製品がサードパーティとして販売されています。

個人でこの様なシステムを組むのはフリーランスエンジニアでもごく一握りです。

ミキサー型

インターフェイスになるものもありますが、ほとんどが大型でホールなど業務レベル向けに設計されており、映像編集や音響制作の現場では使用されません (超大型の SSL や NEVE、API などのインラインコンソールは除く)。現在はほとんどがデジ卓かコントロールサーフェイスであり、一般向けのミキサー型は微妙な製品しかなく、インターフェイスとしての能力がかなり低いです。わざわざミキサー型を買うにはそれなりの理由が必要です。インターフェイスとしての性能は非常に低いことを理解してください。

オーディオインターフェイスの構造

オーディオインターフェイスは大まかにマイクプリ搭載型とラインレベル統一機の2種類があります。ラインレベル統一機は高級機で限られた条件やスタジオでしか利用することはないと思いますので、今回はマイクプリ搭載型のインターフェイスを説明します。

また説明順は信号の流れを表します。

1. マイクプリ (マイクプリアンプ)

XLR 端子対応の製品はこの様なケーブルコネクタと入出力ソケットに対応している。

XLR 端子を接続することが出来る製品はマイクプリが搭載されています。マイクは微弱な電気信号を扱うため、その信号のレベルを増幅してあげないとレコーダーに記録出来ないからです。その信号増幅装置がマイクプリアンプです。これが搭載されていない機器ではマイクを使って収録ができません。

また、このマイクプリアンプの性能が音質に直結します。マイクプリの性能が低ければマイク本来の電気信号を上手に増幅出来ず、アナログ信号波形が変形してしまいます。これが音質の低下の原因になり、安いものはこのマイクプリの性能が悪いため音質が良くない、ということになります。

せっかく良いマイクを買ってもカメラ直付けや、安いレコーダ、インターフェイスを使って収録しても宝の持ち腐れです。特に安いインターフェイスに搭載されているマイクプリは総じて質が悪いです。

2. アナログデジタル/デジタルアナログ変換器 (AD/DA Converter)

前半にも説明した通り、アナログ信号は AD コンバータに流れてデジタル信号に変換されます。安いインターフェイスは安いチップを使うため、高サンプルレートで収録しても元々の ADC の質が良くないので音質向上には繋がりません。

また安いインターフェイスは精度の悪いオーディオクロックが採用されているのでサンプリングの質自体が良くなく、音質向上には繋がりません。クロックの質と精度は AD/DA に直接影響を与えます。

3. USB または Thunderbolt 転送

録音時、AD (アナログからデジタル変換) された信号はケーブルを伝わりコンピュータの DAW 上やレコードソフトに配置されます。データ自体は記録メディアに保存されます。(HDD か SSD に限られてくると思います)

再生時、デジタルの信号はオーディオインターフェイスへ送られ DA (デジタルからアナログ変換) され、その信号は任意のアナログ端子に出力できます。

4. Input Output の設定

安いインターフェイスの場合、アナログ端子と AD/DA は紐付けられており、これらの設定が出来ないですが、ある程度のグレード製品になると、アナログの信号をどのチャンネルの AD を使って変換させるか、デジタル信号をどの DA で変換させるか、などが変更できます。DA の場合はどこのアナログチャンネルに出力させるかの選択もできます。

これがかなり重要な機能になるのですが、ほとんどの一般向け製品では細かな出力設定ができません。これをルーティングというのですが、アナログデジタルの関係性を理解でき、なおかつ入出力のフレキシブルさを要求される際には必須です。(7.1ch や 5.1ch を行うためには任意のデータを DA させそれを任意のスピーカに送ることができないといけません。)

5. スピーカやヘッドフォン出力

最近のインターフェイスは親切なので、メイン出力にメイン信号を出力してくれるように設計されています。ただし、すこし複雑なルーティングや任意のチャンネルだけを別端子に再生させたい場合などにルーティング理解する必要があります。(インターフェイスによって設定方法は異なります、これらは各インターフェイスで使い方を覚える必要があります。)

オーディオインターフェイスとは (まとめ)

  1. レコーダと勘違いされがちですが、コンピュータオーディオを入出力するためのインターフェイスです。
  2. 基本的な構造は アナログ回路の入力と ADC、 DAC とアナログ回路の出力、クロックジェネレーターが搭載されている
  3. アナログ回路設計と AD/DA の質とクロックの質と精度が大きく音質に影響する。
  4. 入力信号の流れ、マイクプリ(またはライン入力) → インターフェイスの ADC → DAW や レコードソフト
  5. 出力信号の流れ、DAW や 映像編集ソフト→ インターフェイスの DAC → スピーカやヘッドフォン

信号の流れとインターフェイスの構造を理解すると、音声編集への理解と音質の劣化を防ぐことができます。

今後は音声データの扱い方も説明しないといけませんが、オーディオインターフェイスの構造と知識が正確に理解できていない人が多いと感じたため、このノートを作成致しました。映像制作では PC や Mac オンボードのスピーカやイヤフォンで処理している人も多いかと思いますが、レベルを上げるためにはインターフェイスからスピーカやモニタリング用のヘッドフォンに音を出力させ、編集する必要があります。

実際には皆さんの声やコメントを聞きたいと思っています。質問等あればお気軽にください。それに答えたいと思います。よろしくお願い致します。

おまけ。音質向上に効果があること

1. 電源を変える

実は商用 100V (自宅やオフィスの壁コンセントのこと) はめちゃくちゃ質が悪いです。余裕があれば別途電源を買いましょう。安定電圧電源やノイズ消去技術を採用したパワーディストリビュータやパワーコンディショナーを使うと効果があります。

2.ケーブルを変える

実際に変化があります。どれが正解かといわれるとどれも正解であり不正解の世界ですが、業界標準として Mogami がプロオーディオの世界では圧倒的な支持率があります。

7クリップする
クリップしておくと
あとからいつでも
見返したりできます。

コメント

  • Takahiro  Nakanishi
    とても勉強になる投稿でした。ありがとうございます。
    レコーダーでの録音では、映像と音声のズレが発生する場合があるので、タイムコード等に対応のレコーダーを使用するのがベストと聞いたことがありますが、タイムコード等に対応していないレコーダーを使用するコツなどがあればお聞かせいただけないでしょうか。
  • Naruki Konagaya
    コメントありがとうございます。
    タイムコードを同期できないが、全体が有線で完結できるレコーダーの場合、編集点を作ることが非常に大切だと思います。
    よくあるのが、手を画面の前で叩いて、同期点を作ることです。ものすごく大切ですので「よーい、アクション!」は大切です。

    音声と映像がずれるのは扱っている動画音声のサンプルレート周波数が違うときに起こります。
    レコーダーによってはフレームレートに合わせて収録できるタイプのありますが、基本的にはサンプルレートが基となると思います。
    収録音声が 44.1kHz なのに、カメラ側の音声が 48kHz 固定になっているので音ズレが起きたりします。長い収録だと、何秒もズレてきます。

    必ず、サンプルレート周波数は 48kHz に固定するか、96kHz など倍数で収録し、もし間違えたら、編集プロジェクトと周波数をあわせることを心がけて下さい。
    最近はアナログB帯を使わずにデジタル 2.4GHz 帯や 5GHz 帯を使ったワイヤレス製品がかなり出回りましたが、非常にレイテンシーが多いです。
    10ms 以上も送れる製品が多く、ズレとして認識できます。こうなったらやはり、同期点があることが非常にありがたくなります。

    結論として、「よーい、アクション!」はステレオタイプの撮影のものまねですが、非常に有効な撮影技術です。
  • akakyouryuu
    motuのことも忘れないであげて...
    624以上はthunderboltもusbもwinもmacも対応しているし、他社と比べると安価で多チャンネルで最近はドライバも安定しているいい子なんです。
    現行機種しか聞いたことないけれど、昔のmotuと違って音色のくせもなくなっているらしいです。