動画とコトバの関係
日本では、テレビ番組などの映像コンテンツにテロップ(文字)を入れる頻度が特に高いと言われます。また、ネット向けの動画では、電車など音の出せない場所での視聴にも対応できるよう「フルテロップ」(全ての言葉を文字で表示)で作成される事も珍しくありません。
一方、すべての発言を聞き取ってテキスト化し、さらに動画内のタイミングにあわせて表示するのは非常に手間のかかる作業で、内容によっては作業時間が文字通り数倍に膨れ上がることもあります。
そうした悩みの救世主となるのが、近年急速に進化している、音声からの「自動文字起こし」系のツール。各ユーザーの工夫で様々なWebサービスとの連携などが行われていましたが、一つのターニングポイントと言えるのが2021年、大きなシェアを持つ編集ソフト「Adobe Premiere Pro」に標準で装備された「シーケンスから文字起こし」の機能です。
メインの編集作業のライン上で、音声としてのコトバを「文字化」できる、その利便性や使いこなしのポイントをご紹介して行きましょう。
基本的に「全自動」でOK
Premiere Proの文字起こし機能は「テキスト」パネル上から実行します。
特に細かい設定などは必要とせず、分析の対象を「トラック上のオーディオ」にし、言語を「日本語」(及び、内容にあった語)にするだけで、あとは処理を実行するだけ。
処理結果は、パネル内にテキストとして表示されます。一回で完璧にとは行かないまでも、同種のツールの中では優秀な部類に入る精度をもち、似た響きの語と誤認識されている部分は手動で打ち替えての修正が可能です。
着目すべきは、会話中に入ってしまう「えー」「あー」と言った余計な部分を自動的に削除してくれる機能。また、明確に声質が異なる部分は、別々のスピーカーとして、やはり自動的に分けてくれます。
こうして書き起こされた語は「キャプションの作成」をクリックすることで、各時間位置に「サブタイトル」のトラックとして割り振られ、画面上にはシンプルな状態のテロップが表示されるようになります。
さて、実はこの時点で、このシーケンスには「ある劇的な変化」が生じています。元々はただの「音」だった言葉が、テキストになったことで「検索」することが可能になったのです。
例を挙げてみましょう。従来であれば一時間のインタビュー中で「ペリカン」と言っている部分を探すには全体を視聴するしかありませんでしたが、自動文字起こしされたシーケンスでは検索窓に「ペリカン」と入れるだけで、それに言及されている部分を瞬時に探すことができるのです。
従来、言葉の意味に関しては編集している人間が100%解釈するしか無かったのが、意味を伴った検索が可能になる。単に、ビジュアルとして字幕が付く以上に大きな変化がここに発生しているのです。
「機械が聴きやすい音」を作る
一般的にビデオコンテンツの音声は「視聴者が聴きやすい」形に仕上げられます。その際には一定の「自然さ」が求められ、たとえば音量の小さな部分を持ち上げるのでも、極端な不自然さが出ないよう抑制された設定に落ち着く場合が大半です。
一方、文字起こし機能でプログラムが語を認識する場合には、人間の感触に関係なく「音としての成分が目立っている」状態が大きく作用します。Premiere Proには、ノイズの除去や音量の均一化など様々な音声修復の機能がありますが、これらは通常、人間が不自然に感じない程度に「程々」の適用に抑えられます。
しかし、文字起こしを行う際は、人間の感覚では極端に感じても、データとしてはより明瞭になるよう、強めの音質補正をかけるのも良い手段の一つです。
Premiere Pro内ではシーケンスの複製も容易に行えるので、文字起こし用の音声設定を作り、そちらで文字起こしを実行するのも有用な手段の一つとなります。
例えば、エッセンシャルサウンドパネル上の「修復>ノイズを軽減」は、エアコンの動作音など一定に入り続ける雑音を軽減してくれます。
通常は、スライダーの位置が中央より左よりの控えめな設定の方が自然な質感を保てますが、声が埋もれ気味なほどノイズの大きい素材では、強めにした方がより声の成分だけを残すことができます。書き起こしが終わったら、再び自然な質感優先の設定に戻しましょう。
また、同じく「明瞭度>ダイナミック」では、スライダーを右に設定するほど音量の変化を抑えられます。話者や部分により声の大きさにばらつきが大きい場合は、やはりこちらも強めの設定で書き起こしを行い、最終的に自然な効果に戻すと良いでしょう。
デザイン変更も効率的
音声から書き起こされた文字は「キャプション」トラックにまとめられます。
初期状態ではシンプルな明朝体での表示となりますが、フォントや色、大きさといったデザインは「エッセンシャルグラフィックス」パネル内で自由に変化させることができ、また 「トラックスタイル」への保存や読み出しにより一括して変更することも可能です。
キャプションは前段で述べたように「映像内に焼き込む」ほかに、「.srt」といった汎用のキャプション用データとして書き出すこともでき、YouTubeをはじめとするプラットフォーム上で表示切り替えの可能な字幕として扱うことも可能です。
どちらの場合も、全部、または一部を手動でテキスト化していた時と比べると、劇的とも言える作業時間の短縮が望めます。
テキスト記事など他のコンテンツへ応用も!
書き起こされたテキストは、動画以外のコンテンツへの可能性も広げます。
例えば、インタビューや対談といった素材をテキスト化する際は、音声を録音して「文字起こし」するのが一般的ですが、動画として撮影した上で、Premiere Pro上での文字起こしデータをテキストファイルとして保存すれば、それだけでテキスト記事の下地ができてしまいます。
また、インタビューや対談記事に付随する「写真」も、4K解像度で動画を撮影しておけば、ベストな表情の部分を静止画として切り出すことで作成することができます。
Premiere Proに装備された文字起こしの機能は、単に動画制作の効率を上げるだけでなく、こうした 「動画以外」のコンテンツ(もちろん、音声のみをポッドキャストとして配信するなどの利用も可能です)へと転用する可能性まで広げてくれます。
手元にPremiere Proのある方は、ぜひ文字起こしの機能を試してみてください。その便利さに驚くと同時に、きっと様々なアイデアを湧き起こす起爆剤にもなってくれる事でしょう。
この記事を読んだ方におすすめのPCはこちら
CuttersPoint最新記事一覧
アニメーション作家になるまでの道のり!独自の作風を失わない秘策とは
プロの映像クリエイターのインタビューをもとに、そのナレッジやノウハウを紹介していく「Cutters Point」。 今回のゲストは、Eve『お気に召すまま』、ずっと真夜中でいいのに。『秒針を噛む...
Blender歴わずか1年でプロクリエイターに! ハイクオリティフォトリアル作品のメイキングとおすすめチュートリアル|3DCGアーティスト Kazuya
プロの映像クリエイターのインタビューをもとに、そのナレッジやノウハウを紹介していく「Cutters Point」。今回のゲストは、CGアーティストのKazuyaさんです。 長引くコロナ禍の中、偶...
アニメ作家から学ぶ、CGアニメの作り方。心から納得できる美しい作品を
プロの映像クリエイターのインタビューをもとに、そのナレッジやノウハウを紹介していく「Cutters Point」。 今回のゲストは、音楽ユニット「ずっと真夜中でいいのに。」 の「正しくなれない」...
話題のマルチクリエイターが教える、映像制作術!CGは「超リアル」でなくていい
プロの映像クリエイターのインタビューをもとに、そのナレッジやノウハウを紹介していく「Cutters Point」。 今回のゲストは、3Dキャラクターモデリング・アニメーション、CG映像制作、フィ...
音MADでWebCM制作!モスバーガーのCMはこうして生まれた!
プロの映像クリエイターのインタビューをもとに、そのナレッジやノウハウを紹介していく「Cutters Point」。 今回のゲストは、ドット絵や音MAD動画を武器に活躍する映像クリエイターの山下諒...
【Premiere Pro】トランジションは伝えたいことを補うための手法!
プロの映像クリエイターのインタビューをもとに、そのナレッジやノウハウを紹介していく「Cutters Point」。 今回のゲストは、「動画で未来を創る」というミッションを掲げ映像制作を行うととも...
コメントする