2017.10.29 (最終更新日: 2020.08.12)

iPhoneの「音声入力」で面倒な文字起こし作業が快適になりました。

重要なのに面倒くさい「文字起こし」

インタビュー映像の収録素材を編集する際、私は必ず毎回音声ファイルを使って文字起こし、つまりインタビュイーの発言を全て文書化する作業を行っております。

それはなぜかというと、インタビューの流れや内容を文字として眺めながら編集する事で編集作業の効率が各段に上がるからです。また、文字起こしした文書をクライアントと共有する事で、クライアントチェックもかなり効率的になります。
(「どこかもっといい発言無かったですか?」と訊かれるよりも「7:38辺りの『〇〇〇~』という言葉を生かせますか?」と相談された方が具体的でお互いにラクです)

そんなメリットの大きい文字起こしですが、実際に音声素材を聞き取って文字に起こす作業は結構面倒でもあります。映像制作を行っている人が皆速くタイピング出来るとも限りませんし、地味な単純作業なのでモチベーションも上げづらい部分がどうしてもあるのです。

新感覚の「スマホにしゃべって文字起こし」

そこで最近私が採用しているのが、キーボードでのタイピングではなく皆さんお持ちのiPhoneで音声入力を用いて文字起こしする方法。
とにかく最近のiPhoneは音声認識が思ったよりもはるかに優秀!ハッキリと話す事を少し心がければ、ほぼ正確に話した内容を文字化してくれるのです。
(ちなみにこれを書いている時点での私のiPhoneはiPhone7、OSは10.3.3です)

詳しいやり方を以下にまとめます。

  1. 「メモ」など文字を記録できるアプリをiPhoneで起動し、音声入力をONにする。
    ※Evernoteなど、クラウドでPCと内容を共有出来るアプリを使うと便利
  2. 収録した音声ファイルをPCなど何らかの機器で再生、イヤホンで聴く。
  3. イヤホンで聴きとったインタビュイーの言葉を、そのままiPhoneに向かって喋る。
  4. 1、2文ごとに入力を止めて、誤認識を修正して改行を挟む。

こんな感じです。

一見煩雑そうな手順ですが、実際に行ってテンポを体感してみると修正作業もさほど手間ではなくその楽さ・スムーズさが分かるかと思います。例えば20分間の素材を文字起こしするのに1時間以上かかっていた所を30分ちょっとで終えられるようになりました。イヤホンで聞き取って話した内容がスルスルと大体思い通りの文字になっていく感覚は、なかなか快適です。


ちなみに収録した音声素材をスピーカーからそのままiPhoneに聞かせる方法も試してみましたが、さすがにそれは上手くいきませんでした。インタビュイーはよく言い淀んだり、言葉の途中で声量が落ちたりするので誤認識だらけになってしまいます。今の技術レベルではどうしても言い直しが必要なようです。

デメリットを挙げるとすれば、傍から見れば延々と一人でスマホに向かってスピーチをしているように見えるので人前では絶対出来ない所でしょうか…。
新幹線の中など移動中に出来たら最高なのですが、さすがにその度胸はありません。周りに迷惑ですしね…笑

という訳で、「文字起こしが面倒!」という方はiPhoneの音声入力を一度試してみてはいかがでしょうか。
試してみての感想などあれば、コメント頂ければ幸いです。
また、iPhoneではなくAndroid端末やPC上での音声認識ソフトを用いたらどうなるのかもかなり気になります。既に行っている方がいたら、教えて頂きたいです。

0クリップする
クリップしておくと
あとからいつでも
見返したりできます。

    コメント

    • まだコメントはありません