コンバンハ、千葉(幸)です。
先日のアップデートで、Amazon Transcribe のリアルタイム文字起こしが語彙フィルタリングに対応しました。
前提として、Amazon Transcribeは音声をテキストに変換してくれる自動音声認識(ASR)サービスです。つまりは文字起こしをしてくれます。
Amazon Transcribeによる文字起こしは大きく分けて2つあり、ジョブによるバッチ文字起こしと、ストリーミングによるリアルタイム文字起こしに対応しています。(※ちなみにリアルタイム文字起こしは日本語には対応していません。気長に待ちましょう。)
文字起こしのオプションの1つとして、語彙フィルタリング(Vocabulary Filtering)があります。指定したワードについて、文字起こしの結果からマスクしたり、除外することができます。これらの「マスク」や「除外」をフィルターメソッドと呼びます。
語彙フィルタリングは2019年の12月に開始された機能であり、当初バッチ文字起こしにおいてのみ対応していました。
今回のアップデートによって語彙フィルタリングがリアルタイム文字起こしにも対応したほか、リアルタイム文字起こしにのみ対応したフィルターメソッド Tag も追加されています。
#aws #amazon transcribe