- インストール
- 基本操作
- 電子工作向けプログラミングの基本
- Excel向けプログラミングの基本
- scikit-learnでの機械学習
- matplotlibでのデータの可視化
- Web関連プログラミング
- RPA関連プログラミング
- その他の各種プログラミング
- タートルグラフィック
- 音声
- 音声合成
- 音声認識
- リファレンス
音声認識
WebブラウザのWeb Speech APIを利用して、簡易的な音声認識を行うことができます。
ただし、対応しているWebブラウザは一部のみです(こちらのページで対応状況をご確認ください)。
音声認識の開始
音声認識を行うには、「認識する言語を○○にする」のブロックで言語を決めてから、「認識を開始する」のブロックを実行します。
![]()
![]()
認識を開始した後、「認識を終了する」のブロックを実行するか、プログラムが終了するまで、認識が続きます。
その間に、PCに接続したマイクに向かって話すことで、音声が認識されます。
認識を開始した後に、プログラムの実行が終了すると、そこで認識が終わることになります。
プログラムを実行し続けて、音声認識が続くようにしたい場合は、プログラムの最後に以下のような繰り返しのブロックを入れます。

認識したときの処理
音声が認識されたときに何か処理をするには、「認識結果が得られたとき」のブロックを使います。
このブロックの中に、処理したいブロックを入れます。

また、このブロックの中で「認識した文章」のブロックを使うことで、認識した文章を得ることができます。
文章は変数に代入したり、文字列関係のブロックと組み合わせたりすることができます。
![]()
認識の途中結果を得る
「認識を開始する」のブロックで、「途中経過」のチェックをオンにすると、認識の途中でも「認識結果が得られたとき」のブロックの中の処理が実行されます。
この場合、「認識途中」のブロックの値によって、認識の途中なのか、文章を最後まで認識し終えたかを判断することができます。
認識の途中であれば「認識途中」ブロックの値はtrueになります。
![]()
事例
以下のプログラムは、認識した文章をコンソールに出力する例です。
プログラムを実行した後で、マイクに向かって文章を話すと、認識結果が表示されます。
このプログラムは、こちらからダウンロードすることができます。
