(読み上げ原文)

 ドラゴンスピーチは認識率が99%と胸を張る。実際にはどのくらいの認識率があるのだろうか。そこで実際に試して見ることにしよう。本項を読み上げてみたときの結果を右側に示してある。左側が原文で右側が音声認識の結果である。右側のゴシック文字で表した部分は誤変換または誤認識になったところである。このテストはマンションの2階の一室である私の仕事部屋で深夜に行った。国道から80mほど離れた小高い丘の上に建っていて比較的に静かである。簡単な音声登録(チューニング)のみを行い単語登録などの辞書の整備はしていない原始的な状態である。括弧や句読点は無視する。これは誤変換、誤認識となった部分を全く修正しない場合であり私の目で判定すると認識率約80%である。誤変換された文字列○○○を「選択○○○」と発声すると修正候補一覧が提示され「何番を選択」と発声して置換修正することが比較的簡単にできるが処理にはそれなりの時間がかかる。修正候補が見つからないときはキーボードからの文字入力で修正する。誤認識部分でも修正候補が見つかることがあるが確率は低い。さて、かなりの認識率が得られたので何らか改善すれば90%以上の認識率が得られるのではないかと期待が持てる。どうすればいいのか。トレーニング(チューニング)を多くすれば認識率が上がると説明されている。静かな部屋で明瞭に抑揚のない話し方をする、辞書にない単語を登録するなどすれば認識率が改善されるという。95%程度の認識率であれば修正頻度がそう多くないであろうから3時間程度を一人でさほどの疲労感なく修正しながら演説することが出来るのではないかと考えている。


(音声認識の結果)

ドラゴンスピーチは認識率が99%と胸を張る。実際にはどのくらいの認識率があるのだろうか。そこで実際に試してみることにしよう。本項を読みあげてみたときの結果を三輪に示してある。左側が原文で、右側が音声認識の結果である。右側のゴシック文字で表した部分は、公園間または誤認識になったところである。このテストはマンションの2階の一室である。私の仕事部屋で深夜に行った。国道から80メートル離れた。小高い丘の上に立っていて、比較的に静かである。簡単な音声登録チューニングのみを行い、単語登録などの貴社整備は否定以来、原始的な状態である。句読点は無視する。これは公園間誤認識となった部分を全く修正しない場合であり、私の目で判定すると、認識率約%であ

る。誤変換された文字列000を選択。。。発生すると中世以降を一覧が提示され、南蛮を選択と発生して仕官修正することが比較的簡単にできるが、処理にはそれなりの時間がかかる。中世以降は見つからないときは、キーボードからの文字入力で修正する。誤認識部分でも修正以降が見つかることがあるが、確率は低い。さて、かなりの認識率が得られたので、なんか改善すれば、90%以上の認識率が得られるのではないかと期待が持てる。どうすればいいのか、トレーニングを多くすれば認識率が上がると説明されている。魚屋で、明瞭に抑揚のない話し方をする。自社利害単語を登録するなどすれば、認識率が改善されるという。95%程度の認識率であれば、修正頻度そう多くないであろうから3時間程度を一人で、さほどの疲労感なく、修正しながら演説することができるのではないかと考えている。

直線上に配置
 

軽度・中度難聴者のページ に戻る

 補聴機器勉強会 ホームに戻る