前回、AmiVoice SP2を初めて使用した時の感想にも書いたのですが、Amivoiceの前バージョンであるSPかSP2への変化が結構なものだったことから、今回は主に変化したところを7つのポイントに分けて書いていきたいと思います。
![]() | エムシーツー 話すだけで簡単にPC入力。事前に声の登録の一切必要のない次世代音声認識エンジンを搭載。 |
インターフェイス
とりあえず今回のアップグレードで、デフォルトのインターフェイスは以下のように変化しました。
上が「Amivoice SP2」。下が以前の「Amivoice SP」です。
1.辞書が大幅に強化
今回のSP2で音声認識率が飛躍的に向上しました。それは今回のアップグレードで辞書の補強を含む音声認識エンジンが大幅に強化されたらです。中でも辞書については、語彙数が20万語になりました。これは前バージョン(SP)の語彙数が4万語だったのと比較すると、約5倍になります。
実際に使用してみて特に、固有名詞の強化を感じました。ちょっとした有名人・地名とかなら、かなりの確率で一発表示されると思います。
試しにいくつか例を挙げると、安倍晋三、麻生太郎、森喜朗、谷垣禎一、山本一太、鳩山由紀夫、菅直人、野田佳彦、樽床伸二、石原慎太郎、橋下徹、仲井真弘多(沖縄県知事)、桜木花道、キン肉マン、野比のび太、源静香、孫悟空、空条承太郎、東方定助、堤さやか、長瀬愛、宮下杏奈、吉沢明歩.成瀬心美、などなど。
自分で適当に入力してみてビックリしたのですがこれらの固有名詞が変換なしに一発で出ます。
2.切り替えれるマスター辞書の種類が変わった
(上のキャプチャは、前バージョンからアップグレードしたので前回使用していたマスター辞書が引き継がれています。)
以前のSPでは切り替え可能なマスター辞書は、「ブログ日記・メール」「しゃべりことば」「書きことば」「政治経済」の4つでしたが 、 SP2では「標準(小)」「標準(大)」「政治経済」「数値認識」「登録単語認識」の5つになりました。
今回登録されているマスター辞書の主な特徴
標準(小):前バージョンと同じ4万語の辞書。小さめの辞書なので辞書検索にかかる時間が少なく、低スペックのパソコン向け。
標準(大):20万語と大幅に強化された辞書。音声認識率は非常に高くなるが、辞書検索処理の時間がかかるため、発声から文字になるまで多少のタイムラグがある。高いスペックのパソコンだとあまり感じない。
政治経済:政治用語、経済用語で出てくるような、お堅い文章を書きたいとき用の辞書。
数値認識:ただ数字だけを入力したいときに使用する辞書。エクセルなどの数値入力時に有効。
登録単語認識:ユーザーが登録した単語のみを認識する辞書。
これまでに使っている感じでは、それなりにスペックのあるパソコンで文章入力する場合は、標準(大)だけで十分のような気がします。マスター辞書をいちいち変更するのもめんどくさいですし。
3.辞書学習を効率化できる機能の追加
今回、AmiVoiceのメニューに「テキストを学習ウィザード」というものが追加されました。その機能とは、マスター辞書に収録されていない「未知の語」を、ユーザーが持っている既存のテキストファイルから抽出し、検出された未知の語句に読みをふって学習させ、さらに辞書を強化する機能です。これにより、ユーザは過去に書いたテキストから辞書を、さらに鍛えあげることができ、さらなる認識率向上を図ることができるようになります。
4.音声コマンド拡張機能がついて、アプリの起動やファイル操作のもできるようになった
既存の音声コマンドの他にも、ユーザーが作りたい音声コマンドを自から作成できるようになりました。
また、AmiVoice SP2の機能やキー入力、プログラムの実行、スリープなどを組み合わせて、新たなカスタムコマンドを作成することができます。さながらAmiVoice用のマクロみたいなもんです。
5.スピーチマイクを使ってのディクテーションができるようになった
説明書によるとスピーチマイク LFH3200を使用することで、音声入力、付属のボタンで、マイクのオン/オフのコントロール、単語の次候補の選択、 および決定、転送などをコントロールすることができるようになり、より効率的に音声入力による文書作成を行うことができます。
ただ、別売りの気になるLFH3200のお値段は、思ったより高い。
6.書起しエディタにより音声ファイルからのテキスト化がより楽になるらしい
AmiVoice SP2から「書起しエディタ」という新しいアプリケーションが加わって、音声ファイルのテキストがしやすい環境になったようです。
僕は、音声ファイルからのテキスト化をしたことがないので、効果の程は、よくわからないです。
7.その他のちょっと嬉しい細かな変更
新しくSP2を出すにあたって、いろいろとユーザーから意見を聞いて反映させたということで、嬉しいへ変更が各所に施されています。個人的に気が付いただけを以下に箇条書き。
□音声入力中に単語登録ができる(SPまでは、一端マイクをオフにしなければ登録できなかった)
□音声入力中に設定変更ができる(SPまでは、一端マイクをオフにしなければ登録できなかった、ただしマイクはオフになります)
□エディターの表示色や記号表示などの細かな設定ができるようになった
□アプリケーションから自動アップデートが行われる(以前は自分で確認して手動でやらなければいけなかったのが.かなりめんどくさかった)
あと欲をいえば「音声入力をしないまま10分経つと、自動的にマイクがオフ状態になる機能」とかが欲しいですね。よくマイクを切り忘れて、テレビの音を学習させちゃったりということがよくあるもので。
それともう一つ「タスクトレイアイコンのクリックでマイクのオン/オフを切り替えられる機能」もぜひ欲しい。いちいちタスクトレイから出してマイクのオン/オフを切り替えをするのが面倒くさいんですよね。
この二つの機能さえ追加されれば、僕個人としてはAmiVoice SP2は、ほぼ完璧と言っていいと思います。今度、エムシーツーに要望を出しておこうかと思います。
まとめ
ここまで、7つにわたって「AmiVoice SP→AmiVoice SP2」の変更点について紹介してきました。いろいろと変更点があったり、便利な機能を追加されたりもしましたが、中でも一番インパクトを与えられたのは、やっぱり辞書機能の強化です。これに尽きます。前回も書きましたが、AmiVoice SPのレベル126(単語登録しまくり)より、AmiVoice SP2のレベル1(単語登録なし)の方が遥かに優秀だと思います。以前のAmiVoiceを使用していた時に感じていたイライラが今回はほとんどありません。
音声認識ソフトにとって核となる認識エンジンと辞書の充実こそ、ソフトの満足度に比例すると思います。そういった意味では、今回のグレードアップは僕にとって、かなり満足度の高いものとなりました。
まーそれでも、人間とは強欲なもので使っていくうちに「もっとここは」ってところが出てくるのでしょうけど。だってSPだって以前はそれで、すげーすげーと満足していたんだもの。
次回は、今回購入したAmiVoice SP2と以前購入したドラゴンスピーチ11Jを徹底比較したいと思います。
続き:二大音声認識ソフトを徹底比較「AmiVoice SP2」VS「ドラゴンスピーチ11J」
![]() | エムシーツー AmiVoice SP2マイクなしバージョン |
タグ:音声認識 音声入力 AmiVoice SP2 レビュー