記事一覧

辞書が強化され新しく生まれ変わった音声認識ソフト「AmiVoice SP2」を衝動買い

  • このエントリーをはてなブックマークに追加

ファイル 569-1.jpgファイル 569-2.jpg

先日、ドラゴンスピーチ11Jを発売日に購入しました。日本では、7年ぶりの発売で待ちに待った甲斐もあってか、以前のものと比べて高い音声認識率を誇り、テキスト入力がはかどる素晴らしいソフトでした。

しかし、その発売から約1ヶ月後に、ドラゴンスピーチ11Jと対を成す音声認識ソフトのAmiVoiceがSPからSP2と進化して発売されるというじゃありませんか。すぐさまAmazonでポチりそうになったのですが、ドラゴンスピーチ11Jを購入したばかりで、お財布的にしばらく自重していたのですが、やはりどうしてもこちらも使ってみたくなり結局購入してしまいました。

エムシーツー
話すだけで簡単にPC入力。事前に声の登録の一切必要のない次世代音声認識エンジンを搭載。

AmiVoice SP2到着

で、届いたのが以下。

僕は以前にAmiVoice SPを購入していたので、今回は値段の安いアップグレード版を購入しました。

エムシーツー
旧バージョンAmiVoice SPを持っている人用アップグレードバージョンです。

中身はこんな感じ。


入っていたものは、AmiVoice SP2CD-ROM、説明書、ライセンス番号とインストールキーが記載された紙、ユーザー登録用のはがき、アップグレード用のインストールガイドです。


早速インストール

で、早速インストールしてみました。

インストールガイドをもとにインストール手続きを行っていきます。


アップグレードの場合は、以前のAmiVoice SPがインストールされていた場所に上書きインストールで問題ありません。


インストールが完了すると、アップグレードバージョンの場合は、以前使用していたデータにアップグレード処理をするかの確認ダイアログが出ますので、以前のデータを使用したい場合は「はい」を押してください。「いいえ」を押してしまうとデータが初期化されてしまうので注意してください。

このAmiVoice SP2からアップデートがある場合は、ソフトから自動アップデートできるようになりました。

SPの時は、エムシーツーからアップデーターを手動でダウンロードしてインストールする必要があったので.これは楽です。

早速ディクテーション

僕は以前、AmiVoice SPを使用していた時、レベルが最高の126になっていたのですが、そのデータを使用しては意味ないので新しくユーザーを作成してレベル0から試してみることにしました。

新しくAmiVoice SP2用にユーザーを作成します。


で、早速音声入力してみました。ただ、レベル0だと結構間違うので.とりあえずレベル1になるまで適当な文章を読みます。レベル0でもそれなりに認識しますが、レベル0の場合はユーザーの発声やくせなどの情報が全くない状態なので、レベル1になるまでユーザー情報をAmiVoiceに与えてやります。

五分もかからないうちにレベル1になったので適当に、Yahoo!ニュースにある文章を読んでみます。とりあえずトップにあった文章を読んでみました。(※かんだり、言い間違えたりした時は読み直しました)

元の記事

安倍首相「領土・領海守り抜く」 沖縄で自衛隊を激励
 安倍晋三首相は2日午前、就任後初めて沖縄県を訪問した。米軍普天間飛行場(宜野湾市)の県内移設に向けた沖縄との関係改善の糸口を探るとともに、尖閣問題などで緊張が高まっているこの地域の、自衛隊や海上保安本部を激励するのが目的。午後には仲井真弘多(ひろかず)知事と会談する。(朝日新聞デジタル)
http://dailynews.yahoo.co.jp/fc/domestic/senkaku/?1359776440

標準(大)辞書でディクテーション(レベル1)

安倍首相「領土・領海守り抜く」沖縄で自衛隊を奨励
安倍晋三首相は2日午前、就任後初めて沖縄県を訪問した。米軍普天間飛行場(宜野湾市)の県内移設に向けた沖縄との関係改善の糸口を探るとともに、尖閣問題などで緊張が高まっているこの地域の、自衛隊や海上保安本部を奨励するのが目的。午後には仲井真弘多(ひろかず)知事と会談する。(朝日新聞デジタル)

これはマジですごい。全角半角文字の違いはあれど、ほとんど意図した入力になっています。(激励と奨励は読み間違えたかもしんない…。)特にすごいのが固有名詞。「安倍晋三」とか「米軍普天間飛行場(宜野湾市)」とか「仲井真弘多(ひろかず)」とかが普通に出る。特に、「仲井真弘多(ひろかず)」が変換なしに括弧内も一発で出たのは、どういう原理かは知らないけど、かなり驚いた。


もう一つほどニュース記事をYahoo!ニュースから。

元の記事

ATMにスキミング装置 首都圏6カ所、130口座被害
防犯カメラ装い暗証入力を撮影
 新生銀行とシティバンク銀行の首都圏6カ所の現金自動出入機(ATM)に昨年10~12月、キャッシュカード情報を読み取るスキミング装置が取り付けられていたことが、捜査関係者への取材でわかった。警視庁は、東欧系の外国人グループによる犯行とみて建造物侵入などの疑いで捜査している。(朝日新聞デジタル)
http://dailynews.yahoo.co.jp/fc/domestic/trespass/?1359778445

標準(大)辞書でディクテーション(レベル2)

ATM にスキミング装置 首都圏六ヶ所、130幸田しない
防犯カメラ装い暗証入力を撮影
新生銀行とイーバンク銀行の首都圏6ヶ所の現金自動出入機( ATM )に昨年10~12月、キャッシュカード情報を読み取るスキミング装置が取り付けられていたことが、捜査関係者への取材でわかった。警視庁は、統計の外国人グループによる犯行とみて建造物侵入などの疑いで捜査している。(朝日新聞デジタル)


(写真の赤文字はコンピューターが間違って入力された可能性が高いと判断しているところ)


これは結構間違えましたね。シティーバンクとイーバンク、東欧系と統計みたいな発音が似ているものは、判断が難しいようですね。


感想

それにしても、AmiVoice SP2で辞書が強化されたとは聞いていたけど、ここまで強化されているとは思いませんでした。ここまでSP2で音声入力してきて、レベル4まで上がりました。ちょっと前まで前バージョン(SP)をレベル126まで上げて使用していましたが、正直すでに認識率はそれよりも上です。単語登録なんかまだ一つもしてないのに。

音声入力機能だけとればドラゴンスピーチ11Jに負けてないと思います。今回は「前バージョンより多少でも認識率が良くなっていればなー」くらいの気持ちで購入したのですが、全く別物と言っていいくらい辞書が強化されていると思います。エムシーツーもライバルのドラゴンスピーチに対抗して、かなりここには力を入れたのではないでしょうか。

それにしても、こういったライバル社同士が、お互いに競い合い、より良いソフトが使えるということはユーザーにとって、とてもありがたいことです。このように音声認識ソフトがブラッシュアップされていくのを見るのも、結構な楽しみだったりします。10年以上前に初めてIBMのViaVoiceを使用したときの絶望感からみたら、ものすごい進歩だとしみじみ。


最後に、AmiVoice SPとSP2では、機能面などかなり追加されました。次回は、そのいろいろな違いについて書きたいと思います。

続き:思った以上に進化していた「Amivoice SP2」、「Amivoice SP」との主な違い 7つのポイント

エムシーツー
AmiVoice SP2マイクなしバージョン

タグ:音声認識 音声入力 AmiVoice SP2 レビュー

  • このエントリーをはてなブックマークに追加

コメント一覧