記事一覧

ATOK2013を買ったら音声入力のVoiceATOKなるものが付いてきたので試しに使ってみた

  • このエントリーをはてなブックマークに追加

先日、OSを64bit環境にしたせいで、以前から使用していたATOK16が、まともに使用出来なくなりました。そこで、この前発売されたばかりのATOK2013を購入することにしました。すると、2013から追加された機能としてVoiceATOKなるATOK辞書を使った音声入力が音声入力が使えると言うじゃないですか。面白そうなので、ガイド片手に早速使ってみることにしました。

ボイスATOKを使うのに必要なもの

まず、VoiceATOKを使うには以下のものが必要です。

当然ながらATOK2013。ベーシック版でも使用出来ます。

ジャストシステム

あとATOKが音声認識エンジンを使用するためにドラゴンスピーチ11Jも必要。

ジャストシステム

あとはマイク。たいていのUSBマイクなら、どんなものでもいいと思いますが、余りにも品質の悪いものだと音声入力に大きく影響しますので注意してください。


VoiceATOKの使用方法

まずは、VoiceATOKの使用方法について簡単に説明します。

まずはマイクがしっかり接続されているのを確認してください。ATOK2013はエディターなどで日本語入力を行おうとすると、以下のようなATOKパレットが表示されます。

音声入力を開始するときは、以下の音声入力ボタンを押します。

ATOKパレットが出ない場合は、タスクトレイのアイコンを右クリックして出るメニューからVoiceATOKを選択しても使用出来ます。


VoiceATOKを起動すると以下のようなVoiceパッドが表示されます。

このVoiceパットのマイクボタンを押すことでVoiceATOKを使用した音声入力が開始されます。


VoiceATOKの入力モードについて

では早速、VoiceATOKを使用したいところですが、使用する前に押さえておきたいポイントとしてVoiceATOKの入力モードについて説明します。これを押さえておかないと、思ったように音声入力が出来ないこともあるかもしれません。

VoiceATOKには、標準モード、ATOK辞書モード、ダイレクトモードの三つの音声入力モードが存在します。

標準モード

標準モードは、ドラゴンスピーチ11Jの辞書を使って音声入力が行われます。ですので、基本的に出力されるテキストはドラゴンスピーチ11Jを使った時と、ほぼ同じものが出てきます。標準モード使用時は学習機能も働いています。ドラゴンスピーチ11Jを使用したての場合は、まだ学習が全然されていない状態なので、この標準モードを使用しないと、まともなテキストが出力されないかもしれません。


ATOK辞書モード

ATOKの辞書を使用して音声入力が行われます。今まで、ATOKを使用してきて蓄えてきた変換の傾向や登録されている単語などが反映されるので、ATOKヘビーユーザーには最も有効なモードではないかと思います。ただし、ATOK辞書モード使用時は、学習機能が働きません。


ダイレクトモード

これはほぼ、ドラゴンスピーチ11Jで音声入力するのと変わりません。ですので、今回のVoiceATOKの検証には使用しません。


VoiceATOKを使用する前に

さて、そろそろ音声入力と行きたいところですが、デフォルトのままの設定で使用すると扱いづらいので設定を変更したいと思います。

まずは、音声ガイダンス機能です。VoiceATOKメニューの「プロパティ」を開いて「音声ガイダンス」タブを選択します。

全てのチェックを外します。

この機能が有効になっていると、何かするたびに、音声ガイドが流れます。ただガイドが流れるだけならいいのですが、環境によっては、それを誤ってマイクが拾ってしまい意図しない文字が入力されてしまいます。


次に、句読点自動挿入機能を停止します。VoiceATOKメニューの「句読点自動挿入」を開いて「全般」タブを選択します。

ここの、「句読点を自動的に挿入する」のチェックを外します。

ここのチェックが入っていると、意図しないところで句読点が挿入されるので切っておいた方が無難です。


VoiceATOKで音声入力をしてみた

さて、いよいよVoiceATOKで音声入力をしてみようと思います。読み上げるテキストは、以前にAmiVoice SP2とドラゴンスピーチ11Jを比較したときに、ドラゴンスピーチ11Jで、あまり入力がうまくいかなかった芸能ニュースを読んでみたいと思います。

元の記事

<大塚範一キャスター>「めざまし」で1年3カ月ぶりテレビ生出演 「元気になりました」復活アピール
急性リンパ性白血病のため、11年11月から休養していたフリーキャスターの大塚範一さんが4日、朝の情報番組「めざましテレビ」(フジテレビ系)で、約1年3カ月ぶりに生出演した。大塚さんは、「本当にありがとうございます。ここまで元気になりました」とあいさつした。
大塚さんは自身の後任を務める三宅正治アナウンサーや、番組で共演していた生野陽子アナらの拍手に迎えられ、笑顔で登場。「ゲストに来たのが非常に違和感があるんです」といい、1年3カ月ぶりの朝の生出演に「緊張しました。30分早く起きました」と話した。
http://headlines.yahoo.co.jp/hl?a=20130204-00200004-mantan-ent


標準モードを使用

標準モードの一発変換

<大塚紀香キャスター>「めざまし」で1年3ヵ月ぶりテレビ生出演 「元気になりました」復活アピール
救世リンパ性白血病のため、11年11月から休業していたフリーキャスターの大塚紀香さんが4日、朝の情報番組「めざましテレビ」(フジテレビ系)で、約1年3ヵ月ぶりに生出演した。大塚さんは、「本当にありがとうございます。ここまで元気になりました」とあいさつした。
大塚さんは自身の公認を務める三宅正治アナウンサーや、番組で共演していた庄野洋子アナらの拍手に迎えられ、笑顔で登場。「ゲストに来たのが非常に違和感があるんです」と言い、1年3ヶ月ぶりの朝の生出演に「緊張しました。30分早く起きました」と話した。

一発変換だと出力されるテキストは以前のものとほとんど変わりません。これは、ドラゴンスピーチ11Jの辞書を使っているので当然といえば当然です。

しかし、VoiceATOKの場合、音声入力したテキストがドラゴンスピーチ11Jとは違って未確定のまま表示されます。

ですのでスペースを押して変換候補を表示させ、正しい変換を行えば適切な文字が入力できます。

なのでユーザーが適切な変換を実行していけば、次ぐらいは正しく入力できるようになります。

標準モードで変換をユーザーがなるべく正しく選択

<大塚紀香キャスター>「めざまし」で1年3ヵ月ぶりテレビ生出演 「元気になりました」復活アピール
急性リンパ性白血病のため、11年11月から休業していたフリーキャスターの大塚紀香さんが4日、朝の情報番組「めざましテレビ」(フジテレビ系)で、約1年3ヵ月ぶりに生出演した。大塚さんは、「本当にありがとうございます。ここまで元気になりました」とあいさつした。
大塚さんは自身の後任を務める三宅正治アナウンサーや、番組で共演していた生野陽子アナらの拍手に迎えられ、笑顔で登場。「ゲストに来たのが非常に違和感があるんです」と言い、1年3ヶ月ぶりの朝の生出演に「緊張しました。30分早く起きました」と話した。

この場合、ドラゴンスピーチ11Jの単語登録に「大塚範一」とさえ登録しておけば完璧に入力できるようになるのではないかと思います。


ATOK辞書モードを使用

次はATOK辞書モード使用した場合です。

ATOK辞書モードの一発変換

<大塚乗りかキャスター>「めざまし」で一年三ヶ月ぶりテレビ生出演 「元気になりました」復活アピール
急性リンパ性白血病のため、十一年十一月から休養していたフリーキャスターの大塚乗り加算が四日、朝の情報ばんぐみ「めざましてれび」(フジテレビ系)で、約一年三ヶ月ぶりに生出演した。大塚さんは、「本当にありがとうございます。ここまで元気になりました」と挨拶した。
大塚さんは自信の後任をつとめる三宅正治アナウンサーや、番組で共演していた生野陽子アナらの拍手に迎えられ、笑顔で登場。「ゲストに来たのが非常に違和感があるんです」といい、一年三ヶ月ぶりの朝の生出演に「緊張しました。三十分早く起きました」と話した。

※言葉の意味があっている場合は、赤字にしていません。


使用される辞書がATOKなので、日付や数字などが漢字に変換されています。

ATOK辞書モードでも、ATOKの変換機能は使用できます。以下は、変換機能をなるべく適切に使用した場合。

ATOK辞書モードで変換をユーザーがなるべく正しく選択

<大塚乗りかキャスター>「めざまし」で1年3ヶ月ぶりテレビ生出演 「元気になりました」復活アピール
急性リンパ性白血病のため、11年11月から休養していたフリーキャスターの大塚乗り加算が4日、朝の情報番組「めざましテレビ」(フジテレビ系)で、約1年3ヶ月ぶりに生出演した。大塚さんは、「本当にありがとうございます。ここまでげんきになりました」とあいさつした。
大塚さんは自身の後任をつとめる三宅正治アナウンサーや、番組で共演していた生野陽子アナらの拍手に迎えられ、笑顔で登場。「ゲストに来たのが非常に違和感があるんです」といい、1年3ヶ月ぶりの朝の生出演に「緊張しました。30分早く起きました」と話した。

この場合、ATOKの単語登録に「大塚範一」とさえ登録しておけば完璧に入力できるようになるのではないかと思います。


ATOK辞書モードを使用していて、少し違和感を感じたのは、標準モードと変換タイミングが違う点です。

ATOK辞書モードの場合、句読点が出るまで以下のようにひらがなで入力されます。

句読点を音声入力したタイミングで変換が実行されます。

ここらへんの挙動が、標準モードと違うため最初少し戸惑いました。


VoiceATOKの利点・難点

ここまで使用してきて感じたVoiceATOKの利点と難点をまとめてみたいと思います。〇は利点。×は難点です。

○音声入力結果にATOK変換が使えるのでキーボードで変換する場合は、ドラゴンスピーチ11Jよりこちらの方が手軽
○ATOK辞書モードを使用した場合、使い込んだATOKの辞書を用いて音声入力されるので出力結果が普段ATOKで出てくるものと近い(登録単語なども反映されるのでATOKヘビーユーザーは、こちらのモードが有効かも。)
○ATOKと同様に文節を区切り直して自由に変換できる(AmiVoiceなどは文節を変更して変換できない。ドラゴンスピーチはそもそもキーボードで変換するのに向いていない。)
×動作が不安定(僕の環境だけかもしれませんが、突然Voiceパットが表示されなくなる。WindowsXP、7両OSで確認。)
×ドラゴンスピーチ11Jの音声認識エンジンを使用するので、どうしても重たい
×Voiceパッドが常に最前面に表示される


まとめ

この、VoiceATOKを使う一番の利点はATOKで再変換・文節の区切り直しができることだと思います。普段キーボードを使うのに慣れている人の場合は、こちらのテキスト修正方法の方が、やりやすいのではないかと思います。ただ、音声認識での出力テキスト自体が間違っていた場合は、一旦変換を確定させてからキーボードで修正箇所に戻って、普段のテキスト入力と同様に修正する必要があるのは他の音声認識ソフトと同じです。

僕はもう10何年もATOKを使用しているので、VoiceATOKのテキスト修正方法は慣れ親しんでいてとてもやりやすいです。個人的には、このテキスト修正方法がドラゴンスピーチ11Jの標準機能として使えればありがたいのですが。


ジャストシステム

タグ:音声入力 ATOK2013 VoiceATOK ドラゴンスピーチ11J レビュー

  • このエントリーをはてなブックマークに追加

ATOK2013を購入、ATOK16ぶり三度目

  • このエントリーをはてなブックマークに追加

ファイル 576-1.jpgファイル 576-2.jpg

僕は、初めて購入したパソコンにATOKが入っていたことから、それ以来、日本語入力にはATOKを使用しています。かれこれもう10年以上にもなるでしょうか。自分の中では、日本語入力と言ったらATOKといった感じです。

ただ先日、新しくパソコンを購入したことで、OSが64ビット環境になりました。そのせいで、それまで使用していたATOK16(古い)が、64bit用アプリで使用できなくなってしまいました。

でIMEが使えないのは非常に困るので、しょうがないからWindowsのMS-IMEを使用することにしました。だけどMS-IMEと言ったら昔は日本語入力が、かなりおバカでした。ただしかし、ただしかし、それからもう何年か経ってるし、技術も進歩しただろうし、さすがにMS-IMEとはいえ少しは成長しているだろうと思って何年かぶりに使ってみました。が、相変わらずのバカでした。

まー、多少の成長はあったんですが、時々、笑えないボケをカマしてくるのは相変わらずです。結局しばらく使ってみましたが、笑えないボケほどイラつくものはなく、日々ストレスが溜まる一方なので、ある日た「やっぱATOKに帰ろう」と新しいソフトの購入を決めました。


ちょうどその頃、新しくATOK2013が出るということだったので、すぐさま予約しました。

ジャストシステム
Windows 8に対応。ATOKクラウド辞典サービもスタート。


で、その発売日が先日、とうとうやってきましたよ。ということで、ATOK2013が手元に届きました。

届いたものが以下。

中身は、CD-ROM、シリアルナンバーなどが書かれた用紙、取り扱い説明書これだけです。


実際に使ってみて、やっぱり昔から使っているだけあってか、日本語入力に安定感を感じます。ATOK16よりも、大分語彙も増えていると思います。ただ、ATOK16と比較して自分が最も大きな変更点と感じたのは推測変換です。

推測変換機能は、大分前のATOKからあったようなんですが、この2013を購入するまで、そんな機能がついているとはつゆも知りませんでした。一応、GoogleIMEに良い推測変換があるのは知っていたのですが、どうもGoogleは、薄ら怖くって。

話を戻して推測変換とは、以前に入力した文字列が、先頭の何文字か入力すると推測候補として自動的に表示され実際よりも少ない入力で目的の文字列を作成できる機能です。推測候補には、通常の変換候補と同じような一般的なことばやフレーズ、固有人名や地名、慣用句や英単語・英文なども表示されます。


僕なんかは、指が障害でだめなもんでプログラムをするときでもコードの補完機能をガンガン使ってコードを書くので、この機能は非常にありがたい。日本語でも、この補完機能のような少ないキー入力から長い文字列を作り出せるようになったおかげで、日本語入力が捗る捗る。

これにより、プログラムコードなどの半角入力などは、IDEやエディターなどの補完機能。全角入力は、音声入力ソフト+ATOKの推測変換で入力の効率化に死角なしといった感じになりました。

僕は文字を打つのが面倒くさくて、なるべくキーボードを打ちたくないので、設定で一文字目から推測変換をガンガン使う設定にして使用しています。(デフォルトは4文字目から)


あと、このソフトの予約中に知ったのですが、ATOK2013と以前購入したドラゴンスピーチ11Jを連携させることによってATOKの辞書を使って音声入力ができるVoiceATOKという機能があるって言うじゃありませんか。

以前に、AmiVoice SP2とドラゴンスピーチ11Jを比較したときに、少しドラゴンスピーチの辞書に不満があったので、この強力なATOK辞書との連動はドラゴンスピーチ音声入力の弱い部分を補強してくれるのではないかと、かなり期待しています。ではこれから、説明書とにらめっこしながらVoiceATOKを使ってみたいと思います。


実際に使用してみた感想は次回以降に書きたいと思います。
続き:ATOK2013を買ったら音声入力のVoiceATOKなるものが付いてきたので試しに使ってみた

ATOK2013には、ダウンロード版もあります。

ジャストシステム

タグ:ATOK2013 ドラゴンスピーチ11J ソフトウェア 日本語入力 レビュー

  • このエントリーをはてなブックマークに追加

二大音声認識ソフトを徹底比較「AmiVoice SP2」VS「ドラゴンスピーチ11J」

  • このエントリーをはてなブックマークに追加

去年の10月にドラゴンスピーチ11Jを購入して、約3ヶ月間ずっと使用してきました。しかし先日、AmiVoice SP2の評判の良さを知って以来、どうしても試してみたくなり、衝動的にAmiVoice SP2も購入することになってしまいました。しかし、おかげで両方のソフトを比べて使えるようになりました。せっかく比べれる環境になったので、早速両者のソフトを比較してみることにしました。


以下が今回比較するソフトです。

AmiVoice SP2とドラゴンスピーチ11J
 

実際に両者を使用してみて、真っ先に思ったことは「両者とも甲乙つけがたい…」ということ。というのも、ドラゴンスピーチにもAmiVoiceにも両方に良い面と悪い面が混在していて、「〇〇という機能はドラゴンスピーチの方がいいのだけど、〇〇はAmiVoiceの方がいいよなぁ」ということが多いです。

それに、両者にはそれぞれ得意分野があってユーザーの音声認識ソフトに求める要求と環境によっては、どちらとも上になり得るからです。そこで今回は、両ソフトの機能を細かく見ていくことによって、それぞれのソフトの強みもしくは弱みについて書いていければと思います。


使用環境

両ソフトを比較する前に、まずはソフト動かした使用環境です。

パソコンは以下の2台で試しています。

□ Windows XP機
 CPU:Core2 Quad
 メモリ: 3.5 GB
 SSD使用なし

□ Windows 7 64bit機
 CPU:Core i7 3820QM
 メモリ: 32 GB
 SSD使用あり

両ソフトは、XP環境でも7 64bit環境でも問題なく動作します。

両方のマシンとも音声認識ソフトを使用するときは、「SANWA SUPPLY MM-MCUSB16」というマイクを使用しています。値段の割にはクリアな音を拾ってくれる品質の良いマイクです。

サンワサプライ
パソコン内部のノイズに強いUSBマイクです。


音声認識率

音声認識ソフトを使う人のほとんどが「テキスト入力をもっと楽に行いたい」と考え利用していると思います。そういった意味では、この声に出した文章がどのくらい正確にテキスト化されるかと言う音声認識率は、非常に重要で音声認識ソフトの核とも言えます。

ということで、ドラゴンスピーチ11とAmiVoice SP2の音声認識率を比較してみたいと思います。ちなみに、ソフト使用期間は、ドラゴンスピーチ11が約3ヶ月。AmiVoice SP2が約3日ほど(この文章作成時のレベルは4となっています。

まずは、Yahoo!ニュースから適当に記事を選び、両ソフトで読んでみたいと思います。修正はせずに文節ごとの一発読みです。(※言い間違えたり、言いよどんだり、かんだりした場合は、キャンセルしてもう一度発声しています。)


元の記事

「尖閣」も世界遺産登録を 石垣市、国に現地調査要請へ
政府が世界自然遺産に「奄美・琉球」(鹿児島県、沖縄県)の登録を目指していることに関連し、沖縄県石垣市が、日本の領土である尖閣諸島を対象地域に含めるよう国に求めるとともに、登録に向けた現地調査を実施できるよう働きかける方針であることが3日、分かった。同市の中山義隆市長(45)は「国際機関に登録が認められれば、尖閣諸島が日本の領土ということがより一層、明確になる」としている。(産経新聞)
http://dailynews.yahoo.co.jp/fc/world/world_heritage/?1359943576


ドラゴンスピーチ11Jでディクテーション

「尖閣」も世界遺産登録を 石垣市、国に現地調査要請
政府が世界自然遺産に「奄美・琉球」 (鹿児島県、沖縄県)の登録を目指していることに関連し、沖縄県石垣市が、日本の領土である尖閣諸島を対象地域に含めるよう国に求めるとともに、登録に向けが現地調査を実施できるよう働き掛ける方針であることが3日、分かった。同市の中山義隆市長(45)は「国際機関に登録が認められれば、尖閣諸島は日本の領土と言うことがより一層、明確になる」としている。 (産経新聞)


AmiVoice SP2でディクテーション(レベル4)

「尖閣」も世界遺産登録を 石巻市、国に現地調査要請へ
政府が世界自然遺産に「奄美・琉球」(鹿児島県、沖縄県)の登録を目指していることに関連し、沖縄県石垣市が、日本の領土である尖閣諸島を対象地域に含めるよう国に求めるとともに、登録に向けた現地調査を実施できるよう働きかける方針であることが3日、わかった。同市の中山義隆市長(45)は「国際機関に登録が認められれば、尖閣諸島が日本の領土ということがより一層、明確になる」としている。(産経新聞)

どちらも結構いい感じですね。入力のコツとしては、どちらのソフトも句読点から句読点を一気に読むようにすると認識率が向上します。言いよどんだりせず、ハキハキと発声すれば、両者ともかなり正確に認識してくれます。


他にももう一つニュースを読んでみます。今度は芸能ニュースあたり。


元の記事

<大塚範一キャスター>「めざまし」で1年3カ月ぶりテレビ生出演 「元気になりました」復活アピール
急性リンパ性白血病のため、11年11月から休養していたフリーキャスターの大塚範一さんが4日、朝の情報番組「めざましテレビ」(フジテレビ系)で、約1年3カ月ぶりに生出演した。大塚さんは、「本当にありがとうございます。ここまで元気になりました」とあいさつした。
大塚さんは自身の後任を務める三宅正治アナウンサーや、番組で共演していた生野陽子アナらの拍手に迎えられ、笑顔で登場。「ゲストに来たのが非常に違和感があるんです」といい、1年3カ月ぶりの朝の生出演に「緊張しました。30分早く起きました」と話した。
http://headlines.yahoo.co.jp/hl?a=20130204-00200004-mantan-ent


ドラゴンスピーチ11Jでディクテーション

<大塚紀香キャスター> 「めざまし」で1年3ヵ月ぶりテレビ生出演 「元気になりました」復活アピール
旧制リンパ性白血病のため、11年11月から休養していたフリーキャスターの大塚紀香さんが4日、朝の情報番組「めざましテレビ」 (フジテレビ系)で、約1年3ヵ月ぶりに生出演した。大塚さんは、 「本当にありがとうございます。お困り元気になりました」とあいさつした。
大塚さんは自身の公認を務める三宅正治アナウンサーや、番組で共演していた庄野洋子アナの拍手に迎えられ、笑顔で登場。 「ゲストに来たのが非常に非常に違和感があるんです」といい、 1年3ヶ月ぶりの朝の生出演に「緊張しました。 30分早く起きました」と話した。

「公認」や「庄野洋子」は、間違えていますが修正ダイアログを開くと修正候補に出ているので、すぐさま修正できると思います。日付や数字などもパッチリと認識されています。


AmiVoice SP2でディクテーション(レベル4)

<大塚範一キャスター>「めざまし」で1年3ヶ月ぶりテレビ生出演 「元気になりました」復活アピール
急性リンパ性白血病のため、11年11月から休養していたキャスターの大塚範一さんが4日、朝の情報番組「めざましテレビ」(フジテレビ系)で、約1年3ヶ月ぶりに生出演した。大塚さんは、「本当にありがとうございます。ここまで元気になりました」と挨拶した。
大塚さんは自身の公認を務める三宅正治アナウンサーや、番組で共演していた生野陽子アナらの拍手に迎えられ、笑顔で登場。「ゲストに来たのが非常に違和感があるんです」といい、1年3ヶ月ぶりの朝の生出演に「緊張しました。30分早く起きました」と話した。

こちらも「公認」の修正変換候補に「後任」が出ているので、すぐさま修正できると思います。

それにしても、AmiVoice SP2の認識率が素晴らしい。前回も書きましたが固有名詞の認識が素晴らしいです。特に、大塚さんやアナウンサーの名前が一発で出るのには驚かされます。


あくまで僕の個人的な意見ですが、これまで実際に使ってきた感じや、これらの結果を見れば、音声認識率についてはAmiVoice SP2に軍配が上がると思います。ドラゴンスピーチがだいたい3ヶ月使用しているのに対して、AmiVoiceなんてせいぜい3、4日です。それでいて、この認識率には、もはや感動すら覚えました。

加えて、音声入力スピードもAmiVoiceの方が軽くてスムーズです。どちらのソフトも僕がいつも使っているエディターに直接入力で音声入力させているのですが、AmiVoiceの方が安定していますね。ドラゴンスピーチもサクサク認識する時はするのですが、スペックの低いパソコンだったり、Windowsを長時間動かしている時など、実際に音声認識が開始されるまで、かなり時間がかかったりすることがあります。

それに、発声から文字になるまでの時間もAmiVoiceの方が短いです。これは、AmiVoiceの辞書の語彙数の方が少ないので検索時間が少なくて済むことにもよるのでしょう。

それにしても前情報では、ドラゴンスピーチ11は語彙数が約100万語、AmiVoice SP2の語彙数は約20万語とのことだったので、認識率もAmiVoiceの方がよかったという結果は、かなり意外でした。AmiVoiceの方が辞書と認識エンジンが効果的に使われているのかもしれません。ただ、どちらのソフトも実用十分なほど認識してくれるので、ほんとに甲乙は付けがたいです。人によっては、ドラゴンスピーチの方が良いという人もいると思います。


テキストの編集方法

テキストの修正方法については、両者には大きな違いがあります。ドラゴンスピーチの方は、完全に声で選択、削除、修正、他多数のことができますが、 AmiVoice SP2場合は、基本的に修正はマウスやキーボードを使って行わなければなりません。ここら辺は、好みの問題だと思います。


何から何まで声で行いたい場合は、ドラゴンスピーチの方が向いています。修正からダイアログ操作まで、こちらの方は徹底して声でできるようになっています。僕自身も、直前に入力していた文章をやり直す「取り消し」コマンドや、狙った語句をピンポイントで修正できる「修正 ○○」機能が便利すぎて、多用しまくっています。


AmiVoiceでの修正は、マウスやキーボードを使って行うことになると思います。一応、音声コマンドもあって声だけで編集したりは出来なくもないのですが、あまり実用的ではありません。ただ音声コマンドにより編集が必要のない場合は、キーボードと組み合わせることで素早く編集することができるので、音声とキーボード両輪でテキスト入力を行っていく場合には効果を発揮すると思います。(※これはドラゴンスピーチでもできますが、多少AmiVoiceのほうがやりやすい。)


このテキスト編集の点において、文章の校正などを全て声で(声主体で)やりたいという場合は、ドラゴンスピーチ11Jしか選択肢はないと思います。


特徴的な機能

ここでは、メイン機能ではないけれど、それぞれのソフトにしかない機能を紹介したいと思います。

ドラゴンスピーチ11Jにしかない機能

□パソコンや、アプリケーションなどの操作
□iPhone/Androidアプリ(無料)を使っての、Wi-Fi経由でパソコンへの音声入力・操作
□英語入力に対応
□Google、 Facebook、Twitterなどにいつでも検索・投稿できる
□完全にタスクトレイに収納して使用することができる(AmiVoice SP2は出来ない)
□マイクを切り忘れても〇〇分後にマイクをスリープ状態にするなどの設定ができる


AmiVoice SP2にしかない機能

□入力する文書の種類によって、辞書を切り替えて使用できる
□辞書学習を効率化できる「テキストを学習ウィザード」がある
□効率的に入力できるスピーチマイクを使ってのディクテーションができる
□音声ファイルの書起し専用のエディタがある
詳しくはこちら


音声入力以外の機能の豊富さで言ったら、ドラゴンスピーチになると思います。パソコンそのものの機能を音声で操作したい場合や、スマートフォンから使いたい場合、英語入力がしたい場合は、選択肢はドラゴンスピーチしかないです。


エディターの使い勝手

両ソフトには、どちらにもデフォルトでエディターが付属しています。ただ、どちらもエディターもひどく使いにくいです 。以下では、それぞれのエディターの特徴について書きたいと思います。

ドラゴンスピーチ11JのDragonエディター


正直言ってかなり使いづらいです。デフォルトの文字の大きさが変更できないので不便。中でも最も困るのが、テキストをマウスで選択しようとしたとき。上のキャプチャーは、「最重要課題」と選択しようとしているのですが、どうしても余計なところまで選択されてしまいます。コピペをするときこれは、かなりイライラします。

AmiVoice SP2のエディター


Dragonエディターよりもマシではあるものの、こちらもお世辞にも使いやすいとはいえないエディターです。D&Dでのテキスト移動はできないですし、閉じるボタンを押すと、「保存しますか?」の確認のダイアログもなしにエディターが閉じられてしまうので、テキストをロストしてしまう恐れがあります。


これらのエディターに比べたら、まだブラウザのテキスト入力ボックスの方が使いやすかったりします。僕の場合は、両者とも使わず、いつも使用している使い慣れたエディターに直接入力して使用しています。直接入力した場合でも、ドラゴンスピーチ・AmiVoice双方とも修正機能が使えるので、大して問題ありません。


それぞれの長所と短所

僕がこれまでに、それぞれのソフトを使用してきて感じた、長所と短所を以下に箇条書きしたいと思います。〇は長所、×は短所です。

ドラゴンスピーチ11J

○認識率が良い
○音声コマンドが豊富で、テキスト編集が全て声でできる
○アプリケーションの操作などもできる
○機能が豊富(英語入力、スマホ入力など)
×デフォルトのエディターが使いづらい
×起動が遅い
×音声入力からテキストへの変換が遅い
×動作が不安定(たまに固まる)
×直接入力するとエラーダイアログが出て入力できないことがある(Windowsを長時間起動していると起きやすい)
×以前のドラゴンスピーチ2005のとき、Windows7の対応パッチを出さなかったことから、サポート面で少し不安

ドラゴンスピーチは、機能が豊富なだけに、重いのはしょうがないのかもしれません。低スペックパソコンだと、動作はかなりストレスのあるものになると思います。ただ、SSDを搭載しているパソコンだと結構サクサク動きます。


AmiVoice SP2

○認識率がとても良い
○起動が速い
○音声入力から変換までが速い
○動作が安定している
○音声ファイルの書き起こしエディターで、音声→テキストを効率的に行える
×声でのテキスト編集がかなりしづらい
×デフォルトのエディターが使いづらい
×アプリケーションの操作などはできない
×マウス操作ではタスクトレイから一旦出さないと使用出来ない(ホットキー操作でなら使用可能)
×マイクの自動スリープ機能がないために、マイクを切り忘れると悲惨なことに


AmiVoiceはテキスト入力だけに特化したといった感じだけあって、軽いです。動作環境を満たしていれば、低スペックのパソコンでも、十分いい働きをしてくれそうです。


まとめ

これまで両音声認識ソフトを使用してきた感想は、最初に書いた通り正直どっちも甲乙つけがたいです。ただ、音声入力機能に特化して使用するのであれば、僕はAmiVoice SP2を推したいと思います。テキスト入力に特化するならば、認識率も良く、軽く、安定しているAmiVoice SP2がストレスなく使えると考えます。AmiVoice SP2にも不満がないわけではありませんが、それを補って余りある音声入力ソフトだと思います。


一方、体に障害などがあったりしてキーボード操作などが行えない場合、豊富な機能を使いたい場合は、ドラゴンスピーチ11Jだと思います。ドラゴンスピーチはコマンドさを覚えてしまえば、ものすごく手軽にテキストを修正およひ単語の学習ができます。この、音声コマンド操作に関してはAmiVoiceは逆さまになったってかないません。


身も蓋もないことを言ってしまえば、AmiVoice SP2の音声入力機能に、ドラゴンスピーチ11Jの音声コマンドによるテキスト編集機能が付いて、エディターがもっと使いやすくなれば最高なんですが。これは今後に発売される両メーカーの音声認識ソフトに期待したいと思います。


エムシーツー
話すだけで簡単にPC入力。事前に声の登録の一切必要のない次世代音声認識エンジンを搭載。

ジャストシステム
Windowsでキーボードに代わって声でテキストを入力したり、「アプリケーションの起動」や「ファイルの保存」などの操作も声で行うことができる、音声ソフトウェア。

続き:ATOK2013を買ったら音声入力のVoiceATOKなるものが付いてきたので試しに使ってみた

タグ:AmiVoice SP2 ドラゴンスピーチ11J 音声認識 音声入力 レビュー

  • このエントリーをはてなブックマークに追加

思った以上に進化していた音声認識ソフト「Amivoice SP2」、「Amivoice SP」との主な違い 7つのポイント

  • このエントリーをはてなブックマークに追加

ファイル 570-1.jpgファイル 570-2.jpg

前回、AmiVoice SP2を初めて使用した時の感想にも書いたのですが、Amivoiceの前バージョンであるSPかSP2への変化が結構なものだったことから、今回は主に変化したところを7つのポイントに分けて書いていきたいと思います。

エムシーツー
話すだけで簡単にPC入力。事前に声の登録の一切必要のない次世代音声認識エンジンを搭載。

インターフェイス

とりあえず今回のアップグレードで、デフォルトのインターフェイスは以下のように変化しました。

上が「Amivoice SP2」。下が以前の「Amivoice SP」です。


1.辞書が大幅に強化

今回のSP2で音声認識率が飛躍的に向上しました。それは今回のアップグレードで辞書の補強を含む音声認識エンジンが大幅に強化されたらです。中でも辞書については、語彙数が20万語になりました。これは前バージョン(SP)の語彙数が4万語だったのと比較すると、約5倍になります。

実際に使用してみて特に、固有名詞の強化を感じました。ちょっとした有名人・地名とかなら、かなりの確率で一発表示されると思います。

試しにいくつか例を挙げると、安倍晋三、麻生太郎、森喜朗、谷垣禎一、山本一太、鳩山由紀夫、菅直人、野田佳彦、樽床伸二、石原慎太郎、橋下徹、仲井真弘多(沖縄県知事)、桜木花道、キン肉マン、野比のび太、源静香、孫悟空、空条承太郎、東方定助、堤さやか、長瀬愛、宮下杏奈、吉沢明歩.成瀬心美、などなど。

自分で適当に入力してみてビックリしたのですがこれらの固有名詞が変換なしに一発で出ます。


2.切り替えれるマスター辞書の種類が変わった


(上のキャプチャは、前バージョンからアップグレードしたので前回使用していたマスター辞書が引き継がれています。)


以前のSPでは切り替え可能なマスター辞書は、「ブログ日記・メール」「しゃべりことば」「書きことば」「政治経済」の4つでしたが 、 SP2では「標準(小)」「標準(大)」「政治経済」「数値認識」「登録単語認識」の5つになりました。


今回登録されているマスター辞書の主な特徴

標準(小):前バージョンと同じ4万語の辞書。小さめの辞書なので辞書検索にかかる時間が少なく、低スペックのパソコン向け。
標準(大):20万語と大幅に強化された辞書。音声認識率は非常に高くなるが、辞書検索処理の時間がかかるため、発声から文字になるまで多少のタイムラグがある。高いスペックのパソコンだとあまり感じない。
政治経済:政治用語、経済用語で出てくるような、お堅い文章を書きたいとき用の辞書。
数値認識:ただ数字だけを入力したいときに使用する辞書。エクセルなどの数値入力時に有効。
登録単語認識:ユーザーが登録した単語のみを認識する辞書。


これまでに使っている感じでは、それなりにスペックのあるパソコンで文章入力する場合は、標準(大)だけで十分のような気がします。マスター辞書をいちいち変更するのもめんどくさいですし。


3.辞書学習を効率化できる機能の追加

今回、AmiVoiceのメニューに「テキストを学習ウィザード」というものが追加されました。その機能とは、マスター辞書に収録されていない「未知の語」を、ユーザーが持っている既存のテキストファイルから抽出し、検出された未知の語句に読みをふって学習させ、さらに辞書を強化する機能です。これにより、ユーザは過去に書いたテキストから辞書を、さらに鍛えあげることができ、さらなる認識率向上を図ることができるようになります。


4.音声コマンド拡張機能がついて、アプリの起動やファイル操作のもできるようになった

既存の音声コマンドの他にも、ユーザーが作りたい音声コマンドを自から作成できるようになりました。

また、AmiVoice SP2の機能やキー入力、プログラムの実行、スリープなどを組み合わせて、新たなカスタムコマンドを作成することができます。さながらAmiVoice用のマクロみたいなもんです。


5.スピーチマイクを使ってのディクテーションができるようになった

説明書によるとスピーチマイク LFH3200を使用することで、音声入力、付属のボタンで、マイクのオン/オフのコントロール、単語の次候補の選択、 および決定、転送などをコントロールすることができるようになり、より効率的に音声入力による文書作成を行うことができます。

ただ、別売りの気になるLFH3200のお値段は、思ったより高い。

エムシーツー
AmiVoiceに最適な高性能USBハンドマイク。高度なノイズキャンセリング機能による録音と再生はもちろん、マイク一体となった防塵対策のされた光学式トラックボールで正確なマウス操作が可能。音声認識とPC操作を強力にバックアップします。前面6つの音声認識操作ボタンと、背面のボタン、3つのファンクションボタンはAmiVoiceから自由にキーコンフィグレーション可能で、ボタン一つでアプリケーションを操作したり、音声文字変換した文章をアプリケーションに転送することができます。


6.書起しエディタにより音声ファイルからのテキスト化がより楽になるらしい

AmiVoice SP2から「書起しエディタ」という新しいアプリケーションが加わって、音声ファイルのテキストがしやすい環境になったようです。

僕は、音声ファイルからのテキスト化をしたことがないので、効果の程は、よくわからないです。

7.その他のちょっと嬉しい細かな変更

新しくSP2を出すにあたって、いろいろとユーザーから意見を聞いて反映させたということで、嬉しいへ変更が各所に施されています。個人的に気が付いただけを以下に箇条書き。

□音声入力中に単語登録ができる(SPまでは、一端マイクをオフにしなければ登録できなかった)
□音声入力中に設定変更ができる(SPまでは、一端マイクをオフにしなければ登録できなかった、ただしマイクはオフになります)
□エディターの表示色や記号表示などの細かな設定ができるようになった
□アプリケーションから自動アップデートが行われる(以前は自分で確認して手動でやらなければいけなかったのが.かなりめんどくさかった)


あと欲をいえば「音声入力をしないまま10分経つと、自動的にマイクがオフ状態になる機能」とかが欲しいですね。よくマイクを切り忘れて、テレビの音を学習させちゃったりということがよくあるもので。

それともう一つ「タスクトレイアイコンのクリックでマイクのオン/オフを切り替えられる機能」もぜひ欲しい。いちいちタスクトレイから出してマイクのオン/オフを切り替えをするのが面倒くさいんですよね。

この二つの機能さえ追加されれば、僕個人としてはAmiVoice SP2は、ほぼ完璧と言っていいと思います。今度、エムシーツーに要望を出しておこうかと思います。


まとめ

ここまで、7つにわたって「AmiVoice SP→AmiVoice SP2」の変更点について紹介してきました。いろいろと変更点があったり、便利な機能を追加されたりもしましたが、中でも一番インパクトを与えられたのは、やっぱり辞書機能の強化です。これに尽きます。前回も書きましたが、AmiVoice SPのレベル126(単語登録しまくり)より、AmiVoice SP2のレベル1(単語登録なし)の方が遥かに優秀だと思います。以前のAmiVoiceを使用していた時に感じていたイライラが今回はほとんどありません。

音声認識ソフトにとって核となる認識エンジンと辞書の充実こそ、ソフトの満足度に比例すると思います。そういった意味では、今回のグレードアップは僕にとって、かなり満足度の高いものとなりました。

まーそれでも、人間とは強欲なもので使っていくうちに「もっとここは」ってところが出てくるのでしょうけど。だってSPだって以前はそれで、すげーすげーと満足していたんだもの。


次回は、今回購入したAmiVoice SP2と以前購入したドラゴンスピーチ11Jを徹底比較したいと思います。


続き:二大音声認識ソフトを徹底比較「AmiVoice SP2」VS「ドラゴンスピーチ11J」


エムシーツー
AmiVoice SP2マイクなしバージョン

タグ:音声認識 音声入力 AmiVoice SP2 レビュー

  • このエントリーをはてなブックマークに追加

辞書が強化され新しく生まれ変わった音声認識ソフト「AmiVoice SP2」を衝動買い

  • このエントリーをはてなブックマークに追加

ファイル 569-1.jpgファイル 569-2.jpg

先日、ドラゴンスピーチ11Jを発売日に購入しました。日本では、7年ぶりの発売で待ちに待った甲斐もあってか、以前のものと比べて高い音声認識率を誇り、テキスト入力がはかどる素晴らしいソフトでした。

しかし、その発売から約1ヶ月後に、ドラゴンスピーチ11Jと対を成す音声認識ソフトのAmiVoiceがSPからSP2と進化して発売されるというじゃありませんか。すぐさまAmazonでポチりそうになったのですが、ドラゴンスピーチ11Jを購入したばかりで、お財布的にしばらく自重していたのですが、やはりどうしてもこちらも使ってみたくなり結局購入してしまいました。

エムシーツー
話すだけで簡単にPC入力。事前に声の登録の一切必要のない次世代音声認識エンジンを搭載。

AmiVoice SP2到着

で、届いたのが以下。

僕は以前にAmiVoice SPを購入していたので、今回は値段の安いアップグレード版を購入しました。

エムシーツー
旧バージョンAmiVoice SPを持っている人用アップグレードバージョンです。

中身はこんな感じ。


入っていたものは、AmiVoice SP2CD-ROM、説明書、ライセンス番号とインストールキーが記載された紙、ユーザー登録用のはがき、アップグレード用のインストールガイドです。


早速インストール

で、早速インストールしてみました。

インストールガイドをもとにインストール手続きを行っていきます。


アップグレードの場合は、以前のAmiVoice SPがインストールされていた場所に上書きインストールで問題ありません。


インストールが完了すると、アップグレードバージョンの場合は、以前使用していたデータにアップグレード処理をするかの確認ダイアログが出ますので、以前のデータを使用したい場合は「はい」を押してください。「いいえ」を押してしまうとデータが初期化されてしまうので注意してください。

このAmiVoice SP2からアップデートがある場合は、ソフトから自動アップデートできるようになりました。

SPの時は、エムシーツーからアップデーターを手動でダウンロードしてインストールする必要があったので.これは楽です。

早速ディクテーション

僕は以前、AmiVoice SPを使用していた時、レベルが最高の126になっていたのですが、そのデータを使用しては意味ないので新しくユーザーを作成してレベル0から試してみることにしました。

新しくAmiVoice SP2用にユーザーを作成します。


で、早速音声入力してみました。ただ、レベル0だと結構間違うので.とりあえずレベル1になるまで適当な文章を読みます。レベル0でもそれなりに認識しますが、レベル0の場合はユーザーの発声やくせなどの情報が全くない状態なので、レベル1になるまでユーザー情報をAmiVoiceに与えてやります。

五分もかからないうちにレベル1になったので適当に、Yahoo!ニュースにある文章を読んでみます。とりあえずトップにあった文章を読んでみました。(※かんだり、言い間違えたりした時は読み直しました)

元の記事

安倍首相「領土・領海守り抜く」 沖縄で自衛隊を激励
 安倍晋三首相は2日午前、就任後初めて沖縄県を訪問した。米軍普天間飛行場(宜野湾市)の県内移設に向けた沖縄との関係改善の糸口を探るとともに、尖閣問題などで緊張が高まっているこの地域の、自衛隊や海上保安本部を激励するのが目的。午後には仲井真弘多(ひろかず)知事と会談する。(朝日新聞デジタル)
http://dailynews.yahoo.co.jp/fc/domestic/senkaku/?1359776440

標準(大)辞書でディクテーション(レベル1)

安倍首相「領土・領海守り抜く」沖縄で自衛隊を奨励
安倍晋三首相は2日午前、就任後初めて沖縄県を訪問した。米軍普天間飛行場(宜野湾市)の県内移設に向けた沖縄との関係改善の糸口を探るとともに、尖閣問題などで緊張が高まっているこの地域の、自衛隊や海上保安本部を奨励するのが目的。午後には仲井真弘多(ひろかず)知事と会談する。(朝日新聞デジタル)

これはマジですごい。全角半角文字の違いはあれど、ほとんど意図した入力になっています。(激励と奨励は読み間違えたかもしんない…。)特にすごいのが固有名詞。「安倍晋三」とか「米軍普天間飛行場(宜野湾市)」とか「仲井真弘多(ひろかず)」とかが普通に出る。特に、「仲井真弘多(ひろかず)」が変換なしに括弧内も一発で出たのは、どういう原理かは知らないけど、かなり驚いた。


もう一つほどニュース記事をYahoo!ニュースから。

元の記事

ATMにスキミング装置 首都圏6カ所、130口座被害
防犯カメラ装い暗証入力を撮影
 新生銀行とシティバンク銀行の首都圏6カ所の現金自動出入機(ATM)に昨年10~12月、キャッシュカード情報を読み取るスキミング装置が取り付けられていたことが、捜査関係者への取材でわかった。警視庁は、東欧系の外国人グループによる犯行とみて建造物侵入などの疑いで捜査している。(朝日新聞デジタル)
http://dailynews.yahoo.co.jp/fc/domestic/trespass/?1359778445

標準(大)辞書でディクテーション(レベル2)

ATM にスキミング装置 首都圏六ヶ所、130幸田しない
防犯カメラ装い暗証入力を撮影
新生銀行とイーバンク銀行の首都圏6ヶ所の現金自動出入機( ATM )に昨年10~12月、キャッシュカード情報を読み取るスキミング装置が取り付けられていたことが、捜査関係者への取材でわかった。警視庁は、統計の外国人グループによる犯行とみて建造物侵入などの疑いで捜査している。(朝日新聞デジタル)


(写真の赤文字はコンピューターが間違って入力された可能性が高いと判断しているところ)


これは結構間違えましたね。シティーバンクとイーバンク、東欧系と統計みたいな発音が似ているものは、判断が難しいようですね。


感想

それにしても、AmiVoice SP2で辞書が強化されたとは聞いていたけど、ここまで強化されているとは思いませんでした。ここまでSP2で音声入力してきて、レベル4まで上がりました。ちょっと前まで前バージョン(SP)をレベル126まで上げて使用していましたが、正直すでに認識率はそれよりも上です。単語登録なんかまだ一つもしてないのに。

音声入力機能だけとればドラゴンスピーチ11Jに負けてないと思います。今回は「前バージョンより多少でも認識率が良くなっていればなー」くらいの気持ちで購入したのですが、全く別物と言っていいくらい辞書が強化されていると思います。エムシーツーもライバルのドラゴンスピーチに対抗して、かなりここには力を入れたのではないでしょうか。

それにしても、こういったライバル社同士が、お互いに競い合い、より良いソフトが使えるということはユーザーにとって、とてもありがたいことです。このように音声認識ソフトがブラッシュアップされていくのを見るのも、結構な楽しみだったりします。10年以上前に初めてIBMのViaVoiceを使用したときの絶望感からみたら、ものすごい進歩だとしみじみ。


最後に、AmiVoice SPとSP2では、機能面などかなり追加されました。次回は、そのいろいろな違いについて書きたいと思います。

続き:思った以上に進化していた「Amivoice SP2」、「Amivoice SP」との主な違い 7つのポイント

エムシーツー
AmiVoice SP2マイクなしバージョン

タグ:音声認識 音声入力 AmiVoice SP2 レビュー

  • このエントリーをはてなブックマークに追加

ページ移動