先日、OSを64bit環境にしたせいで、以前から使用していたATOK16が、まともに使用出来なくなりました。そこで、この前発売されたばかりのATOK2013を購入することにしました。すると、2013から追加された機能としてVoiceATOKなるATOK辞書を使った音声入力が音声入力が使えると言うじゃないですか。面白そうなので、ガイド片手に早速使ってみることにしました。
ボイスATOKを使うのに必要なもの
まず、VoiceATOKを使うには以下のものが必要です。
当然ながらATOK2013。ベーシック版でも使用出来ます。
ジャストシステム |
あとATOKが音声認識エンジンを使用するためにドラゴンスピーチ11Jも必要。
ジャストシステム |
あとはマイク。たいていのUSBマイクなら、どんなものでもいいと思いますが、余りにも品質の悪いものだと音声入力に大きく影響しますので注意してください。
VoiceATOKの使用方法
まずは、VoiceATOKの使用方法について簡単に説明します。
まずはマイクがしっかり接続されているのを確認してください。ATOK2013はエディターなどで日本語入力を行おうとすると、以下のようなATOKパレットが表示されます。
音声入力を開始するときは、以下の音声入力ボタンを押します。
ATOKパレットが出ない場合は、タスクトレイのアイコンを右クリックして出るメニューからVoiceATOKを選択しても使用出来ます。
VoiceATOKを起動すると以下のようなVoiceパッドが表示されます。
このVoiceパットのマイクボタンを押すことでVoiceATOKを使用した音声入力が開始されます。
VoiceATOKの入力モードについて
では早速、VoiceATOKを使用したいところですが、使用する前に押さえておきたいポイントとしてVoiceATOKの入力モードについて説明します。これを押さえておかないと、思ったように音声入力が出来ないこともあるかもしれません。
VoiceATOKには、標準モード、ATOK辞書モード、ダイレクトモードの三つの音声入力モードが存在します。
標準モード
標準モードは、ドラゴンスピーチ11Jの辞書を使って音声入力が行われます。ですので、基本的に出力されるテキストはドラゴンスピーチ11Jを使った時と、ほぼ同じものが出てきます。標準モード使用時は学習機能も働いています。ドラゴンスピーチ11Jを使用したての場合は、まだ学習が全然されていない状態なので、この標準モードを使用しないと、まともなテキストが出力されないかもしれません。
ATOK辞書モード
ATOKの辞書を使用して音声入力が行われます。今まで、ATOKを使用してきて蓄えてきた変換の傾向や登録されている単語などが反映されるので、ATOKヘビーユーザーには最も有効なモードではないかと思います。ただし、ATOK辞書モード使用時は、学習機能が働きません。
ダイレクトモード
これはほぼ、ドラゴンスピーチ11Jで音声入力するのと変わりません。ですので、今回のVoiceATOKの検証には使用しません。
VoiceATOKを使用する前に
さて、そろそろ音声入力と行きたいところですが、デフォルトのままの設定で使用すると扱いづらいので設定を変更したいと思います。
まずは、音声ガイダンス機能です。VoiceATOKメニューの「プロパティ」を開いて「音声ガイダンス」タブを選択します。
全てのチェックを外します。
この機能が有効になっていると、何かするたびに、音声ガイドが流れます。ただガイドが流れるだけならいいのですが、環境によっては、それを誤ってマイクが拾ってしまい意図しない文字が入力されてしまいます。
次に、句読点自動挿入機能を停止します。VoiceATOKメニューの「句読点自動挿入」を開いて「全般」タブを選択します。
ここの、「句読点を自動的に挿入する」のチェックを外します。
ここのチェックが入っていると、意図しないところで句読点が挿入されるので切っておいた方が無難です。
VoiceATOKで音声入力をしてみた
さて、いよいよVoiceATOKで音声入力をしてみようと思います。読み上げるテキストは、以前にAmiVoice SP2とドラゴンスピーチ11Jを比較したときに、ドラゴンスピーチ11Jで、あまり入力がうまくいかなかった芸能ニュースを読んでみたいと思います。
元の記事
<大塚範一キャスター>「めざまし」で1年3カ月ぶりテレビ生出演 「元気になりました」復活アピール
急性リンパ性白血病のため、11年11月から休養していたフリーキャスターの大塚範一さんが4日、朝の情報番組「めざましテレビ」(フジテレビ系)で、約1年3カ月ぶりに生出演した。大塚さんは、「本当にありがとうございます。ここまで元気になりました」とあいさつした。
大塚さんは自身の後任を務める三宅正治アナウンサーや、番組で共演していた生野陽子アナらの拍手に迎えられ、笑顔で登場。「ゲストに来たのが非常に違和感があるんです」といい、1年3カ月ぶりの朝の生出演に「緊張しました。30分早く起きました」と話した。
http://headlines.yahoo.co.jp/hl?a=20130204-00200004-mantan-ent
標準モードを使用
標準モードの一発変換
<大塚紀香キャスター>「めざまし」で1年3ヵ月ぶりテレビ生出演 「元気になりました」復活アピール
救世リンパ性白血病のため、11年11月から休業していたフリーキャスターの大塚紀香さんが4日、朝の情報番組「めざましテレビ」(フジテレビ系)で、約1年3ヵ月ぶりに生出演した。大塚さんは、「本当にありがとうございます。ここまで元気になりました」とあいさつした。
大塚さんは自身の公認を務める三宅正治アナウンサーや、番組で共演していた庄野洋子アナらの拍手に迎えられ、笑顔で登場。「ゲストに来たのが非常に違和感があるんです」と言い、1年3ヶ月ぶりの朝の生出演に「緊張しました。30分早く起きました」と話した。
一発変換だと出力されるテキストは以前のものとほとんど変わりません。これは、ドラゴンスピーチ11Jの辞書を使っているので当然といえば当然です。
しかし、VoiceATOKの場合、音声入力したテキストがドラゴンスピーチ11Jとは違って未確定のまま表示されます。
ですのでスペースを押して変換候補を表示させ、正しい変換を行えば適切な文字が入力できます。
なのでユーザーが適切な変換を実行していけば、次ぐらいは正しく入力できるようになります。
標準モードで変換をユーザーがなるべく正しく選択
<大塚紀香キャスター>「めざまし」で1年3ヵ月ぶりテレビ生出演 「元気になりました」復活アピール
急性リンパ性白血病のため、11年11月から休業していたフリーキャスターの大塚紀香さんが4日、朝の情報番組「めざましテレビ」(フジテレビ系)で、約1年3ヵ月ぶりに生出演した。大塚さんは、「本当にありがとうございます。ここまで元気になりました」とあいさつした。
大塚さんは自身の後任を務める三宅正治アナウンサーや、番組で共演していた生野陽子アナらの拍手に迎えられ、笑顔で登場。「ゲストに来たのが非常に違和感があるんです」と言い、1年3ヶ月ぶりの朝の生出演に「緊張しました。30分早く起きました」と話した。
この場合、ドラゴンスピーチ11Jの単語登録に「大塚範一」とさえ登録しておけば完璧に入力できるようになるのではないかと思います。
ATOK辞書モードを使用
次はATOK辞書モード使用した場合です。
ATOK辞書モードの一発変換
<大塚乗りかキャスター>「めざまし」で一年三ヶ月ぶりテレビ生出演 「元気になりました」復活アピール
急性リンパ性白血病のため、十一年十一月から休養していたフリーキャスターの大塚乗り加算が四日、朝の情報ばんぐみ「めざましてれび」(フジテレビ系)で、約一年三ヶ月ぶりに生出演した。大塚さんは、「本当にありがとうございます。ここまで元気になりました」と挨拶した。
大塚さんは自信の後任をつとめる三宅正治アナウンサーや、番組で共演していた生野陽子アナらの拍手に迎えられ、笑顔で登場。「ゲストに来たのが非常に違和感があるんです」といい、一年三ヶ月ぶりの朝の生出演に「緊張しました。三十分早く起きました」と話した。
※言葉の意味があっている場合は、赤字にしていません。
使用される辞書がATOKなので、日付や数字などが漢字に変換されています。
ATOK辞書モードでも、ATOKの変換機能は使用できます。以下は、変換機能をなるべく適切に使用した場合。
ATOK辞書モードで変換をユーザーがなるべく正しく選択
<大塚乗りかキャスター>「めざまし」で1年3ヶ月ぶりテレビ生出演 「元気になりました」復活アピール
急性リンパ性白血病のため、11年11月から休養していたフリーキャスターの大塚乗り加算が4日、朝の情報番組「めざましテレビ」(フジテレビ系)で、約1年3ヶ月ぶりに生出演した。大塚さんは、「本当にありがとうございます。ここまでげんきになりました」とあいさつした。
大塚さんは自身の後任をつとめる三宅正治アナウンサーや、番組で共演していた生野陽子アナらの拍手に迎えられ、笑顔で登場。「ゲストに来たのが非常に違和感があるんです」といい、1年3ヶ月ぶりの朝の生出演に「緊張しました。30分早く起きました」と話した。
この場合、ATOKの単語登録に「大塚範一」とさえ登録しておけば完璧に入力できるようになるのではないかと思います。
ATOK辞書モードを使用していて、少し違和感を感じたのは、標準モードと変換タイミングが違う点です。
ATOK辞書モードの場合、句読点が出るまで以下のようにひらがなで入力されます。
句読点を音声入力したタイミングで変換が実行されます。
ここらへんの挙動が、標準モードと違うため最初少し戸惑いました。
VoiceATOKの利点・難点
ここまで使用してきて感じたVoiceATOKの利点と難点をまとめてみたいと思います。〇は利点。×は難点です。
○音声入力結果にATOK変換が使えるのでキーボードで変換する場合は、ドラゴンスピーチ11Jよりこちらの方が手軽
○ATOK辞書モードを使用した場合、使い込んだATOKの辞書を用いて音声入力されるので出力結果が普段ATOKで出てくるものと近い(登録単語なども反映されるのでATOKヘビーユーザーは、こちらのモードが有効かも。)
○ATOKと同様に文節を区切り直して自由に変換できる(AmiVoiceなどは文節を変更して変換できない。ドラゴンスピーチはそもそもキーボードで変換するのに向いていない。)
×動作が不安定(僕の環境だけかもしれませんが、突然Voiceパットが表示されなくなる。WindowsXP、7両OSで確認。)
×ドラゴンスピーチ11Jの音声認識エンジンを使用するので、どうしても重たい
×Voiceパッドが常に最前面に表示される
まとめ
この、VoiceATOKを使う一番の利点はATOKで再変換・文節の区切り直しができることだと思います。普段キーボードを使うのに慣れている人の場合は、こちらのテキスト修正方法の方が、やりやすいのではないかと思います。ただ、音声認識での出力テキスト自体が間違っていた場合は、一旦変換を確定させてからキーボードで修正箇所に戻って、普段のテキスト入力と同様に修正する必要があるのは他の音声認識ソフトと同じです。
僕はもう10何年もATOKを使用しているので、VoiceATOKのテキスト修正方法は慣れ親しんでいてとてもやりやすいです。個人的には、このテキスト修正方法がドラゴンスピーチ11Jの標準機能として使えればありがたいのですが。
ジャストシステム |