Googleドキュメントの音声入力で記事作ったら早かった件
前書き
こんにちは。K-DADです。
今日はブログの記事執筆を音声入力でやってみたらどうなるか、検証してみました。
このタイ買い付けのブログも30記事になって、これまで執筆してきた感想を述べるとひとこと
「文章書くのってホント大変!!」
これに尽きます。
他の長く続けているブロガーさん、尊敬します。
K-DADは今までの記事、だいたい2000-3000文字の記事が多いんですけど
だいたい毎回3時間くらいかけて書いています。
題材がもともと知識の蓄積があるタイのことなので頭の中ではだいたい文章がまとまってるんですけど、いざ文字に起こすためにタイピングとなるとK-DADはタイピングが遅いので、誤字がないかなんてチェックしながら打ってるとものすごい時間がかかってしまうんですね。
人差し指でピポパポということはないですけど、ブラインドタッチもできないし、指の置き方も完全自己流です。
ですので話すように音声入力で記事ができたら早いんじゃね?と思って試してみようと思ったのがきっかけです。
で、やってみました。
結果から言うと大きな可能性を感じたのでシェアします。
グーグルドキュメント 音声入力
音声入力にもいろいろな方法があると思いますが、
K-DADはグーグルドキュメントの音声入力でやってみました。
これはスマホでやるならスマホのマイクでできるので、追加費用ゼロで始められます。
PCでやるならマイクが必要ですがアマゾンなら2000円以内で買えます。
こんなので十分です。
グーグルドキュメントはグーグルのアカウントを持っていれば誰でも無料で使えます。
もしGメールのアドレスを持っているなら持っているはずです。
なくてもすぐ作れますのでひとつ持っておきましょうか。
Gメールも大変便利ですからね。
グーグルドキュメント 音声入力のやり方
グーグルドキュメントを開いたら
- PCの場合は「ツール」「音声入力」と進んでいくとマイクマークが現れるのでマイクをクリックすると音声入力が開始できます。
- スマホの場合は文字入力欄の右にマイクマークが出るのでそこをタップして音声入力モードに切り替えます。
音声入力 vs ハンドタイピング
で、あるサンプルの文章を用いて音声入力とハンドタイピングでどちらが早いか勝負させてみました。
サンプルに用いた文章はこちら:
K-DADの自己紹介の記事です。
純粋な記事文章の文字数を数えたら2823文字の記事でした。
原稿用紙約7枚ちょっとの文章量ですね。
あ、文章の文字数を数えたいならこちら
すでにある文章を打ち込む(しゃべる)ので、想定としてはほとんど文章の草稿が頭の中で固まっている記事内容を打つ(しゃべる)というパターンですね。
まず、ハンドタイピングからスタート!
・・・カチカチ
・・・カチカチ
・・・カチカチ
10分経過、
・・・カチカチ
・・・カチカチ
15分経過、まだ半分か・・・
・・・カチカチ
・・・カチカチ うっ、指が疲れてきた
・・・カチカチ
30分経過 意外と時間かかるな、
終了!!
時間は37分24秒。
自分としては意外と遅かったなという印象。やっぱりタイピング遅いですね。
次、
音声入力、スタート(ちなみにスマホでやりました)
記事文章を印字しておいて読み上げていく。
K-DADは滑舌が悪い(汗)のでスマホちゃんが認識できるように、いつも話すより少しゆっくり、はっきり話してあげます。
時々、音声入力モードが解除されていることがあるのでその時はしゃべったことが無駄になります。画面をチェックしながらしゃべる必要があります。
わかったこと。
句読点(。)て音声入力では入れられないんだ・・・
「マル」とか言ってもだめ。改行も音声で命令できません。
あとで改行、修正しないといけませんね。
注:PCならマイクとキーボード併用できるのでキーボードで"。"打って改行してから次の文を話し始めればいいです。
PCでやればよかった。
でもかなり音声認識の精度は高い、ほとんど認識間違いがない。
これは驚き。
淡々と読み上げ全文読み上げ終わったのが
14分58秒!!これは早い。
でも音声入力の場合はこれだけでは終われません。
さっき書いたようにスマホの場合は句読点(。)を入れるのと改行を入れなくてはいけません。あとスマホでもPCの場合でも音声認識間違いによる誤字の修正も。
さっそく文章ごとに句読点を入れながら、改行を織り交ぜ、音声認識間違いのチェックに入る、
さっそくだが、私のペンネーム、K-DADをことごとく認識間違いしてくれてる。
K-DADを
型ダット !!
系だと !!!
kw !!!!??
どうやらアルファベットは弱いらしい・・・
あとは覚えのないところに結構スペースが入ってるので空白を消したり。
でもそれ以外の日本語の認識精度はホントに高い!!
これだけの文章をしゃべって明らかに認識違いだったのは
こんにちは! ⇒ 今日は
法人化 ⇒ 4人化 (笑)の2箇所だけでした。
ひとつめは明らかな間違いとも言えないし、ふたつめはK-DADの滑舌の悪さにも問題がありそう。(フォージンカって聞こえたんか)
というわけで他は同音語を文脈をしっかり見極めて正しい文字の単語に変換していたし、音声認識の精度の高さにびっくりしました。
でも途中で句読点を入れるためにカーソル移動しすぎてカーソルキー壊れた!!
そんなアクシデントもありましたが推敲まで終了。
これで文章の精度まで考慮してもハンドタイピングと同等公平な扱いができます。
音声入力の勝利!
全文の修正を終え、これでハンドタイピングと精度でも公平な扱いになりました。
ここまでやってのタイムは・・・
28分6秒!!。
推敲をやってハンドタイピングと同等の文章精度にしてもハンドタイピングより9分速い。さらに今回スマホでやったのでしゃべってる間に句読点が打てなかった件もあるので、最初からPCでやってキーボードで句読点と改行を入れながらしゃべっていればもっと速かったと思います。
(機会があれば次回PCでもしゃべってみて追記しますね)
衝撃的だったのはとりあえず読み上げた段階でハンドタイピングの半分以下の時間で終わったこと。その時点でも音声認識間違いはほとんどなかったので句読点がない以外は文章としてほとんど完璧でしたから。
どうせ文字装飾などをしながら最終チェックするのはハンドタイピングでも音声入力でも一緒なので、とりあえず叩き台としての記事全文章を入力するのが速くできるようになるというのはかなりありがたいです。
総評
以前から音声入力の方が速くて効率がいいだろうなとは薄々思っていましたが、今回検証してみてはっきりわかりました。
それはグーグル先生の音声認識の精度の高さによるところが大きいです。
認識違いによる誤字脱字だらけでは使い物にならないですからね。
音声入力が優れていると思われるケース:
- 特に長い文章、すでに草案がある程度できている文章ほど音声入力するメリットがありそう
- とりあえず思いついた文章をしゃべって草案として下書きに保存しまくるという使い方にも適している
- クルマの中とかスマホしかないときの空き時間でとりあえず思いついた記事の一部をテキスト化しておくとか
弱点:
- スマホで句読点が打てず、改行もできない。(正確にはできますが、音声入力とキーボード入力をいちいち切り替えるタイムロスを考えると後でPCでまとめて推敲する方が速い)
- アルファベット、英語は認識間違いが多くなる。
といわけで、K-DADは今後は音声入力をベースにしながら、時と場合によって音声入力とキーボード入力を使い分けていくつもりです。
人によって個人差があると思いますが参考にしていただければ幸いです。
K-DAD