自動音声書き起こしソフト「Voice Code PRO」を買ったので音声認識精度がどのようなものかレビュー:まあまあ…評判通りのテスト結果?という感じ

自動音声書き起こし

突然そういう感じのアプリケーションが必要になったので色々調べてみた。
マイクで喋ってリアルタイム変換、ではなくて、「既にあるファイルを音声認識させてテキスト出力させる用途」が必要だったのでそれを重視して探した。

今回の Voice Code PRO 以外だと
「Notta」
「Voice Rep Pro 3」
「VoXT」
などなどがあった。

結果、Voice Code PRO にしたのは「買い切り」だったから。
サブスクとか従量課金ってなんか性格上合わなくて…w

○分使ったら○円とかって考えるの面倒だし、最初にちょっと高くても買っちゃったほうが気分的に楽。

5,980円で購入

ベクターPCショップというトコが安かったのでココにした▽

ちなみにソースネクストの公式サイトだと7,980円みたい。

Voice Code PRO|ソースネクスト
Voice Code PRO|ソースネクスト

使ってみよう

購入してから使えるようにするまでに、ちょっと苦労した。
それはまた別の投稿で…

以下、YouTubeからちょっと音声を拝借して、やってみたものを並べるので、参考になれば…
男性女性どちらも。実験。

「タイムスタンプあり」「句読点なし」でやってます。
どちらもオンオフが選べるよ。

1. 高須幹弥さん音声 冒頭1分

00:00:00 はい今は今緊急でどう我慢してるんですけれどもねあのちょっと前に高須クリニックの患者さんから
00:00:11 が届いてそれで教えていただいたんだけどその文章によその美容クリニックが幹也先生の顔の写真を
00:00:20 勝手にそこのクリニックが広告で使ってますよっていう連絡だったのねこういうことなんだろうと思っててそこに添付してくれてたので写真を撮る
00:00:31 ヒッコリーのクリニックが広告で僕の顔を使ってるんですよこれありえないでしょこれすごいびっくりして
00:00:41 何の写真かって言うとねあの10年ぐらい前に僕がゴルフにはまってて日焼けしてで結構シミができちゃってそれをね
00:00:50 腰痛レザーで削ってもらったのよではせっかくだからこれを症例写真として経過をまとめて僕のブログアメブロずっとやってる
00:01:00 風呂にアップしててその写真も高須クリニックのホームページにアップしたのでそれが単位人

ヒッコリーのクリニックってなんぞ…

2. 安東輝亮さん音声 冒頭1分

00:00:06 はいこんにちは安藤です
00:00:09 おしおしお
00:00:11 なかなか一歩踏み出せないと思ったことはありませんか今回はなぜどうしてが必要なのかについてシェアしていきたいと思います
00:00:20 僕自身もですね投資をやろうと思ってもなかなか一歩踏み出せなかったことがあります特に今は大丈夫かなとか周りがあまりして
00:00:31 後貯金を少し出来ているから大丈夫かなとか色々考えていて先延ばしをしていました
00:00:38 しかしそんな中でなぜ当初
00:00:40 のかと言うとお金のことを学んだからなんですねお金の事を学んで投資をしないと厳しいという現実を知ったからなんです
00:00:50 ま今回の動画ではなぜ投資をした方がいいのかこれについて二つの理由をシェアしたいと思います登場しようと迷っている人
00:01:00 あと投資をしたいと思ってるけど先延ばしにしてしまってる人はぜひ最後まで見てみて下さいとても参考になると思いますまず

おしおしお…?

3. コットンさん音声 冒頭1分

※2人以上で喋っているのは分けて表示などはされません。他のソフトも大体そうだと思うけど…

00:01:13 で浮気をしてしまった後堀田まで
00:00:29 助かりました私浮気の証拠隠滅する浮気証拠バスターが河原と申しますお願いします
00:00:41 確認なんですけどもはい浮気相手の方昨晩ここでどのくらい滞在してます10時過ぎ頃7時半頃すかね
00:00:50 結構長いことをしてもいいですか
00:01:01 黒髪でロング

こういうタイプになると、精度悪いのかもしれない。

4. AYAMARさん音声 冒頭1分

00:00:00 これもまあ見て分かる通り絶対よくないで
00:00:08 スタンドを開いて
00:00:10 今回は意外とみんながやっている髪を痛める日常の NG 行動を紹介していきたいと思います最近なんか髪の毛傷んできたなーカラーと
00:00:20 アイロンで髪傷んできちゃったのかなって考えていませんかも知らんからだったりパーマとかアイロンのしすぎでダメージをしてしまうんですがでも実は
00:00:30 生活の中で髪を傷めてしまう原因ってたくさんあるんです今回は特にやりがちな NG 行動をいくつか紹介していくので是非皆さん参考にしてください
00:00:44 今日はお出かけ楽しみだなーってなってる時のこれ見えます
00:00:50 この形にかけた鞄の中に髪の毛が挟まってるから私もよく街中で見かけます女性には確かにカバンは必需品だしなんかな
00:01:00 荷物入ってるのってぐらい荷物パンパンに入れてめちゃめちゃ重たい鞄持ってる人もいるんじゃないかなと思いますそんな重たい鞄がこんなふうに紙の上に

中々良い感じ。
「なーってなってる」が素直に出るのがおもしろい。

5. 歩乃華さん音声 冒頭1分

00:00:02 馬鹿です土管っていうことでね本日から一週間鶏肉とブロッコリー性格ということでしっかりさんのね
00:00:10 出てるブロッコリーと鶏肉なんですけどこれのね一週間行って行こうと思いますこれが企画決まった理由分かるみさんですね
00:00:20 もう一個できたアドレスが配給かける美容系をやった方がいいっていうことだよこれをねしていこうと思います
00:00:31 でもねあの軽いさん師匠ですねなんかもう全国のブロッコリーと鶏肉はなくなっているらしいよひかるさんの影響で色々ドレス
00:00:40 頼みましたこちら四川風ソースコクうま塩ごま豆腐ステーキカレーソースっていうことでね今日は
00:00:51 現在の体重なんですけど最近3キロ太りまして47.65 km ですここから一週間鶏肉と風呂
00:01:01 何キロ痩せるのか

他の所はわりとムチャクチャだけど「四川風ソースコクうま塩ごま豆腐ステーキカレーソース」はいい感じに出たw
そして「馬鹿です」はヒドイ。

ソフトのクセ?仕様?

ある程度の読み取りが進むと、別の画面に出力する時間が一瞬だけ挟まる。
一瞬ではあるんだけど、その間に進んでいる音声が読み取られない。

よほどアナウンサーさんがゆっくり、いいタイミングで喋ってるとかでなければ、基本的にはどうしても手で修正する必要があるはず。

でも自分的には、イチから書き起こさなくていいだけとっても助かるので、買ってよかった~と思っているよ!!!

自動認識ってやっぱり限度あると思うので…完璧な精度で文字起こしをしたいなら、クラウドワークスとかでお金かけて、文字起こししてくれる人を募集したほうがよさそうw
今のところは結局人力が一番なのかな。

以上

他の動画でも色々試してみたけど、わりとマニアックな固有名詞がちゃんと出てきたりして、さすがGoogleのエンジンだなあと思ったw

こんな感じでした。

おわり。

安堂ノートカテゴリの最新記事