« 姉が作ったハンバーグ | トップページ | 相手の名前が思い出せない時のテクニック? »

2011年9月25日 (日)

YouTubeの「音声を文字に変換」機能が、書き起こしに便利

YouTubeの音声認識(「音声を文字に変換」で表示できる字幕)は、普通に動画をアップすれば、何も考えずに使えるぞ、という話を以前書いたのですが↓

YouTube 自動字幕機能が日本語に対応 利用するには普通にアップすればOK

この機能って、動画や音声からテキストを書き起こし(ディクテーション)する際に結構便利だなって思うんですよね

動画をアップして認識が行われた後、

「マイ動画と再生リスト」のページから

YouTube「マイ動画と再生リスト」の「情報を編集」
「情報を編集」ボタンをクリック

YouTube「キャプションと字幕」タブ
「キャプションと字幕」タブをクリック

YouTube「日本語:機械による音声文字変換」結果のダウンロード
「利用可能なキャプショントラック」の
「日本語:機械による音声文字変換」の
「ダウンロード」ボタンをクリック

"captions.sbv"というファイルがダウンロードされます。

これはテキストファイルなので、テキストエディタで開くとこんな感じ↓

YouTubeの字幕のsbvファイルをテキストエディタで開く
"captions.sbv"の中身

    [開始時間],[終了時間]
    [字幕テロップ]

    [開始時間],[終了時間]
    [字幕テロップ]

    ・・・
    ・・・

という形式みたいですね。

これを書き起こしの際のベースとすると、かなり楽です。

時間表示やスペースが邪魔ですが、そのへんはテキストエディタで一括で置換・削除してしまえばよいかと思います。

会話のようにくだけた音声には不向きですが、アナウンサーが原稿を読み上げているものや、ナレーションなどは、けっこうな精度で認識されます。

それでも、認識ミスはそれなりにあって、手修正箇所もけっこうな量になるとは思いますが、すべてのテキストを手で打ち込むよりは、ベースとなるテキストの間違い箇所だけを修正する方が数段楽だと思います。

で、ポイントとしては、

アップロード動画は「非公開」設定でもOK

ってところです。

なので、著作権コンテンツであっても、普通に考えると問題なさそうに思えます。ただ、法律と常識が矛盾するなんてことはしばしばあるので、そのへんは要注意で。

むしろ気になるのは、非公開コンテンツを音声認識解析してもYouTube側にはメリットはないわけで、今後、非公開でアップロードされた動画を認識対象から外したりするんじゃないかというところ。今のところ、公開でも非公開でも認識してくれます。

音声認識させるタイミングは指定できませんが、私の場合、遅くとも数時間経った後に見てみたら、解析済みの状態になっていた、という感じです。

動画の音声書き起こしをよくやる人(あんまりいないだろうけど)は、お試しあれ。

AmiVoice SP USBマイク付
AmiVoice SP USBマイク付

|

« 姉が作ったハンバーグ | トップページ | 相手の名前が思い出せない時のテクニック? »

パソコン・インターネット」カテゴリの記事

映画・テレビ」カテゴリの記事

コメント

はじめまして!もくじきと申します。
YOUTUBEにアップされています米国のドキュメンタリー映画「FREEDOM RIDERS」(約2時間弱)の中の英会話を理解したいと思っています。
私は不幸にして英会話はほとんど理解できません。本日ネットで貴方様のブログを見付けまして「可能性はありそう!」と思い、自分なりにゴソゴソやってみましたが埒が開きません。
「YOUTUBE動画の英会話→英語文章→日本語文章」は可能でしょうか?
ちなみに、私はYOUTUBEを観て録画している程度の初心者ユーザーです。
昨日、音声認識ソフト「ドラゴンスピーチ11J」は購入しましたが、まだ使っていません。
どう取り組めば良いでしょうか?
ご助言の程どうぞ宜しくお願いします。

投稿: もくじき | 2012年10月24日 (水) 20時43分

もくじきさん、こんにちは。

YouTubeには

(A)英語の音声を認識する機能
(B)英語テキスト→日本語テキスト変換

の両方があるので、理屈から言うと可能です。

例えば、下記の動画でつけられている英語字幕は、音声を自動認識したもので、画面下部の字幕のアイコンから「字幕の翻訳」を選択すると、日本語に変換することもできます。

YouTubeの自動字幕機能を試してみた
http://www.youtube.com/watch?v=byphr9klOGU

上記は、ナレーションがしっかりしているので、かなりうまくいっている例ですね。

しかし、大抵の場合(A)の段階で結構な量の認識間違いが混入し、さらに(B)の段階での翻訳間違いや、(A)の認識間違い結果を翻訳した部分などが混ざり合って、結果はひどいものになります。

なので、正直言って実用に使えるかは微妙です。

また、YouTubeにアップされている「Freedom Riders」の動画のページ↓を見てみても、

Freedom Riders
http://www.youtube.com/watch?v=BErEunhK6jc

字幕がついていません。なぜ、自動認識結果が付かないかは、よく分からないです。機能をOFFにできるのか? 長い動画には付かないのか?

いったん自分でダウロードして、自分のアカウントから、非公開設定でアップロードしてみて、英語字幕が付くか試してみるという方法はあると思います。

で、せっかく持っているなら、「ドラゴンスピーチ11J」を使う方法ですが、

9月28日(金)「ドラゴンスピーチ 11 日本語版」販売開始! | 音声認識ソフト ドラゴンスピーチ 11
http://www.dragonspeech.jp/news/newrelease

さらに、英語の音声認識、ICレコーダ等で録音された
音声データの自動書き起こし、インターネットでの
音声検索機能など、多彩な機能も搭載されているので、
様々な用途で活用可能なソフトウェアです。

とのことなので、私だったら下記のような方法を試してみます。

(1)YouTubeから動画をダウンロードする
(2)動画から音声を抜きだす
(3)抜き出した音声をドラゴンスピーチに入力する

といった感じでしょうか。

投稿: 管理人 | 2012年10月27日 (土) 12時18分

さっそくのお返事有難うございました。
今、realplayer converterを初めて使いまして、MP3形式の音声ファイルに変換しました。realplayerがこんな事が出来るとは思いもしませんでした。
当面、この音声ファイルをドラゴンスピーチに入れてみようと思います。
PC2台とドラゴンスピーチ付属のマイクを使って入力するつもりでしたので、随分と手間が簡素化できます。
自分のアカウントから、非公開設定でアップロードしてみて・・・
ドラゴンスピーチ活用の方法の後youtube活用の方法も試してみようと思っています。
youtubeにビデオをアップする方法は少しだけ試してみましたが、英語で手順が書いてありますので、よく分からなくなって止めてしまいましたが・・・。
これが私にも上手く出来れば、youtubeの視聴範囲が随分広がります。
とりあえずは、ヒントを頂いた方法を試してみますが、上手く行かない場合は、何卒宜しくお願いします。

投稿: もくじき | 2012年10月27日 (土) 21時04分

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/517450/60883782

この記事へのトラックバック一覧です: YouTubeの「音声を文字に変換」機能が、書き起こしに便利:

« 姉が作ったハンバーグ | トップページ | 相手の名前が思い出せない時のテクニック? »