« サンドラ・ブロック、かっこいい! | トップページ | 吉野梅郷のパノラマ写真 »

2010年3月10日 (水)

YouTubeの自動字幕機能(auto-captioning)を試してみた

YouTubeの、音声を認識し自動で字幕を付ける機能(auto-captioning)が、ついに一般ユーザにも公開されました。まだ、英語のみですけどね。

YouTube、自動字幕機能を全ユーザーに 英語以外への対応も計画 - ITmedia News
http://www.itmedia.co.jp/news/articles/1003/05/news019.html

YouTubeは3月4日、動画に自動的に字幕を付ける機能を全ユーザーに拡大すると明らかにした。

 この機能はGoogleの音声認識技術を利用して、動画に自動的に字幕をつけるというもの。昨年11月に一部のパートナー向けに導入された。視聴者は、動画の右下のボタンをクリックして「Transcribe Audio」を選択すると字幕を表示できる。

この機能が発表された時はまだ一般ユーザは使えなかったので、試しにauto-timingのみを使ってみた感想をエントリに書きました。

YouTubeのAuto-timing機能(タイミングを合わせて字幕をつける)を試してみた
http://claimant.cocolog-nifty.com/blog/2009/12/youtubeauto-t-1.html

これだけでも結構便利だったんですよ。

でも、やっぱり使ってみたいですよね、音声認識。ということで、さっそく試してみました。

英語の動画は、ウィキメディアコモンズに置いてあった、パブリックドメインのもの。もともと英語字幕がついているのを選んだのは、ついていないと、合っているか間違っているか良く分からないから・・・。

同じ動画に、正しく字幕を付けたものと、自動で字幕を付けたものを比較してみました。
まずは正しいほうから。テキストは手動で書き出し、auto-timingの機能のみを使いました。

そして、次は音声認識による自動字幕。どこが間違っているかなー?

ねー?

どこが間違っているか、よく分からんでしょ?認識エンジンが間違うくらいだから、英語がよほど得意じゃないと、出たテロップの通りに聞こえちゃう。いわば空耳アワー状態。

なので、両者のテキストを並べて比較してみました。使ったのはフリーソフトの「WinMerge」です。お世話になっております。

YouTubeの自動字幕の精度を検証
正しい字幕(左)と、自動認識(右)字幕の比較 (クリックすると拡大します)

白い行は両者一致、黄色い行は不一致あり。一致していない箇所は薄い黄色になっています。

けっこう認識できるもんだなーって感心しました。間違っているところも、例えば、
  your ⇔ you're
  box is ⇔ boxes
  this ability ⇔ disablility
など、「その気持ち、分かる分かる!」って感じのところが多いし。

ネイティブの人が見るとどうなんでしょうね。けっこう合っていると思うのか、間違いだらけだと思うのか。

YouTubeの自動字幕機能は今は英語動画のみ対応しているが、今後ほかの言語の動画にも拡大する計画だ。

とのことなので、日本語対応が待ち遠しいですね。■

[2011年7月18日追記]
ついに日本語対応してくれました。
YouTube 自動字幕機能が日本語に対応 利用するには普通にアップすればOK

Google 英文ライティング: 英語がどんどん書けるようになる本
Google 英文ライティング: 英語がどんどん書けるようになる本

|

« サンドラ・ブロック、かっこいい! | トップページ | 吉野梅郷のパノラマ写真 »

ニュース」カテゴリの記事

パソコン・インターネット」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/517450/60883091

この記事へのトラックバック一覧です: YouTubeの自動字幕機能(auto-captioning)を試してみた:

« サンドラ・ブロック、かっこいい! | トップページ | 吉野梅郷のパノラマ写真 »