Googleの人工知能「DeepMind」、唇を見て何を喋っているのかすべてお見通し！人工知能のリップリーディングは驚異的な正確さ

Spotry.me 編集部·2016年11月27日

·1 min read

日本語では「読話」や「読唇」と言われる、リップリーディング。窓際とか遠くにいる人が何を話しているのか、唇の動きを見て会話の内容を把握するというものですが、今回囲碁の勝負でプロ棋士に勝った事で一躍話題になったGoogleの人工知能「AlphaGo」やオックスフォード大学が開発した「LipNet」が人間のリップリーディングに挑戦。結果、プロ専門家の結果を大幅に上回る成果を残しました！

機械学習のリップリーディング性能、非常に正確でプロ顔負け！

今回行った実験ですが、英オックスフォード大学が実施したもので、BBC放送からランダムな動画200本を選び、プロのリップリーディング専門家が行った結果と比較するというものです。事前にAlphaGoに対して、トレーニング用のデータとして延べ5,000時間にも及ぶ動画を再生し、文章の数は118,000個をインプットさせたようです。

結果ですが、プロの専門家は各々の文章やセンテンスの1/4程度しか読話できなかったことに対して、DeepMindは複雑な文章もしっかりと解読していたとのことです。加えて、AlphaGoが解読した約46％の単語がエラーなしに対して、プロの専門家はたった12％だったとのこと。さらにAlphaGoのエラー内容は、プロの専門家と比較して非常に小さく、例えば単語の最後の”s”が抜けていたといった内容だったようです。

その2週間前には、オックスフォード大学にて別の機械学習・マシーンラーニングを利用したプロジェクト「LipNet」が始動し、LipNetは前述のAlphaGoより優秀な成果を挙げています。トレーニング用に使用したデータは、前述のBBCの動画とは異なり、人間がカメラに向かって時間にして約3秒分の単語やフレーズを読み上げるというもの。計29,000もの動画が使用された後の成果として、プロの専門家の平均エラー率は47.7%だったのに対して、LipNetは何と6.6％に止まったという驚異的な結果となりました。

思い出すのは、かの有名な映画「2001年宇宙の旅」の有名なワンシーン、コンピューターのHALが窓越しに写っている宇宙飛行士の会話を解読して、先にアクションを起こすというもの。そんな世界がもう間近に来ていると思うと、ちょっとびっくりですね。

今後はSiriなどに統合されることで、例えばiPhoneの前面カメラで自分の唇の動きを読み取って、今までのキーボードや音声入力の代わりとして役立ったり、ろうあ者とビデオ通話を通じて手話以外の手段として会話できるような利用シーンが想定できますね。

発信元：Techspot

NEWS

Twitter、Meta社をThreadsの開発のために従業員の引き抜いたと非難

まとめ: iPhone 15、全モデルでLightningからUSB-Cポートへの切り替えとなるか？

iPhone 15 Proケースの画像で微妙なデザインの変更が明らかに

REVIEW

HUAWEI Band 6を最速レビュー！24時間のSpO2測定機能や画面解像度の大幅な向上、さらに96種類のワークアウトに対応

Xiaomi Mi Band 6を最速レビュー！SpO2測定機能や画面解像度の大幅な向上、さらに30種類のワークアウトに対応しています

Xiaomi Mi Band 5レビュー、これはコスパ最強なスマートバンドかもしれません！

GADGET

GoPro HERO 10 Blackの情報がリーク！搭載プロセッサGP2の性能が大幅にアップ、5.3K動画60fpsや4K動画120fpsに対応

HUAWEI Band 6を最速レビュー！24時間のSpO2測定機能や画面解像度の大幅な向上、さらに96種類のワークアウトに対応

Xiaomi Mi Band 6を最速レビュー！SpO2測定機能や画面解像度の大幅な向上、さらに30種類のワークアウトに対応しています

APPS

Sleep Cycleが待望のApple Watchに正式対応！スマートな快眠環境がより身近に！

オークションサイトeBayでは、配送に使う箱のサイズをバーチャルで教えてくれる！Android版アプリにてARを使ったスマートな機能追加に注目です

音楽定額サービスのSpotify、ハードウェアビジネスに進出か？！自社ハードウェアの準備を進めているようです

GAME

[UPLAND特集]Play-to-Earn、遊びながら稼ぐ！毎月の収益をブーストさせてよりチャリンチャリンさせる方法

これが次世代コンソールPlaystation 5だ！4K Blu-rayドライブ搭載モデルとデジタル版モデルの2タイプ展開

全世界で大人気、あつまれどうぶつの森 amiiboカードキャラを一覧でまとめてみました

LIFESTYLE

Jackery、新型ポータブル電源で待望のLiFePO4バッテリーに対応！

太陽光発電、アパートでもOK！EcoFlowの新製品「PowerStream」と「PowerOcean」

快適な目覚めを約束するスマートアラームでお馴染み、Sleep CycleがApple Watchアプリとして再登場です

EVENT

「nuro モバイル」、新たなオプションとして「5分かけ放題」や「5時間プラン」、誰とでも分け合える「パケットギフト」などを追加！

【TechCrunch Tokyo 2016】メルカリ、日米5500万ダウンロードを突破。ファウンダー・CEO山田氏、今後も北米を重点に攻める

ボタンを押して料理が届くUberEATS が都内でサービスを開始！今ならワンコインキャンペーンを実施中

CULTURE

EXO・ベッキョンがインスタした一枚の写真で、「チョコモナカジャンボ」がTwitterのトレンド入り？！売り切れ確実か？！

マーベル映画『アベンジャーズ／インフィニティ・ウォー』の興行収入が全世界で絶好調！大台の10億ドルを上映開始後11日で突破とか

VevoのYouTubeアカウントが何者かにハックされ、大量のミュージックビデオが削除される事態に？！

Googleの人工知能「DeepMind」、唇を見て何を喋っているのかすべてお見通し！人工知能のリップリーディングは驚異的な正確さ

機械学習のリップリーディング性能、非常に正確でプロ顔負け！

関連お勧めアイテム

Twitter、Meta社をThreadsの開発のために従業員の引き抜いたと非難

iPhone 11 Pro vs. 15 Pro：アップグレードを予定しているユーザーが期待すること

まとめ: iPhone 15、全モデルでLightningからUSB-Cポートへの切り替えとなるか？

iPhone 15 Proケースの画像で微妙なデザインの変更が明らかに

新たなMac Pro M2 Ultraチップのベンチマーク結果が公開に！これまで以上に高性能で、価格は若干お安くなった？