研究開発 R&D グループ会 ネタ

  • 写真撮影、即プリント? 入力されたメールアドレス宛に送信 まだできていない?




LipNet:機械学習による自動読唇術で音声なしのスムーズな会話
人が喋ってる動画の唇の動きを読み、その人が何を喋っているかを推測してテキスト化する、というソフトウェア
雑音入っている売り場のお客様の独り言を取得。音声取得は難しい。唇の動きで読心術を実現

読唇術のプロであっても、読み取り精度は52%程度とされています。
読唇術専用のソフトウェア「LipNet」によって、なんと93.4%の読み取り精度達成

読唇術のプロは長い言葉ほど正確に読み取れることに着目。
まずはいっそのこと話されている文章全体を解析することに努め、その後で1語ずつを正確に読み取っていく手法が採用さ

通話先の相手が難聴者でも、読唇術だけで、なにが語られたのかをテキスト化して会話ができれば、ますますコミュニケーションの幅は広がっていきそう

正面から&ある程度の解像度が必要



ウォークスルー型複数指静脈認証


ライフブログを自動的に記録してくれるAI、ロボット


聴診器 スマホ