Google Kembangkan Bahasa Isyarat dalam Video Call

Sistem tersebut pertama-tama menjalankan video model yang dinamai PoseNet, yang dapat memperkirakan posisi tubuh dan anggota badan.

Eko Faizin
Senin, 05 Oktober 2020 | 09:30 WIB
Google Kembangkan Bahasa Isyarat dalam Video Call
Logo Google. [Shutterstock]

SuaraRiau.id - Baru-baru ini, Google meng-update penelitiannya yang memungkinkan bahasa isyarat untuk diubah dalam bahasa dalam panggilan video (video call).

Tak hanya mendeteksi suara, Google mengembangkan mesin yang bisa mendeteksi bahasa isyarat secara nyata yang dapat mengetahui seseorang mulai dengan bahasa isyarat dan kapan mereka selesai.

Sistem tersebut dimungkinkan dengan latensi yang sangat kecil, menurut laporan TechCrunch, dikutip Senin (5/10/2020).

Latensi adalah jeda waktu yang dibutuhkan dalam pengantaran data dari pengirim ke penerima. Makin tinggi jeda waktu maka makin lambat penerima merespons perintah dari pengirim.

Latensi berpengaruh besar untuk deteksi bahasa isyarat agar video tidak tertunda atau kualitasnya terdegradasi. Sehingga, Google membuat sistem yang ringan dan dapat diandalkan.

Sistem tersebut pertama-tama menjalankan video model yang dinamai PoseNet, yang dapat memperkirakan posisi tubuh dan anggota badan.

Informasi visual yang disederhanakan ini dikirim ke sistem yang dilatih data pose dari video orang yang menggunakan Bahasa Isyarat Jerman, dan membandingkan gambar langsung dengan tampilan garis yang dihasilkan dari gerakan.

Proses sederhana ini sudah menghasilkan akurasi 80 persen dalam memprediksi apakah seseorang menggunakan bahasa isyarat atau tidak, dan dengan beberapa pengoptimalan tambahan mendapatkan akurasi hingga 91,5 persen.

Dibandingkan dengan bagaimana deteksi "ucapan aktif" pada sebagian besar panggilan video hanya dapat mengetahui apakah seseorang berbicara, bahkan tidak tidak bisa membedakan batuk, angka-angka tersebut terbilang cukup baik.

Untuk bekerja tanpa menambahkan sinyal "seseorang sedang menggunakan bahasa isyarat" ke dalam panggilan, sistem menggunakan trik cerdas, dengan menggunakan sumber audio virtual untuk menghasilkan nada 20 kHz, yang berada di luar jangkauan pendengaran manusia, namun diperhatikan oleh sistem audio komputer.

Sinyal ini dihasilkan setiap kali orang tersebut menggunakan bahasa isyarat, membuat algoritma deteksi ucapan "berpikir" bahwa mereka sedang berbicara dengan suara keras. Saat ini, sistem tersebut masih dalam tahap demo. (Antara)

BERITA TERKAIT

REKOMENDASI

Terkini