Maxine, Teknologi Baru Nvidia dengan Kecerdasan Buatan

 Salah satu hal yang menarik di acara unggulan Nvidia, GPU Technology Conference (GTC) adalah Maxine, platform yang memanfaatkan kecerdasan buatan untuk meningkatkan kualitas dan pengalaman aplikasi konferensi video secara real-time.

Maxine menggunakan deep-learning untuk meningkatkan resolusi, mengurangi kebisingan latar belakang, kompresi video, penyelarasan wajah, serta terjemahan dan transkripsi real-time.

Fitur pertama yang ditampilkan dalam presentasi Maxine adalah “super-resolution” yang menurut Nvidia dapat mengubah resolusi yang lebih rendah ke video dengan resolusi lebih tinggi secara real time.

Baca juga: 5 Film Sci-Fi tentang Teknologi Masa Depan

Super-resolution memungkinkan penelepon konferensi video mengirim streaming video resolusi tinggi dan meningkatkannya di server. Dengan ini, sistem bisa mengurangi kebutuhan bandwidth dan dapat membuat kinerjanya lebih stabil di area ketika jaringan tidak terlalu stabil.

Tantangan terbesar dalam meningkatkan data visual adalah mengisi informasi yang hilang. Misal, kamu memiliki larik piksel terbatas yang mewakili gambar dan kamu ingin memperluasnya ke kanvas yang lebih besar yang berisi lebih banyak piksel. Bagaimana caranya memutuskan nilai warna apa saja yang bisa digunakan untuk mengisi piksel baru itu?

Teknik peningkatan skala lama menggunakan metode interpolasi yang berbeda (bicubic, lanczos, dll.) untuk mengisi ruang antar piksel. Teknik ini terlalu umum dan mungkin memberikan hasil yang beragam dalam berbagai jenis gambar dan latar belakang.

Salah satu manfaat algoritme machine learning untuk diatur agar bisa melakukan tugas yang sangat spesifik. Misalnya, jaringan deep neural dapat dilatih pada bingkai video yang diperkecil yang diambil dari streaming konferensi video dan gambar asli resolusi tinggi yang sesuai.

Baca juga: Indosat-Huawei Bangun Jaringan Transport 5G Berbasis SRv6

Dengan cukup banyak contoh, jaringan saraf akan menyesuaikan parameternya dengan fitur umum yang ditemukan dalam data visual konferensi video dan akan mampu memberikan konversi resolusi rendah ke resolusi tinggi yang lebih baik daripada algoritme peningkatan untuk tujuan umum.

Fitur Kompresi Video. Foto: Nvidia

Fitur lain yang ditampilkan adalah kompresi video AI. Lewat video yang diposting di YouTube Nvidia menunjukkan bahwa teknologi ini menggunakan jaringan neural untuk mengompres streaming video dengan mengurangi bandwidth dari 97 KB/frame menjadi 0,12 KB/frame.

Fitur Face Alignment. Foto: Nvidia

Nvidia juga memperkenalkan fitur penyelarasan wajah yang akan menyesuaikan kembali sudut wajah pengguna agar tampak seolah-olah mereka sedang melihat langsung ke kamera.

Ini adalah masalah yang sangat umum dalam konferensi video karena orang cenderung melihat wajah orang lain di layar daripada menatap kamera. Meskipun tidak banyak detail tentang cara kerjanya, entri blog menyebutkan bahwa mereka menggunakan GAN.

(im)

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *