Browser tepi akan meningkatkan semua gambar web dengan AI

1 min read

Browser tepi akan meningkatkan semua gambar web dengan AI

Microsoft Bing telah mengumumkan teknologi AI baru yang akan menghadirkan pengalaman grafis 4K ke situs web melalui Microsoft Edge, yang secara otomatis meningkatkan gambar situs web. Teknik yang disebut Turing Image Super-Resolution, memungkinkan gambar ditampilkan pada resolusi tinggi, tidak peduli seberapa buruk gambar aslinya.

Teknologi baru ini dikembangkan oleh Microsoft Corporation Tim pengembangan kecerdasan buatan proyek Turing.

Digunakan di Bing Maps

Teknologi baru ini telah digunakan di Bing Maps untuk meningkatkan kualitas citra satelitnya.

Di bawah ini adalah perbandingan citra udara dari kantor pusat Google di Mountain View, California.

Di sebelah kiri adalah tangkapan layar Bing Maps, dan di sebelah kanan adalah gambar yang sesuai dari Google Maps:

Bing Maps vs. Google Maps

Bagaimana Microsoft Membangun Teknologi

Ada empat wawasan penting yang mengarah pada keberhasilan model ini.

  1. penilai manusia
  2. pemodelan kebisingan
  3. Persepsi dan kehilangan GAN
  4. Transformer Visual: Peningkatan dan Penskalaan

penilai manusia

Microsoft menyadari bahwa metrik yang digunakan untuk mengukur keberhasilan model terkait gambar tidak konsisten dengan persepsi visual manusia. Jadi mereka menciptakan alat perbandingan visual berdampingan yang menggunakan penilai manusia untuk membantu menilai keberhasilan model.

pemodelan kebisingan

Pendekatan yang dilakukan Microsoft adalah memulai dengan gambar berkualitas tinggi, kemudian menurunkannya dengan menambahkan noise ke gambar tersebut, dan kemudian mengajarkan model untuk memulihkan gambar ke kondisi kualitas tinggi aslinya.

Persepsi dan kehilangan GAN

Ini adalah bagian dari upaya untuk membuat hasil yang konsisten dengan visi manusia.

Microsoft mengumumkan:

“…kami menemukan bahwa mengoptimalkan model kami hanya menggunakan hilangnya piksel antara gambar keluaran dan gambar kebenaran dasar tidak cukup untuk menghasilkan keluaran terbaik yang konsisten dengan persepsi mata manusia.

Sebagai tanggapan, kami juga memperkenalkan kerugian persepsi dan kerugian GAN, dan menyesuaikan kombinasi tertimbang terbaik dari tiga kerugian sebagai fungsi tujuan. “

Transformator Visi

Microsoft memanfaatkan kekuatan Transformers yang digunakan dalam model bahasa, dengan fokus pada augmentasi dan penskalaan.

Ini berarti meningkatkan gambar dan berfokus pada memperbesarnya, yang merupakan hal yang sulit untuk dilakukan.

Biasanya, memperkecil ukuran gambar itu mudah. Tetapi mengambil gambar kecil dan meningkatkannya biasanya berakhir dengan meningkatkan artefak resolusi rendah dari gambar asli.

Jadi yang dilakukan para peneliti adalah membuat sistem yang dapat menghitung dan “memulihkan” data gambar yang hilang dalam gambar beresolusi rendah dan meningkatkannya ke resolusi yang lebih tinggi.

Microsoft menyebut proses zoom in pada gambar DeepZoom.

The Verge: TV 4K dengan Browser Web

Microsoft membayangkan fitur AI baru ini sebagai cara untuk menghadirkan pengalaman visual 4K ke penjelajahan web dan untuk meningkatkan konferensi video dan foto keluarga yang diunggah ke web.

Teknologi ini sudah tersedia dalam versi eksperimental Edge yang disebut kenari pinggiran.

Fitur-fitur baru akan diluncurkan ke versi mainstream browser Edge dalam beberapa bulan mendatang.

Kutipan

Baca pengumuman Microsoft

Resolusi Super Gambar Turing

Leave a Reply

Your email address will not be published. Required fields are marked *