Google'ın İnanılmaz Yeni Fotoğraf AI'sı 'Yakınlaştırma ve Geliştirme'yi Gerçek Bir Şey Yapıyor

(Google Araştırması)

Kahramanın bir görüntüyü yakınlaştırmayı ve sonuçları iyileştirmeyi - bir yüzü, bir plakayı veya başka herhangi bir önemli ayrıntıyı ortaya çıkarmasını - istediği bilimkurgu filmleri veya televizyon şovları ve Google'ın en yeniyapay zekaDifüzyon modelleri olarak bilinen modellere dayanan motorlar, bu numarayı tam olarak gerçekleştirebilir.

Ustalaşması zor bir süreç, çünkü esasen, benzer görünümlü diğer görüntülere dayalı bazı süper akıllı tahminler kullanılarak, kameranın orijinal olarak yakalamadığı resim ayrıntıları ekleniyor.

Tekniğe Google tarafından doğal görüntü sentezi ve bu özel senaryoda görüntü süper çözünürlüğü denir. Küçük, bloklu, pikselli bir fotoğrafla başlıyorsunuz ve sonunda keskin, net ve doğal görünen bir fotoğraf çıkıyor. Orijinaliyle tam olarak eşleşmeyebilir, ancak bir çift insan gözüne gerçek görünecek kadar yakın.

(Google Araştırması)

Google aslında iş için iki yeni AI aracı tanıttı. İlki SR3 olarak adlandırılır veya Tekrarlanan İyileştirme ile Süper Çözünürlük ve bir görüntüye parazit veya öngörülemezlik ekleyerek ve ardından süreci tersine çevirerek ve onu ortadan kaldırarak çalışır - tıpkı bir görüntü düzenleyicinin tatil fotoğraflarınızı keskinleştirmeye çalışması gibi.

'Difüzyon modelleri, kademeli olarak ekleyerek eğitim verilerini bozarak çalışır. Gauss gürültüsü , saf gürültü haline gelene kadar verilerdeki ayrıntıları yavaşça siler ve ardından bu bozulma sürecini tersine çevirmek için bir sinir ağını eğitir,' diye açıklıyor araştırma bilimcisi Jonathan Ho ve yazılım mühendisi Chitwan Saharia. Google Araştırması .

Geniş bir görüntü veri tabanına dayalı bir dizi olasılık hesaplaması ve bazı makine öğrenme Magic, SR3 bloklu düşük çözünürlüklü bir görüntünün tam çözünürlüklü sürümünün nasıl göründüğünü hayal edebiliyor. Bununla ilgili daha fazla bilgiyi Google'ın yayınladığı makalede okuyabilirsiniz. arXiv .

İkinci araç CDM'dir veya Kademeli Difüzyon Modelleri . Google, bunları yüksek kaliteli görüntü çözünürlüğü yükseltmeleri için -SR3 dahil olmak üzere- difüzyon modellerinin yönlendirilebileceği 'boru hatları' olarak tanımlar. Geliştirme modellerini alır ve bundan daha büyük resimler çıkarır ve Google, bir makale yayınladı bu konuda da.

CDM iş başında. (Google Araştırması)

Google, farklı çözünürlüklerde farklı geliştirme modelleri kullanarak, CDM yaklaşımının görüntüleri büyütmek için alternatif yöntemleri yenebileceğini söylüyor. Yeni AI motoru üzerinde test edildi Resim Ağı , görsel nesne tanıma araştırmaları için yaygın olarak kullanılan eğitim görüntülerinden oluşan devasa bir veritabanı.

SR3 ve CDM'nin nihai sonuçları etkileyici. 50 gönüllü insanla yapılan standart bir testte, insan yüzlerinin SR3 tarafından oluşturulan görüntüleri, zamanın yaklaşık yüzde 50'sinde gerçek fotoğraflarla karıştırıldı ve mükemmel bir algoritmanın yüzde 50'lik bir puan alması bekleniyor, bu etkileyici.

Bu geliştirilmiş görüntülerin orijinallerle tam olarak eşleşmediğini, ancak bazı ileri düzey olasılık matematiklerine dayalı olarak dikkatlice hesaplanmış simülasyonlar olduğunu tekrarlamakta fayda var.

Google, yayılma yaklaşımının aşağıdakiler de dahil olmak üzere alternatif seçeneklerden daha iyi sonuçlar ürettiğini söylüyor:üretken düşman ağları(GAN'lar) bu iki çukuru nöral ağlar sonuçları iyileştirmek için birbirlerine karşı.

(Google Araştırması)

Google, yeni AI motorlarından ve ilgili teknolojilerinden çok daha fazlasını vaat ediyor - yalnızca yüzlerin ve diğer doğal nesnelerin görüntülerinin yükseltilmesi açısından değil, aynı zamanda olasılık modellemenin diğer alanlarında da.

'Çok çeşitli üretken modelleme problemleri için difüzyon modellerinin sınırlarını daha fazla test etmekten heyecan duyuyoruz,' takım açıklıyor .

Hakkımızda

Sağlık, Mekan, Doğa, Teknoloji Ve Çevre Hakkında Bağımsız, Kanıtlanmış Raporlar.