Üretken yapay zekâ (AI), en iyi ChatGPT veya Stable Diffusion gibi metin veya görüntü oluşturma uygulamalarından biliniyor olabilir. Ancak bunun ötesinde faydası giderek daha farklı bilimsel alanlarda ortaya çıkıyor. Helmholtz-Zentrum Dresden-Rossendorf’taki (HZDR) Gelişmiş Sistem Anlayışı Merkezi’nden (CASUS) araştırmacılar, Londra Imperial College’dan meslektaşlarıyla işbirliği içinde, yaklaşan Uluslararası Öğrenme Temsilleri Konferansı’nda (ICLR) sunulacak olan son çalışmalarında ve University College London, Koşullu Değişken Difüzyon Modeli (CVDM) adı verilen yeni bir açık kaynaklı algoritma sağladı. Üretken yapay zekayı temel alan bu model, görüntüleri rastgelelikten yeniden oluşturarak kalitesini artırır. Ayrıca CVDM, yerleşik difüzyon modellerinden hesaplama açısından daha ucuzdur ve çeşitli uygulamalara kolayca uyarlanabilir.
Büyük verinin ve yeni matematik ve veri bilimi yöntemlerinin ortaya çıkışıyla birlikte araştırmacılar, ters problem yaklaşımlarını kullanarak biyoloji, tıp veya çevre bilimlerindeki henüz açıklanamayan olguları deşifre etmeyi amaçlıyor. Ters problemler, belirli gözlemlere yol açan nedensel faktörlerin kurtarılmasıyla ilgilidir. Bir görüntünün gri tonlamalı versiyonuna sahipsiniz ve renkleri kurtarmak istiyorsunuz. Burada genellikle birkaç geçerli çözüm vardır; örneğin açık mavi ve açık kırmızı, gri tonlamalı görüntüde aynı görünür. Dolayısıyla bu ters problemin çözümü açık mavi ya da açık kırmızı gömlekli görüntü olabilir.
Mikroskobik görüntülerin analiz edilmesi de tipik bir ters problem olabilir. “Bir gözleminiz var: mikroskobik görüntünüz. Bazı hesaplamalar uygulayarak numuneniz hakkında ilk bakışta göründüğünden daha fazlasını öğrenebilirsiniz,” diyor CASUS’ta doktora öğrencisi ve ICLR makalesinin baş yazarı Gabriel della Maggiora. Sonuçlar daha yüksek çözünürlüklü veya daha kaliteli görüntüler olabilir. Ancak gözlemlerden, yani mikroskobik görüntülerden “süper görüntülere” giden yol genellikle açık değildir. Ek olarak gözlemsel veriler genellikle gürültülü, eksik veya belirsizdir. Bütün bunlar ters problemleri çözmenin karmaşıklığını artırıyor ve onları heyecan verici matematiksel zorluklar haline getiriyor.
Sora Gibi Üretken Yapay Zekâ Modellerinin Gücü
Ters problemlerin üstesinden gelmenin güçlü araçlarından biri üretken yapay zekâdır. Üretken yapay zekâ modelleri genel olarak belirli bir eğitim veri kümesindeki verilerin temel dağılımını öğrenir. Tipik bir örnek görüntü oluşturmadır. Eğitim aşamasından sonra üretken yapay zeka modelleri, eğitim verileriyle tutarlı olan tamamen yeni görüntüler üretir.
Farklı üretken yapay zeka çeşitleri arasında, yayılma modelleri adı verilen belirli bir aile, yakın zamanda araştırmacılar arasında popülerlik kazanmıştır. Yayılma modellerinde, yinelemeli bir veri oluşturma süreci, bilgi teorisinde doğada meydana gelen birçok rastgele sürecin etkisini taklit etmek için kullanılan bir kavram olan temel gürültüden başlar. Görüntü üretimiyle ilgili olarak, difüzyon modelleri, eğitim veri seti görüntülerinde hangi piksel düzenlemelerinin yaygın ve nadir olduğunu öğrenmiştir. Bir piksel düzenlemesi, eğitim verilerinin temel yapısıyla en iyi şekilde örtüşene kadar istenen yeni görüntüyü parça parça üretirler. Yayılma modellerinin gücüne iyi bir örnek, ABD yazılım şirketi OpenAI’nin metinden videoya modeli Sora’dır. Uygulanan bir yayılma bileşeni, Sora’ya yapay zeka modellerinin daha önce oluşturduğu her şeyden daha gerçekçi görünen videolar oluşturma yeteneği veriyor.
Ancak bir dezavantajı var. “Dfüzyon modellerinin uzun süredir eğitilmesinin hesaplama açısından pahalı olduğu biliniyor. CASUS Genç Araştırmacı Grubu Lideri ve ICLR makalesinin ilgili yazarı Dr. Artur Yakimovich, bazı araştırmacıların son zamanlarda tam da bu nedenle onlardan vazgeçtiğini söylüyor. “Fakat Koşullu Varyasyonlu Yayılma Modelimiz gibi yeni gelişmeler, nihai modele ulaşmayan ‘verimsiz çalıştırmaları’ en aza indirmeye olanak tanıyor. Hesaplama çabasını ve dolayısıyla güç tüketimini azaltarak, bu yaklaşım aynı zamanda difüzyon modellerinin eğitilmesini daha çevre dostu hale getirebilir.”
Akıllı antrenman işe yarar – sadece sporda değil
“Verimsiz çalışmalar” yayılma modellerinin önemli bir dezavantajıdır. Bunun nedenlerinden biri, modelin, yayılma sürecinin dinamiklerini kontrol eden önceden tanımlanmış programın seçimine duyarlı olmasıdır: Bu program, gürültünün nasıl ekleneceğini yönetir: çok az veya çok fazla, yanlış yer veya yanlış zaman – birçok olası vardır. Başarısız bir eğitimle sonuçlanan senaryolar. Şimdiye kadar bu program, her yeni uygulama için ayarlanması gereken bir hiperparametre olarak belirlendi. Başka bir deyişle, araştırmacılar modeli tasarlarken genellikle seçtikleri zamanlamayı deneme yanılma yöntemiyle tahmin ederler. ICLR’de sunulan yeni makalede yazarlar, CVDM’nin kendi başına en uygun eğitimi bulabilmesi için programı zaten eğitim aşamasında dahil ettiler. Model daha sonra önceden tanımlanmış bir programa dayanan diğer modellerden daha iyi sonuçlar verdi.
Diğerlerinin yanı sıra, yazarlar CVDM’nin bilimsel bir probleme uygulanabilirliğini gösterdiler: süper çözünürlüklü mikroskopi, tipik bir ters problem. Süper çözünürlüklü mikroskopi, mikroskobik sistemin optik özellikleri nedeniyle çözünürlüğü kısıtlayan bir sınır olan kırınım sınırını aşmayı amaçlamaktadır. Bu sınırı algoritmik olarak aşmak için veri bilimcileri, kayıtlı, sınırlı çözünürlüklü görüntülerdeki hem bulanıklığı hem de gürültüyü ortadan kaldırarak daha yüksek çözünürlüklü görüntüleri yeniden oluşturur. Bu senaryoda CVDM, yaygın olarak kullanılan yöntemlere kıyasla karşılaştırılabilir ve hatta daha üstün sonuçlar vermiştir.
Yakimovich, “Elbette, mikroskobik görüntülerin anlamlılığını artırmak için çeşitli yöntemler var; bunlardan bazıları üretken yapay zeka modellerine dayanıyor” diyor. “Ancak yaklaşımımızın görüntüleme camiasında etki bırakacak bazı yeni benzersiz özelliklere sahip olduğuna inanıyoruz: diğer yayılma modeli yaklaşımlarıyla kıyaslanabilir veya hatta daha iyi kalitede yüksek esneklik ve hız. Ek olarak, CVDM’miz yeniden yapılanma konusunda pek emin olmadığımız durumlarda doğrudan ipuçları sağlıyor; bu, yeni deneylerde ve simülasyonlarda bu belirsizlikleri ele almanın yolunu belirleyen çok yararlı bir özellik.”
Gabriel della Maggiora, çalışmasını 8 Mayıs’taki yıllık Uluslararası Öğrenme Temsilleri Konferansı’nda (ICLR) 3. poster oturumunda saat 10:45’te poster olarak sunacak. Gazetede önceden kaydedilmiş kısa bir konuşma web sitesinde mevcuttur. Konferans, 2017 yılından bu yana ilk kez bu yıl yine Avrupa’da, yani Viyana’da (Avusturya) düzenleniyor. İster yerinde ister video konferans yoluyla katılın, içeriğe erişim için ücretli geçiş gereklidir. Yakimovich, “ICLR, OpenReview portalı aracılığıyla çift-kör bir hakem incelemesi süreci kullanıyor” diye açıklıyor. “İncelemelere akranların önerdiği puanlar eşlik ediyor; yalnızca yüksek puan alan makaleler kabul edilir. Bu nedenle makalemizin kabulü toplum tarafından yüksek saygı ile eşdeğerdir.
Kaynak haber için lütfen BURAYA tıklayınız.
Daha fazla içerik için lütfen BURAYA tıklayınız.