Google, yapay zeka gücüyle fotoğrafları 8 saniyelik videolara dönüştürebilen yeni bir özellik sunuyor.
Gemini Ultra ve Pro aboneleri, tek bir fotoğraf ve kısa bir açıklama yazarak 720p çözünürlüğünde, 16:9 en boy oranında, sesli MP4 videolar oluşturabilecek. Bu özellik, Gemini’nin web sürümünde kullanıma sunuldu ve mobil uygulamaya da bir hafta içinde eklenecek. Google, bu gelişmeyle OpenAI ve Runway AI gibi rakiplerine karşı önemli bir avantaj elde etmeyi hedefliyor. Temelini daha önce tanıtılan Veo 3 modeli oluşturuyor.
Sistem, bitki ve hayvan animasyonlarında başarılı sonuçlar veriyor. Ancak, breakdance gibi karmaşık hareketleri tam olarak yansıtamıyor. Bloomberg’in testlerine göre, bazen yüz hatlarında ve etnik görünümlerde değişiklikler yapıyor. Google ise özellikle nesne ve doğa fotoğraflarında yüksek başarı sağlandığını ve geliştirme çalışmalarının devam ettiğini belirtiyor. Şirket ayrıca, şiddet içeren veya kamuya açık kişileri konu alan videoların oluşturulmasına izin verilmeyeceğini de vurguluyor.