FLUX: Bu yapay zeka insan ellerini kusursuz bir biçimde oluşturuyor
Güle güle Midjourney
Black Forest Labs, çok kısa bir müddet evvel üç FLUX.1 metinden imaja modelini piyasaya sürdü: üst seviye bir ticari “pro” sürümü, ticari olmayan kullanım için açık yüklere sahip orta sınıf bir “dev” sürümü ve daha süratli olan açık “schnell” sürümü. Firma, kendi modellerinin imaj kalitesi ve metin komutlarına bağlılık üzere alanlarda Midjourney ve DALL-E üzere rakiplerinden daha yeterli olduğunu söylüyor. Bu ortada daha evvelki emsal haberlerimizde olduğu üzere, haber içindeki tüm görseller ilgili yapay zekaya ilişkin.
Açıkçası everart.ai (bunun yerine Fal ve Replicate de kullanabilirsiniz) üzerinden yaptığım denemelerde firmanın bu telaffuzunun boş olmadığını anladım. FLUX.1, görsel kalite açısından Midjourney 6’ya çok yakın ve bazen daha âlâ. İstemlerdeki doğruluk da DALL-E 3 kadar güzel ve tam olarak ne isteniyorsa onu verebiliyor.
FLUX.1 modelleri, şirketin transformatör ve difüzyon tekniklerini birleştiren ve 12 milyar parametreye kadar ölçeklendirilen “hibrit mimari” olarak isimlendirdiği bir mimari kullanıyor. FLUX.1 modelleri ayrıyeten öteki birçok yapay zeka modelinin zayıf kaldığı insan eli konusunda muazzam işler çıkarıyor. Birinci başlarda tüm yapay zekalar insan eli üretiminde sınıfta kalıyordu lakin günümüzde Midjourney üzere araçlar insan elinde ustalaşmış durumda. FLUX.1 ise açık bir model olduğu için insan elindeki ustalığı biraz daha fazla değer arz ediyor.
Sırada Sora rakibi SOTA var