Nowy model produkcji wizualnej Google’a Imagen 4 jest już dostępny

Inicjatywy firm w zakresie sztucznej inteligencji w tworzeniu obrazów z tekstu są kontynuowane. Możemy zobaczyć więcej niż jedno badanie na ten temat, szczególnie w dużych firmach. Oto jedno z nich, Google , które wprowadziło nową wersję swojego modelu sztucznej inteligencji text-to-image: Imagen 4 .
Firma twierdzi, że ta wersja może „renderować tekst znacznie lepiej” niż poprzedni model i że ogólna jakość wizualna została ulepszona. Ponadto ogłoszono bardziej zaawansowaną wersję Imagen 4 Ultra, która obiecuje dodatkową czułość dla tych, którzy jej chcą.
Nowe modele są obecnie dostępne jako płatny podgląd za pośrednictwem Gemini API. Istnieje również ograniczona liczba bezpłatnych testów dostępnych na platformie Google AI Studio. Model Ultra jest, jak można się spodziewać, nieco droższy.
CZYM RÓŻNI SIĘ WERSJA IMAGEN 4 ULTRA?
Google opisuje standardowy model Imagen 4 jako „idealny do ogólnego użytku”. Droższy Imagen 4 Ultra jest zalecany w scenariuszach, w których „chcesz, aby tekst dokładnie podążał za poleceniami”. Wśród przykładowych obrazów oferowanych przez Google znajduje się trzyklatkowy komiks stworzony za pomocą Imagen 4 Ultra. Obrazy są szczegółowe.
W rzeczywistości Imagen 4 może wydawać się zaawansowany na papierze, ale może mieć trudności z dostarczeniem takiego samego wpływu jak jego konkurenci, tacy jak DALL·E 3 i Midjourney 7. Przynajmniej we wczesnych przykładach nie może zrobić różnicy. Ponadto ogólne zainteresowanie użytkowników wydaje się maleć; poza automatycznie generowanymi obrazami reklamowymi, które pojawiają się w mediach społecznościowych lub na dole witryn z treścią, jego rzeczywiste przypadki użycia są nadal ograniczone.
Podsumowując, modele Imagen 4 firmy Google mogą być technicznym krokiem naprzód, ale ich wpływ na użytkowników jest ograniczony. Jeśli chcesz tekstualnie wiernych, technicznie czystych, ale pozbawionych życia obrazów, Imagen 4 może być właściwym wyborem. W przypadku prac wymagających nieco większej kreatywności DALL·E i Midjourney nadal wydają się być na czele.
milliyet