Sztuczna inteligencja tworzy zdjęcia na podstawie tekstu
Myślisz: drzewo rosnące nad urwiskiem. W twojej głowie od razu pojawia się konkretny obraz. A co, gdyby pojawił się także na monitorze? Oczywiście z łatwością da się znaleźć odpowiednie zdjęcie w wyszukiwarce, ale możliwy jest też inny sposób. Firma Nvidia udostępniła niedawno algorytm GauGAN2, który generuje zdjęcie na podstawie tekstu.
Wykorzystując uczenie maszynowe, sztuczna inteligencja przetwarza anglojęzyczny tekst w tworzone na żywo fotografie.
Jest to możliwe dzięki temu, że algorytm został wcześniej nakarmiony tysiącami zdjęć. Potem sztuczna inteligencja nauczyła się rozpoznawać i izolować konkretne elementy, a następnie zestawić je w nową całość.
’GauGAN2 łączy mapowanie poszczególnych segmentów, malowanie i generowanie obrazu na podstawie tekstu w jednym modelu, stając się potężnym narzędziem do tworzenia fotorealistycznej sztuki. Wersja demo jest jedną z pierwszych, które łączą wiele modalności — tekst, segmentację semantyczną, szkic i styl — w ramach jednej struktury GAN. Dzięki temu można szybciej i łatwiej przekształcić wizję artysty w wysokiej jakości obraz generowany przez AI’ – tłumaczy firma.
Wersja demo została udostępniona przez firmę tutaj, więc możecie sami sprawdzić, jak to działa.
Niewątpliwie jest to imponujący algorytm. Do czego się może przydać? Z pewnością chętnie sięgną po niego artyści i graficy, ale także twórcy metaverse, którzy będą chcieli bardziej realistycznie odwzorować naszą rzeczywistość.
Na koniec musimy uczciwie przyznać, że algorytm nie jest idealny. Niekiedy generuje naprawdę absurdalne obrazki – przykład poniżej. Sądzimy jednak, że i w nich można znaleźć jakiś rodzaj dziwacznego piękna.
Tekst: NS