Поглед на новата Al Generative Art

Ал Генеративна уметност е вид на уметност, во повеќето случаи визуелна, која се заснова на соработка помеѓу човечко суштество и автономен систем. „Автономниот систем“ се дефинира како Вештачка интелигенција софтвер, алгоритам или модел способен да врши сложени операции без потреба од интервенција на програмер.

Од бизарните сопоставувања на сликите создадени од Dall-E Mini до NFT на пазарот, сликите генерирани од алгоритмите за вештачка интелигенција се повеќе влегуваат во мејнстрим имагинацијата. Всушност, два важни проекти на оваа тема што заслужуваат да бидат анализирани се: Средно патување ДАЛ-Е2.

Секако, веста се проби и до Твитер. Коментирајќи го, меѓу другите, е и Чарлс Хоскинсон, кој напиша:

ВИ генерирана уметност. Успеав да ја направам оваа слика за само неколку минути. Не можам да замислам колку оваа технологија ќе биде извонредна за 3 години pic.twitter.com/jOToCZj7ki
- Чарлс Хоскинсон (@IOHK_Charles) Февруари 1, 2023

Al Generative Art: рани експерименти и карактеристики

Откако разбравме што е генеративна уметност, важно е да се нагласи еден од нејзините основни принципи: случајност. Што е основно својство на Генеративната уметност.

Всушност, во зависност од типот на софтверот, автономниот систем може да обработува резултати кои се секогаш различни и единствени секогаш кога ќе се изврши командата за генерирање или може да врати променлив број на резултати како одговор на внесувањето на корисникот.

Првите експерименти во Генеративна уметност датираат од 1960-тите со експериментите на Харолд Коен и неговата ААРОН програма. Коен прв пат користел самостоен софтвер за да генерира апстрактни уметнички дела инспирирани од свилените екрани на Поп Арт. Делата на Коен сега се изложени во галеријата Тејт во Лондон.

Друг атрибут на Generative Art, но кој е сè помалку привилегија, е повторувањето на обрасците или апстрактните елементи обезбедени од програмерот и имплементирани во софтверскиот код.

Покрај тоа, развојот на сè покомплексни невронски мрежи кои работат на асоцијација на текст-слика овозможи развој на генеративни модели способни да создаваат сè пореални и точни слики. Најпознат пример за оваа категорија на генеративна уметност е Дал-Е.

Dall-E е мултимодална невронска мрежа базирана на GPT-3 модел за длабоко учење од OpenAI, истата компанија која исто така неодамна се разви Разговор GPT, четботот беше лансиран во ноември 2022 година и оптимизиран со „надгледуван“ и техники за зајакнување на учењето.

Враќајќи се на Dall-E, гледаме дека овој систем е способен да генерира слики од текстуален опис, наречен „навестување“, врз основа на база на податоци од парови текст-слика.

Првата верзија на Dall-E, која беше претставена на јавноста во јануари 2021 година и остана привилегија на мал број професионалци во областа, претставуваше вистинска револуција во однос на овој тип на генеративен модел, надминувајќи ги иновациите на GPT- 3 самиот.

Исто така, од значење е фактот што точноста на резултатите обработени од Dall-E се покажа како совршен простор за друго OpenAI решение: CLIP (Преттренинг за контрастичен јазик-слика).

Невронска мрежа за класификација и рангирање на слики, обучена врз основа на асоцијации на текст-слика, како што се натписите што се наоѓаат на Интернет. Благодарение на интервенцијата на CLIP, која го намалува бројот на резултати предложени на корисникот по барање на 32, беше откриено дека Dall-E враќа задоволителни слики во повеќето случаи.

Midjourney: дизајн, човечка инфраструктура и вештачка интелигенција

Како што се очекуваше, Средно патување е важен проект кој е дел од новонастанатиот концепт Al Generative Art. Поточно, Midjourney е независна истражувачка лабораторија која истражува нови начини на размислување и ја проширува имагинативната моќ на човечкиот вид.

Користењето е едноставно: прво мора да се креира сметка Раздор, платформа која е домаќин на различни заедници, каде што Midjourney е една од нив. Во рамките на апликацијата се различните соби за разговор во кои може активно да се учествува или не во дискусии.

Важно е да се истакне дека за да се обидете да користите вештачка интелигенција за прв пат, мора да отидете на „новаци“ канали, каде 25 бесплатни рендери се на располагање.

Еден рендер одговара на генерирање на четири различни варијанти генерирани од ист текстуален внес.

Така, 25-те рендери се однесуваат на 25 работни задачи за обработка извршени од ботот Midjourney. Следствено, генерирањето на сликата бара интеракција со ботот Midjourney преку текстуална порака наречена „промпт“, во која ќе има клучни зборови што ја опишуваат сликата што корисникот ја има на ум.

Можете да додадете колку сакате детали, важно е да ги поделите клучните зборови со запирка. Откако ќе заврши рендерирањето, компјутерот враќа четири различни слики врз основа на описите од кои може да изберете.

Дополнително, штом програмата ќе заврши со рендерирање, можете да ги пренесете вашите преференции врз основа на сликите и, доколку сакате, повторно да се генерираат уште четири верзии.

DALL-E 2: новиот систем за вештачка интелигенција за уметнички дела

Покрај Midjourney, DALL-E 2 е и новиот систем за вештачка интелигенција што може да создаде реални слики и уметнички дела од опис на природен јазик. Не само тоа, DALL-E 2 исто така може да комбинира концепти, атрибути и стилови.

Силата на новиот систем за вештачка интелигенција, исто така, лежи во можноста да ги прошири сликите надвор од она што е во оригиналното платно, создавајќи нови експанзивни композиции. Покрај тоа, може да направи реални промени на постоечките слики од натпис на природен јазик и може да додава и отстранува елементи земајќи ги предвид сенките, рефлексиите и текстурите.

Можностите на DALL-E 2 исто така вклучуваат сликање и создавање на неколку нејзини варијации инспирирани од оригиналот. DALL-E 2 ја научи врската помеѓу сликите и текстот што се користи за нивно опишување.

Тој користи процес наречен "дифузија," кој започнува со шема од случајни точки и постепено ја менува таа шема кон слика кога препознава специфични аспекти на таа слика.

Така, откако OpenAI го претстави DALL-E во јануари 2021 година, сега најновиот систем, DALL-E 2, генерира пореални и прецизни слики со четири пати поголема резолуција.

DALL-E 2 започна како истражувачки проект и сега е достапен како бета верзија. Безбедносните ублажувања што системот ги разви и продолжува да ги подобрува вклучуваат: ограничување на способноста на системот да генерира насилни, омраза или слики за возрасни и фазно распоредување базирано на учење.

Извор: https://en.cryptonomist.ch/2023/02/02/ai-generative-art/