Հայացք նոր Al Generative Art-ին

Al Generative Art արվեստի մի տեսակ է, շատ դեպքերում՝ վիզուալ, որը հիմնված է մարդու և ինքնավար համակարգի համագործակցության վրա։ «Ինքնավար համակարգը» սահմանվում է որպես ան Արհեստական ​​բանականություն ծրագրակազմ, ալգորիթմ կամ մոդել, որն ունակ է կատարել բարդ գործողություններ՝ առանց ծրագրավորողի միջամտության:

կողմից ստեղծված պատկերների տարօրինակ համադրումներից Dall-E Mini դեպի NFT շուկայում, արհեստական ​​ինտելեկտի ալգորիթմների կողմից ստեղծված պատկերներն ավելի ու ավելի են մտնում հիմնական երևակայություն: Փաստորեն, թեմայի վերաբերյալ երկու կարևոր նախագծեր, որոնք արժանի են վերլուծության, հետևյալն են. Միջին ճանապարհորդություն և DALL-E2.

Իհարկե, լուրն իր ճանապարհն է գտել նաև Twitter-ում։ Այն, ի թիվս այլոց, մեկնաբանում է Չարլզ Հոսկինսոնը, ով գրել է.

Al Generative Art. վաղ փորձեր և առանձնահատկություններ

Հասկանալով, թե ինչ է գեներատիվ արվեստը, կարևոր է ընդգծել դրա հիմնադիր սկզբունքներից մեկը. պատահականություն. Ինչը Գեներատիվ արվեստի հիմնարար սեփականությունն է:

Իրականում, կախված ծրագրաշարի տեսակից, ինքնավար համակարգը կարող է մշակել արդյունքներ, որոնք միշտ տարբեր են և եզակի ամեն անգամ, երբ գեներացման հրամանը կատարվում է, կամ կարող է վերադարձնել փոփոխական թվով արդյունքներ՝ ի պատասխան օգտվողի մուտքագրման:

Generative Art-ում առաջին փորձերը սկսվում են 1960-ական թվականներին՝ փորձարկումներով Հարոլդ Քոհեն եւ իր ԱԱՐՈՆ ծրագիրը։ Քոենն առաջին անգամ օգտագործեց ինքնուրույն ծրագրակազմ՝ փոփ արվեստի մետաքսե էկրաններից ոգեշնչված վերացական արվեստի գործեր ստեղծելու համար: Կոենի աշխատանքները այժմ ցուցադրվում են Լոնդոնի Թեյթ պատկերասրահում:

Generative Art-ի մեկ այլ հատկանիշ, որը, սակայն, ավելի ու ավելի քիչ արտոնություն է համարվում, ծրագրավորողի կողմից տրամադրված օրինաչափությունների կամ աբստրակտ տարրերի կրկնությունն է և ներդրված ծրագրային կոդում:

Բացի այդ, տեքստ-պատկեր ասոցիացիայի վրա գործող ավելի բարդ նյարդային ցանցերի զարգացումը հնարավորություն է տվել ստեղծել գեներատիվ մոդելներ, որոնք կարող են ստեղծել ավելի իրատեսական և ճշգրիտ պատկերներ: Գեներատիվ արվեստի այս կատեգորիայի ամենահայտնի օրինակն է Դալլ-Է.

Dall-E-ն մուլտիմոդալ նեյրոնային ցանց է, որը հիմնված է GPT-3 խորը ուսուցման մոդելը OpenAI, նույն ընկերությունը, որը նույնպես վերջերս զարգացավ Զրուցարան GPT, չաթբոտը գործարկվել է 2022 թվականի նոյեմբերին և օպտիմիզացվել է «վերահսկվող» և ամրապնդման ուսուցման տեխնիկա:

Վերադառնալով Dall-E-ին, մենք տեսնում ենք, որ այս համակարգը ունակ է պատկերներ ստեղծել տեքստային նկարագրությունից, որը կոչվում է. «հուշում», հիմնված տեքստ-պատկեր զույգերի տվյալների բազայի վրա:

Dall-E-ի առաջին տարբերակը, որը հանրությանը ներկայացվեց 2021 թվականի հունվարին և մնաց ոլորտի փոքր թվով մասնագետների իրավասությունը, իսկական հեղափոխություն էր այս տեսակի գեներատիվ մոդելի առումով՝ գերազանցելով GPT-ի նորարարությունները։ 3 ինքնին.

Կարևոր է նաև այն փաստը, որ Dall-E-ի կողմից մշակված արդյունքների ճշգրտությունը կատարյալ շրջանակ է մեկ այլ OpenAI լուծման համար. CLIP (Contrastive Language-Image Pretraining).

Պատկերների դասակարգման և դասակարգման նեյրոնային ցանց, որը պատրաստված է տեքստ-պատկեր ասոցիացիաների հիման վրա, ինչպիսիք են համացանցում հայտնաբերված ենթագրերը: Շնորհիվ CLIP-ի միջամտության, որը նվազեցնում է օգտվողին առաջարկվող արդյունքների թիվը մեկ հուշումի համար մինչև 32, պարզվեց, որ Dall-E-ն շատ դեպքերում գոհացուցիչ պատկերներ է տալիս:

Midjourney. դիզայն, մարդկային ենթակառուցվածք և արհեստական ​​ինտելեկտ

Ինչպես և սպասվում էր, Միջին ճանապարհորդություն կարևոր նախագիծ է, որը ձևավորվող Al Generative Art հայեցակարգի մի մասն է: Մասնավորապես, Midjourney-ը անկախ հետազոտական ​​լաբորատորիա է, որը ուսումնասիրում է մտածողության նոր միջոցներ և ընդլայնում մարդկային տեսակի երևակայության ուժը:

Օգտագործումը պարզ է. նախ պետք է հաշիվ ստեղծել Discord, հարթակ, որը հյուրընկալում է տարբեր համայնքներ, որտեղ Midjourney-ն դրանցից մեկն է։ Հավելվածի ներսում կան տարբեր զրուցարաններ, որոնցում կարելի է ակտիվորեն մասնակցել կամ չմասնակցել քննարկումներին։

Կարևոր է նշել, որ Արհեստական ​​ինտելեկտն առաջին անգամ օգտագործելու համար պետք է գնալ «նորեկներ» ալիքներ, որտեղ 25 անվճար ռենդեր են մատչելի.

Մեկ արտապատկերումը համապատասխանում է նույն տեքստային մուտքագրումից առաջացած չորս տարբեր տարբերակների առաջացմանը:

Այսպիսով, 25 մատուցումները վերաբերում են Midjourney բոտի կողմից կատարված 25 մշակման աշխատանքներին: Հետևաբար, պատկեր ստեղծելու համար անհրաժեշտ է փոխազդել Midjourney բոտի հետ տեքստային հաղորդագրության միջոցով, որը կոչվում է «հուշում», որտեղ կլինեն հիմնաբառեր, որոնք նկարագրում են օգտատիրոջ մտքում պատկերը:

Կարող եք ավելացնել այնքան մանրամասներ, որքան ցանկանում եք, կարևորը հիմնաբառերը բաժանելն է ստորակետով։ Վերարտադրումն ավարտվելուց հետո համակարգիչը վերադարձնում է չորս տարբեր պատկերներ՝ հիմնվելով ընտրված նկարագրությունների վրա:

Բացի այդ, երբ ծրագիրն ավարտի ցուցադրումը, դուք կարող եք փոխանցել ձեր նախասիրությունները՝ հիմնվելով պատկերների վրա և, եթե ցանկանում եք, նորից ստեղծեք ևս չորս տարբերակ:

DALL-E 2. AI նոր համակարգ արվեստի գործերի համար

Բացի Midjourney-ից, DALL-E 2-ը նաև արհեստական ​​ինտելեկտի նոր համակարգն է, որը կարող է ստեղծել իրատեսական պատկերներ և արվեստի գործեր բնական լեզվի նկարագրությունից: Ոչ միայն դա, DALL-E 2-ը կարող է նաև համատեղել հասկացությունները, ատրիբուտները և ոճերը:

Արհեստական ​​ինտելեկտի նոր համակարգի ուժը նաև կայանում է նրանում, որ կարող է ընդլայնել պատկերները բնօրինակ կտավից դուրս՝ ստեղծելով նոր ընդարձակ կոմպոզիցիաներ. Բացի այդ, այն կարող է իրատեսական փոփոխություններ կատարել գոյություն ունեցող պատկերներում բնական լեզվով ենթագրերից և կարող է ավելացնել և հեռացնել տարրեր՝ հաշվի առնելով ստվերները, արտացոլումները և հյուսվածքները:

DALL-E 2-ի հնարավորությունները ներառում են նաև պատկեր վերցնելը և դրա մի քանի տարբերակների ստեղծումը՝ ոգեշնչված բնօրինակից: DALL-E 2-ը սովորել է պատկերների և դրանք նկարագրելու համար օգտագործվող տեքստի փոխհարաբերությունները:

Այն օգտագործում է գործընթաց, որը կոչվում է «դիֆուզիոն», որը սկսվում է պատահական կետերի օրինաչափությունից և աստիճանաբար փոխում է այդ օրինաչափությունը դեպի պատկեր, երբ ճանաչում է այդ պատկերի հատուկ կողմերը:

Այսպիսով, այն բանից հետո, երբ OpenAI-ը ներկայացրեց DALL-E-ն 2021 թվականի հունվարին, այժմ նորագույն համակարգը՝ DALL-E 2-ը, ստեղծում է ավելի իրատեսական և ճշգրիտ պատկերներ՝ չորս անգամ ավելի մեծ լուծաչափով:

DALL-E 2-ը սկսվել է որպես հետազոտական ​​նախագիծ և այժմ հասանելի է որպես ա բետա տարբերակը. Անվտանգության մեղմացումները, որոնք համակարգը մշակել և շարունակում է կատարելագործել, ներառում են՝ բռնի, ատելության կամ չափահաս պատկերներ ստեղծելու համակարգի կարողության սահմանափակումը և ուսուցման վրա հիմնված փուլային տեղակայումը:

Աղբյուր՝ https://en.cryptonomist.ch/2023/02/02/ai-generative-art/