Իրավական դատաստանը գեներատիվ AI ChatGPT-ի համար, եթե բռնեն գրագողության կամ խախտման մեջ, զգուշացնում է AI էթիկան և AI օրենքը

Արդյո՞ք գեներատիվ AI-ն, ինչպիսին է ChatGPT-ն է, պոկում է մեր կայքերը և մարդու կողմից ստեղծված բովանդակությունը: Եղեք տեղյակ, եղեք ... [+] վրդովված, պատրաստ եղիր.

ստացվեց

Վարկ տվեք այնտեղ, որտեղ վարկը հասանելի է:

Սա մի քիչ իմաստուն իմաստություն է, որին դուք, հավանաբար, դաստիարակվել եք, որպեսզի հաստատապես հավատաք: Իրոք, կարելի է ենթադրել կամ պատկերացնել, որ մենք բոլորս կարող ենք որոշ չափով ողջամտորեն համաձայնել, որ սա կյանքի արդար և խելամիտ կանոն է: Երբ ինչ-որ մեկն անում է մի բան, որն արժանի է ճանաչման, համոզվեք, որ նա ստանում է իր արժանի ճանաչումը:

Հակառակ տեսակետը շատ ավելի քիչ համոզիչ կթվա:

Եթե ինչ-որ մեկը շրջում էր, պնդելով, որ վարկը պետք է Նշում Դուք կարող եք պնդել, որ նման համոզմունքը անբարեխիղճ է և, հնարավոր է, թաքնված: Մենք հաճախ շատ ենք անհանգստանում, երբ վարկը խաբում են մեկին, ով ինչ-որ նշանավոր բան է արել: Ես համարձակվում եմ ասել, որ մենք հատկապես դժգոհ ենք, երբ ուրիշները կեղծ կերպով վարկ են վերցնում ուրիշների աշխատանքի համար: Դա անհանգստացնող կրկնակի հարված է: Մարդը, ով պետք է ստանար վարկը, մերժվում է իր պահը արևի տակ: Բացի այդ, խաբեբայը վայելում է ուշադրության կենտրոնը, թեև նրանք սխալ կերպով խաբում են մեզ՝ յուրացնելու մեր բարենպաստ զգացմունքները:

Ինչո՞ւ է այս բոլոր խոսակցությունները ամենաճիշտ ձևերով վարկեր հավաքելու և սխալ ու արհամարհական ուղիներից խուսափելու մասին:

Քանի որ մենք, կարծես, բախվում ենք նմանատիպ դժվարության, երբ խոսքը վերաբերում է Արհեստական ինտելեկտի (AI) նորագույնին:

Այո, պնդումներն այն են, որ դա տեղի է ունենում ցուցադրաբար մի տեսակի AI-ի միջոցով, որը հայտնի է որպես Գեներատիվ AI. Բազմաթիվ կարծիքներ կան, որ Generative AI-ն, այս օրերի նորությունների ամենաթեժ AI-ն, արդեն իսկ վարկ է վերցրել այն բանի համար, ինչին արժանի չէ արժանին մատուցել: Եվ սա, ամենայն հավանականությամբ, կվատթարանա, քանի որ գեներատիվ AI-ն գնալով ավելի է ընդլայնվում և օգտագործվում: Ավելի ու ավելի շատ վարկ է ներծծվում գեներացնող AI-ին, մինչդեռ, ցավոք, նրանք, ովքեր առատորեն արժանի են իսկական վարկին, մնում են փոշու մեջ:

Այս ենթադրյալ երևույթը հստակորեն նշելու իմ առաջարկած ձևը երկու հուզիչ արտահայտությունների միջոցով է.

1) գրագողություն մասշտաբով
2) Հեղինակային իրավունքի խախտման մասշտաբով

Ենթադրում եմ, որ դուք կարող եք տեղյակ լինել գեներատիվ AI-ի մասին՝ շնորհիվ լայնորեն տարածված AI հավելվածի, որը հայտնի է որպես ChatGPT, որը թողարկվել է նոյեմբերին OpenAI-ի կողմից: Ես մի պահ ավելին կասեմ գեներատիվ AI-ի և ChatGPT-ի մասին: Մնա այդտեղ.

Եկեք անմիջապես հասնենք այն խնդրին, թե ինչն է մարդկանց այծերը, ոնց որ ասես, ստանում:

Ոմանք ջերմեռանդորեն բողոքում են, որ գեներատիվ AI-ն կարող է պոկել մարդկանց, ովքեր բովանդակություն են ստեղծել: Տեսեք, արհեստական ինտելեկտի գեներացնող հավելվածների մեծ մասը տվյալներ են, որոնք վերապատրաստվում են համացանցում հայտնաբերված տվյալների ուսումնասիրությամբ: Հիմնվելով այդ տվյալների վրա՝ ալգորիթմները կարող են հղկել AI հավելվածի ներսում օրինաչափությունների համապատասխանող հսկայական ցանց, որը հետագայում կարող է արտադրել թվացյալ նոր բովանդակություն, որը զարմանալիորեն կարծես թե ստեղծվել է մարդու ձեռքով, այլ ոչ թե ավտոմատացման կտոր։

Այս ուշագրավ սխրանքը մեծապես պայմանավորված է ինտերնետով սկանավորված բովանդակությունից օգտվելով: Առանց ինտերնետի բովանդակության ծավալի և հարուստության՝ որպես տվյալների ուսուցման աղբյուր, գեներացնող AI-ն գրեթե դատարկ կլիներ և օգտագործելու համար քիչ կամ ոչ մի հետաքրքրություն կառաջացներ: Արհեստական ինտելեկտը ուսումնասիրելով միլիոնավոր միլիոնավոր առցանց փաստաթղթեր և տեքստեր, ինչպես նաև հարակից բովանդակության բոլոր տեսակները, աստիճանաբար ձևավորվում է օրինաչափությունների համընկնումը՝ փորձելով ընդօրինակել մարդու կողմից արտադրված բովանդակությունը:

Որքան ավելի շատ բովանդակություն ուսումնասիրվի, այնքան հավանական է, որ օրինաչափությունների համընկնումն ավելի կհղկվի և ավելի լավ կդարձնի միմիկան, մնացած բոլորը հավասար կլինեն:

Ահա, ուրեմն, միլիարդավոր դոլարների հարցը.

Մեծ Հարց. Եթե դուք կամ ուրիշներ ունեք բովանդակություն ինտերնետում, որի վրա վերապատրաստվել է արհեստական ինտելեկտի ինչ-որ գեներացնող հավելված՝ դա անելով, ենթադրաբար, առանց ձեր անմիջական թույլտվության և, հնարավոր է, ընդհանրապես առանց ձեր տեղեկացվածության, դուք պետք է իրավունք ունենաք մի կտոր կարկանդակ ստանալու համար, թե ինչ արժեքից է բխում: այդ գեներատիվ AI տվյալների ուսուցումը:

Ոմանք բուռն կերպով պնդում են, որ միակ ճիշտ պատասխանն է այո, հատկապես, որ այդ մարդկային բովանդակություն ստեղծողները իսկապես արժանի են իրենց գործողությունների կրճատմանը: Բանն այն է, որ ձեզ դժվար կլինի գտնել որևէ մեկին, ով ստացել է իրենց արդար բաժինը, և ավելի վատ է, որ գրեթե ոչ ոք որևէ բաժնեմաս չի ստացել: Ինտերնետային բովանդակություն ստեղծողներին, որոնք ակամա և անգիտակցաբար ներդրում են կատարել, ըստ էության մերժվում են իրենց օրինական վարկը:

Սա կարող է բնութագրվել որպես դաժան և վիրավորական: Մենք պարզապես անցանք իմաստուն իմաստության բացման միջով, որ վարկը պետք է տրվի այնտեղ, որտեղ արժանի է վարկը: Գեներատիվ AI-ի դեպքում, ըստ երևույթին, այդպես չէ: Վարկավորման մասին վաղեմի և առաքինի կանոնը կարծես կոպտորեն խախտված է:

Վա՜յ, հակադարձումը գնում է, դուք լրիվ գերագնահատում և սխալ եք ներկայացնում իրավիճակը։ Իհարկե, գեներատիվ AI-ն ուսումնասիրել է բովանդակությունը ինտերնետում: Իհարկե, սա առատորեն օգտակար էր որպես գեներացնող AI-ի տվյալների ուսուցման մի մաս: Խոստովանենք, որ տպավորիչ գեներացնող AI հավելվածներն այսօր այդքան տպավորիչ չէին լինի առանց այս դիտարկված մոտեցման: Բայց դուք չափից դուրս կամուրջ եք գնացել՝ ասելով, որ բովանդակություն ստեղծողներին պետք է հատկացվի որոշակի վարկ:

Տրամաբանությունը հետեւյալն է. Մարդիկ դուրս են գալիս ինտերնետ և սովորում ինչ-որ բան ինտերնետից՝ դա անելով սովորական և առանց որևէ աղմուկի: Անձը, ով կարդում է սանտեխնիկայի մասին բլոգեր, այնուհետև դիտում է անվճար հասանելի սանտեխնիկայի մասին տեսանյութեր, հաջորդ օրը կարող է դուրս գալ և աշխատել որպես սանտեխնիկ: Արդյո՞ք նրանք պետք է իրենց սանտեխնիկայի հետ կապված դրամական փոխանցումների մի մասը տան այն բլոգերին, որը գրել է, թե ինչպես ջրմուղ անել լվացարանը: Արդյո՞ք նրանք պետք է վճար տան վլոգերին, ով նկարահանել է տեսանյութը, որը ցույց է տալիս ծակվող լոգարանը շտկելու քայլերը:

Գրեթե հաստատ ոչ:

Գեներատիվ AI-ի տվյալների ուսուցումը զուտ օրինաչափություններ մշակելու միջոց է: Քանի դեռ գեներատիվ AI-ից ստացված արդյունքները զուտ հետազոտվածի վերագրանցում չեն, դուք կարող եք համոզիչ կերպով պնդել, որ նրանք «սովորել են» և, հետևաբար, ենթակա չեն որևէ կոնկրետ աղբյուրի որևէ հատուկ վարկ տրամադրելու: Եթե դուք չեք կարող որսալ գեներատիվ AI-ն ճշգրիտ ռեգուրգիտացիան կատարելիս, ապա ցուցումները ցույց են տալիս, որ AI-ն ընդհանրացվել է որևէ կոնկրետ աղբյուրից դուրս:

Ոչ մեկին վարկ չի տրվում: Կամ, կարելի է ենթադրել, կարելի է ասել, որ վարկը պատկանում է բոլորին։ Համացանցում հայտնաբերված կոլեկտիվ տեքստը և մարդկության այլ բովանդակությունը գնահատվում են: Մենք բոլորս ստանում ենք վարկ: Կոնկրետ աղբյուրի վարկը մատնանշելու փորձն անիմաստ է: Ուրախ եղեք, որ արհեստական ինտելեկտը զարգանում է, և որ մարդկությանը կշահի: Ինտերնետում այդ հրապարակումները պետք է պատիվ զգային, որ նպաստել են արհեստական ինտելեկտի առաջընթացին և ինչպես դա կօգնի մարդկությանը հավերժության համար:

Այդ երկու հակադիր տեսակետների մասին էլ ավելին կասեմ:

Միևնույն ժամանակ, դուք թեքվում եք դեպի այն ճամբարը, որն ասում է, որ վարկը վճարված է և ուշացած նրանց համար, ովքեր ունեն ինտերնետային կայքեր, թե՞ գտնում եք, որ հակառակ կողմը, որն ասում է, որ ինտերնետ բովանդակություն ստեղծողները վճռական են: Նշում պոկվելն ավելի համոզիչ կեցա՞ծ է:

Մի հանելուկ և հանելուկ՝ բոլորը խցանված են:

Եկեք բացենք սա:

Այսօրվա սյունակում ես կանդրադառնամ այս արտահայտված մտահոգություններին, որ գեներատիվ AI-ն, ըստ էության, գրագողություն է կամ, հնարավոր է, խախտում է համացանցում տեղադրված բովանդակության հեղինակային իրավունքները (համարվում է մտավոր սեփականության իրավունք կամ IP խնդիր): Մենք կդիտարկենք այս անհանգստությունների հիմքը: Այս քննարկման ընթացքում ես երբեմն կանդրադառնամ ChatGPT-ին, քանի որ դա գեներատիվ AI-ի 600 ֆունտանոց գորիլա է, թեև հիշեք, որ կան բազմաթիվ այլ գեներացնող AI հավելվածներ, և դրանք հիմնականում հիմնված են նույն ընդհանուր սկզբունքների վրա:

Միևնույն ժամանակ, դուք կարող եք մտածել, թե իրականում ինչ է գեներատիվ AI-ն:

Եկեք նախ անդրադառնանք գեներատիվ արհեստական ինտելեկտի հիմունքներին, այնուհետև կարող ենք ուշադիր նայել արդիական խնդրին:

Այս ամենի մեջ մտնում են AI էթիկայի և AI օրենքի նկատառումները:

Խնդրում ենք տեղյակ լինել, որ շարունակական ջանքեր են գործադրվում Արհեստական արհեստական ինտելեկտի էթիկական սկզբունքները ներթափանցելու AI հավելվածների մշակման և ներդրման մեջ: Մտահոգված և նախկինում արհեստական ինտելեկտի էթիկայի մասնագետների աճող կոնտինգենտը փորձում է ապահովել, որ արհեստական ինտելեկտը մշակելու և ընդունելու ջանքերը հաշվի են առնում անելու տեսակետը: AI For Good և կանխարգելող AI For Bad. Նմանապես, առաջարկվում են արհեստական ինտելեկտի նոր օրենքներ, որոնք շրջանառվում են որպես պոտենցիալ լուծումներ, որոնք թույլ չեն տալիս AI-ի ջանքերը չխոչընդոտել մարդու իրավունքներին և նման բաներին: AI-ի էթիկայի և AI օրենքի իմ շարունակական և ընդարձակ լուսաբանման համար տե՛ս հղումն այստեղ և հղումն այստեղ, պարզապես մի քանի անուն:

Արհեստական ինտելեկտի էթիկական սկզբունքների մշակումն ու տարածումը հետամուտ են լինում՝ հուսանք կանխելու համար, որ հասարակությունն ընկնի արհեստական ինտելեկտը հրահրող բազմաթիվ թակարդների մեջ: ՅՈՒՆԵՍԿՕ-ի ջանքերով մոտ 200 երկրների կողմից մշակված և աջակցվող ՄԱԿ-ի AI-ի էթիկայի սկզբունքների իմ լուսաբանման համար տե՛ս. հղումն այստեղ. Նմանապես, արհեստական ինտելեկտի նոր օրենքներ են ուսումնասիրվում՝ փորձելով AI-ն հավասարաչափ պահել: Վերջին վերցնումներից մեկը բաղկացած է առաջարկվող մի շարքից AI իրավունքների օրինագիծ որ ԱՄՆ Սպիտակ տունը վերջերս հրապարակեց՝ բացահայտելու մարդու իրավունքները արհեստական ինտելեկտի դարաշրջանում, տես հղումն այստեղ. Գյուղ է պահանջվում AI-ի և AI-ի մշակողներին ճիշտ ուղու վրա պահելու և կանխելու նպատակային կամ պատահական թաքնված ջանքերը, որոնք կարող են վնասել հասարակությանը:

Այս քննարկման մեջ ես միահյուսելու եմ AI-ի էթիկայի և AI օրենքի հետ կապված նկատառումները:

Generative AI-ի հիմունքները

Գեներատիվ AI-ի ամենահայտնի օրինակը ներկայացված է ChatGPT անունով AI հավելվածով: ChatGPT-ն հայտնվեց հանրային գիտակցության մեջ դեռևս նոյեմբերին, երբ այն թողարկվեց AI հետազոտական OpenAI ընկերության կողմից: Այն ժամանակվանից ի վեր, երբ ChatGPT-ն հավաքել է հսկայական վերնագրեր և զարմանալիորեն գերազանցել է իր հատկացված տասնհինգ րոպե փառքը:

Կարծում եմ, դուք հավանաբար լսել եք ChatGPT-ի մասին կամ գուցե նույնիսկ գիտեք մեկին, ով օգտագործել է այն:

ChatGPT-ը համարվում է արհեստական ինտելեկտի գեներատիվ հավելված, քանի որ այն ընդունում է օգտատերից որոշ տեքստ, այնուհետև առաջացնում կամ արտադրում է արդյունք, որը բաղկացած է էսսեից: AI-ն տեքստից տեքստ գեներատոր է, չնայած ես նկարագրում եմ AI-ն որպես տեքստի շարադրություն գեներատոր, քանի որ դա ավելի հեշտ է պարզաբանում, թե ինչի համար է այն սովորաբար օգտագործվում: Դուք կարող եք օգտագործել գեներատիվ AI-ը երկար կոմպոզիցիաներ կազմելու համար կամ կարող եք ստիպել այն առաջարկել բավականին կարճ բովանդակալից մեկնաբանություններ: Ամեն ինչ ձեր խնդրանքով է:

Ձեզ անհրաժեշտ է միայն հուշում մուտքագրել, և AI հավելվածը ձեզ համար կստեղծի շարադրություն, որը կփորձի պատասխանել ձեր հուշմանը: Կազմված տեքստը կթվա, կարծես շարադրությունը գրված է մարդու ձեռքով և մտքով: Եթե դուք պետք է մուտքագրեք հուշում, որտեղ ասվում է «Պատմեք ինձ Աբրահամ Լինքոլնի մասին», գեներատիվ AI-ն ձեզ կտրամադրի շարադրություն Լինքոլնի մասին: Գոյություն ունեն գեներատիվ AI-ի այլ եղանակներ, ինչպիսիք են՝ տեքստը-արվեստ և տեքստ-տեսանյութ: Այստեղ ես կկենտրոնանամ տեքստից տեքստ փոփոխության վրա:

Ձեր առաջին միտքը կարող է լինել այն, որ այս գեներացնող կարողությունը այնքան էլ մեծ խնդիր չի թվում էսսեներ պատրաստելու առումով: Դուք հեշտությամբ կարող եք առցանց որոնում կատարել ինտերնետում և հեշտությամբ գտնել տոննաներով ու տոննաներով էսսեներ Նախագահ Լինքոլնի մասին: Գեներատիվ AI-ի դեպքում ամենակարևորն այն է, որ ստեղծված շարադրությունը համեմատաբար եզակի է և ապահովում է բնօրինակ կոմպոզիցիա, այլ ոչ թե կրկնօրինակ: Եթե դուք փորձեիք գտնել AI-ի կողմից պատրաստված շարադրությունը առցանց ինչ-որ տեղ, դժվար թե այն հայտնաբերեք:

Generative AI-ն նախապես պատրաստված է և օգտագործում է բարդ մաթեմատիկական և հաշվողական ձևակերպում, որը ստեղծվել է համացանցում գրավոր բառերի և պատմությունների օրինաչափությունների ուսումնասիրության միջոցով: Հազարավոր և միլիոնավոր գրավոր հատվածների ուսումնասիրության արդյունքում արհեստական ինտելեկտը կարող է նոր էսսեներ և պատմություններ դուրս հանել, որոնք հայտնաբերվածի խառնուրդ են: Տարբեր հավանականական ֆունկցիոնալություններ ավելացնելով՝ ստացված տեքստը բավականին եզակի է՝ համեմատած այն, ինչ օգտագործվել է ուսումնական հավաքածուում:

Բազմաթիվ մտահոգություններ կան գեներատիվ AI-ի վերաբերյալ:

Կարևոր բացասական կողմերից մեկն այն է, որ գեներատիվ վրա հիմնված AI հավելվածի կողմից արտադրված էսսեները կարող են ներառել տարբեր կեղծիքներ, ներառյալ ակնհայտորեն իրականությանը չհամապատասխանող փաստեր, փաստեր, որոնք ապակողմնորոշված են և ակնհայտ փաստեր, որոնք ամբողջությամբ հորինված են: Այդ հորինված ասպեկտները հաճախ կոչվում են որպես ձև AI հալյուցինացիաներ, մի բառակապակցություն, որը ես հավանություն չեմ տալիս, բայց, ցավոք, թվում է, թե ամեն դեպքում հանրաճանաչություն է ձեռք բերում (իմ մանրամասն բացատրության համար, թե ինչու է սա ոջլոտ և ոչ պիտանի տերմինաբանություն, տե՛ս իմ լուսաբանումը այստեղ հղումն այստեղ).

Մյուս մտահոգությունն այն է, որ մարդիկ կարող են հեշտությամբ արժանանալ արհեստական ինտելեկտի ստեղծած շարադրության համար, չնայած իրենք չեն կազմել շարադրությունը: Դուք կարող եք լսել, որ ուսուցիչները և դպրոցները բավականին մտահոգված են արհեստական ինտելեկտի գեներացնող հավելվածների առաջացմամբ: Ուսանողները կարող են պոտենցիալ օգտագործել գեներատիվ AI՝ իրենց հանձնարարված էսսեները գրելու համար: Եթե ուսանողը պնդում է, որ շարադրությունը գրվել է իր ձեռքով, ապա ուսուցիչը քիչ հավանական է, որ կարողանա պարզել, թե արդյոք այն կեղծվել է գեներատիվ AI-ի կողմից: Այս աշակերտի և ուսուցչի շփոթեցնող կողմի իմ վերլուծության համար տե՛ս իմ լուսաբանումը այստեղ հղումն այստեղ և հղումն այստեղ.

Սոցցանցերում մի քանի խելահեղ չափի հայտարարություններ են հնչել Գեներատիվ AI պնդելով, որ AI-ի այս վերջին տարբերակը իրականում է զգայուն AI (ոչ, նրանք սխալվում են): Արհեստական ինտելեկտի էթիկայի և արհեստական ինտելեկտի իրավունքի մասնագետները հատկապես անհանգստացած են լայնածավալ պահանջների այս աճող միտումով: Դուք կարող եք քաղաքավարի կերպով ասել, որ որոշ մարդիկ գերագնահատում են այն, ինչ իրականում կարող է անել այսօրվա AI-ն: Նրանք ենթադրում են, որ AI-ն ունի կարողություններ, որոնց մենք դեռ չենք կարողացել հասնել: Դա ցավալի է: Ավելի վատն այն է, որ նրանք կարող են թույլ տալ իրենց և ուրիշներին հայտնվել սարսափելի իրավիճակներում՝ ենթադրելով, որ AI-ն խելամիտ կամ մարդանման կլինի՝ ի վիճակի լինելով գործողություններ ձեռնարկել:

Մի մարդակերպեք AI-ն:

Այդպես վարվելով՝ դուք կհայտնվեք կպչուն և կոպիտ վստահության ծուղակի մեջ՝ ակնկալելով, որ AI-ն կանի այնպիսի բաներ, որոնք ի վիճակի չէ կատարել: Ասվածով հանդերձ, գեներատիվ AI-ի վերջին տարբերակը համեմատաբար տպավորիչ է այն բանի համար, թե ինչ կարող է անել: Ուշադիր եղեք, թեև կան զգալի սահմանափակումներ, որոնք դուք պետք է անընդհատ հիշեք ցանկացած գեներացնող AI հավելված օգտագործելիս:

Մեկ վերջնական նախազգուշացում առայժմ.

Ինչ էլ որ տեսնեք կամ կարդաք գեներացնող AI պատասխանում, որ Թվում է, պետք է փոխանցվի որպես զուտ փաստացի (ամսաթվեր, վայրեր, մարդիկ և այլն), համոզվեք, որ թերահավատ եք և պատրաստ եղեք կրկնակի ստուգել այն, ինչ տեսնում եք:

Այո, ամսաթվերը կարելի է հորինել, վայրեր հորինել, և տարրեր, որոնք մենք սովորաբար ակնկալում ենք, որ անարգանքից վեր են. բոլորը ենթակա է կասկածների. Մի հավատացեք ձեր կարդացածին և թերահավատորեն նայեք, երբ ուսումնասիրում եք արհեստական ինտելեկտի գեներացնող շարադրություններ կամ արդյունքներ: Եթե արհեստական ինտելեկտի գեներացնող հավելվածը ձեզ ասի, որ Աբրահամ Լինքոլնը թռավ ամբողջ երկրում իր անձնական ինքնաթիռով, դուք, անկասկած, կիմանաք, որ դա արատ է: Ցավոք, որոշ մարդիկ կարող են չհասկանալ, որ իր ժամանակներում ինքնաթիռները չեն եղել, կամ նրանք կարող են իմանալ, բայց չեն նկատել, որ շարադրությունը ներկայացնում է այս լկտի և սարսափելի կեղծ պնդումը:

Առողջ թերահավատության մեծ չափաբաժինը և անհավատության համառ մտածելակերպը կլինեն ձեր լավագույն առավելությունը գեներացնող AI-ն օգտագործելիս:

Մենք պատրաստ ենք անցնել այս պարզաբանման հաջորդ փուլ:

Ինտերնետը և գեներատիվ AI-ն միասին են

Այժմ, երբ դուք պատկերացում ունեք, թե ինչ է գեներատիվ AI-ն, մենք կարող ենք ուսումնասիրել այն մտահոգիչ հարցը, թե արդյոք գեներատիվ AI-ն արդարացիորեն կամ անարդարացիորեն «օգտագործում է», կամ ոմանք կասեին. բացահայտորեն շահագործումից Ինտերնետային բովանդակություն.

Ահա այս խնդրին առնչվող իմ չորս կենսական թեմաները.

1) Կրկնակի խնդիր՝ գրագողություն և հեղինակային իրավունքի խախտում
2) Փորձելու է ապացուցել գրագողությունը կամ հեղինակային իրավունքի խախտումը
3) Գրագողության կամ հեղինակային իրավունքի խախտման համար գործ հարուցելը
4) Սպասվում են օրինական ականներ

Ես կանդրադառնամ այս կարևոր թեմաներից յուրաքանչյուրին և կառաջարկեմ խորաթափանց նկատառումներ, որոնց շուրջ մենք բոլորս պետք է ուշադիր քննարկենք: Այս թեմաներից յուրաքանչյուրն ավելի մեծ գլուխկոտրուկի անբաժանելի մասն է: Դուք չեք կարող միայն մեկ կտոր նայել: Ոչ էլ կարող ես որևէ կտոր նայել մյուս կտորներից մեկուսացված:

Սա բարդ խճանկար է, և ամբողջ գլուխկոտրուկը պետք է պատշաճ ներդաշնակ դիտարկվի:

Կրկնակի խնդիր. գրագողություն և հեղինակային իրավունքի խախտում

Կրկնակի դժվարությունը, որին բախվում են արհեստական ինտելեկտը արտադրող և արդյունահանողներն այն է, որ նրանց արտադրանքը կարող է երկու վատ բան անել.

1) գրագողություն. Գեներատիվ AI-ն կարելի է մեկնաբանել այսպես գրագողությունը բովանդակություն, որը գոյություն ունի ինտերնետում, ըստ ինտերնետի սկանավորման, որը տեղի է ունեցել AI-ի տվյալների վերապատրաստման ժամանակ:
2) Հեղինակային իրավունքի խախտում. Արտադրող AI-ն կարող է պահանջվել որպես ձեռնարկություն հեղինակային իրավունքի խախտում կապված ինտերնետ բովանդակության հետ, որը սկանավորվել է տվյալների ուսուցման ընթացքում:

Պարզաբանելու համար, ինտերնետում շատ ավելի շատ բովանդակություն կա, քան իրականում սովորաբար սկանավորվում է գեներատիվ AI-ի տվյալների ուսուցման համար: Ինտերնետի միայն մի փոքր մասն է սովորաբար օգտագործվում: Այսպիսով, մենք կարող ենք ենթադրաբար ենթադրել, որ ցանկացած բովանդակություն, որը չի սկանավորվել տվյալների ուսուցման ընթացքում, չունի հատուկ տավարի միս՝ գեներատիվ AI-ով:

Սա որոշ չափով վիճելի է, քանի որ դուք կարող եք պոտենցիալ գիծ քաշել, որը կապում է սկանավորված այլ բովանդակությունը չսկանավորված բովանդակության հետ: Բացի այդ, ևս մեկ կարևոր դրույթ այն է, որ նույնիսկ եթե կա բովանդակություն, որը չի սկանավորվել, այն դեռևս կարող է վիճարկվել որպես գրագողություն և/կամ հեղինակային իրավունքի խախտված, եթե գեներացնող AI-ի արդյունքները, ամենայն հավանականությամբ, հայտնվում են նույն բառապաշարի վրա: Իմ կարծիքն այն է, որ այս ամենի մեջ շատ ճկունություն կա:

Ներքեւի գիծ: Generative AI-ն լի է արհեստական ինտելեկտի էթիկական և AI իրավունքի պոտենցիալ հանելուկներով, երբ խոսքը վերաբերում է գրագողության և հեղինակային իրավունքի խախտմանը: տվյալների վերապատրաստման գերակշռող պրակտիկաների հիմքում:

Առայժմ, AI ստեղծողները և AI հետազոտողները սահել են այս տարածքը գրեթե առանց շոտլանդացիների, չնայած նրանց գլխավերևում կախված և անորոշ կախված թուրին: Այս պրակտիկայի դեմ մինչ օրս միայն մի քանի դատական գործ է հարուցվել: Հնարավոր է, որ դուք լսած կամ տեսած լինեք նման իրավական գործողությունների մասին լուրերի հոդվածներ: Մեկը, օրինակ, ներառում է Midjourney-ի և Stability AI-ի տեքստ-պատկեր ֆիրմաները՝ համացանցում տեղադրված գեղարվեստական բովանդակությունը խախտելու համար: Մյուսը ենթադրում է տեքստից կոդ խախտում GitHub-ի, Microsoft-ի և OpenAI-ի դեմ՝ կապված AI հավելվածներ արտադրող Copilot ծրագրաշարի հետ: Getty Images-ը նաև նպատակ է ունեցել հետևել Stability AI-ին՝ տեքստից պատկեր խախտելու համար:

Կարելի է ակնկալել, որ նման հայցեր դեռ կներկայացվեն։

Հենց հիմա, մի քիչ հավանական է սկսել այդ հայցերը, քանի որ արդյունքը համեմատաբար անհայտ է: Արդյո՞ք դատարանը կկանգնի արհեստական ինտելեկտի ստեղծողների կողմը, թե՞ նրանք, ովքեր կարծում են, որ դրանց բովանդակությունը անարդարացիորեն շահագործվել է, կհաղթեն: Ծախսատար իրավական պայքարը միշտ էլ լուրջ խնդիր է: Լայնածավալ իրավական ծախսերի ծախսումը պետք է կշռվի հաղթելու կամ պարտվելու հնարավորությունների հետ:

AI ստեղծողները կարծես թե գրեթե այլընտրանք չունեն, քան պայքար մղել: Եթե նրանք թեկուզ մի փոքր զիջեին, հավանականությունն այն է, որ լրացուցիչ դատավարությունների տարափ կառաջանար (ըստ էության, դուռը բացելով ուրիշների գերակշռման մեծ հավանականության համար): Երբ ջրում օրինական արյուն լինի, մնացած օրինական շնաձկները կսկսեն հասնել համարվող «հեշտ գնահատականին», և, անշուշտ, տեղի կունենա դրամական արյունահեղություն և ծեծկռտուք:

Ոմանք կարծում են, որ մենք պետք է ընդունենք AI-ի նոր օրենքներ, որոնք կպաշտպանեն AI ստեղծողներին: Պաշտպանությունը կարող է նույնիսկ հետադարձ ուժ ունենալ: Դրա հիմքն այն է, որ եթե մենք ցանկանում ենք տեսնել արհեստական ինտելեկտի գեներացնող առաջընթաց, մենք պետք է AI ստեղծողներին տրամադրենք որոշակի անվտանգ գոտի թռիչքուղի: Երբ դատավարությունները սկսեն հաղթանակներ տանել արհեստական ինտելեկտի ստեղծողների դեմ, եթե դա տեղի ունենա (մենք դեռ չգիտենք), անհանգստությունն այն է, որ գեներատիվ AI-ն կգոլորշիանա, քանի որ ոչ ոք չի ցանկանա որևէ աջակցություն ցուցաբերել AI ընկերություններին:

Ինչպես հմուտ կերպով նշվեց Bloomberg-ի օրենքի վերջին հոդվածում, որը վերնագրված է դոկտոր Իլիա Կոլոչենկոյի և Գորդոն Պլաթի «ChatGPT. IP, կիբերանվտանգություն և գեներատիվ AI-ի այլ իրավական ռիսկեր», Bloomberg Law, փետրվար 2023, ահա երկու կարևոր հատված, որոնք արձագանքում են այս տեսակետներին.

«Այժմ բուռն բանավեճ է ծավալվում ԱՄՆ իրավաբանների և ՄՍ իրավունքի պրոֆեսորների միջև այն մասին, թե արդյոք հեղինակային իրավունքով պաշտպանված տվյալների չթույլատրված քերծումը և հետագա օգտագործումը հեղինակային իրավունքի խախտում են: Եթե իրավաբանների տեսակետը, ովքեր տեսնում են հեղինակային իրավունքի խախտումներ նման պրակտիկայում, գերակշռում է, նման AI համակարգերի օգտատերերը կարող են նաև պատասխանատվություն կրել երկրորդական խախտման համար և կարող են բախվել իրավական հետևանքների»:
«Մարտահրավերը համակողմանիորեն լուծելու համար օրենսդիրները պետք է մտածեն ոչ միայն հեղինակային իրավունքի մասին գործող օրենսդրության արդիականացման, այլ նաև արհեստական ինտելեկտի համար հատուկ օրենքների և կանոնակարգերի իրականացման մասին»:

Հիշեցնենք, որ որպես հասարակություն մենք իրականացրել ենք իրավական պաշտպանություն նրանց համար ընդլայնում Համացանցի մասին, ինչպես վկայում է Գերագույն դատարանը, որը վերանայում է հանրահայտ կամ տխրահռչակ 230-րդ բաժինը: Այսպիսով, խելամիտ և նախադեպային է թվում, որ մենք կարող ենք պատրաստ լինել նման պաշտպանություններ անել գեներատիվ AI-ի առաջխաղացման համար: Հնարավոր է, որ պաշտպանությունը կարող է ժամանակավորապես ստեղծվել, ժամկետը լրանալով այն բանից հետո, երբ գեներատիվ AI-ն հասել է հմտությունների նախապես որոշված մակարդակի: Կարելի է մշակել այլ պաշտպանական դրույթներ:

Ես շուտով կհրապարակեմ իմ վերլուծությունը, թե ինչպես Գերագույն դատարանի գնահատականը և 230-րդ բաժնի վերաբերյալ վերջնական որոշումը կարող են ազդել գեներատիվ AI-ի հայտնվելու վրա: Հետևե՛ք առաջիկա հրապարակմանը:

Վերադառնալ խիստ հնչեցված կարծիքին, որ մենք պետք է ազատություն տանք հասարակության ակնածանք ներշնչող տեխնոլոգիական նորարարությանը, որը հայտնի է որպես գեներատիվ AI: Ոմանք կասեն, որ նույնիսկ եթե հեղինակային իրավունքի խախտումը տեղի է ունենում կամ տեղի է ունենում, հասարակությունը որպես ամբողջություն պետք է պատրաստ լինի թույլ տալ դա գեներացնող AI-ի առաջխաղացման հատուկ նպատակների համար:

Հույս կա, որ AI-ի նոր օրենքները խնամքով կմշակվեն և կհամապատասխանեցվեն այն մանրամասներին, որոնք կապված են գեներատիվ AI-ի համար տվյալների ուսուցման հետ:

Այս նպատակով արհեստական ինտելեկտի նոր օրենքներ մշակելու այս հասկացությանը բազմաթիվ հակափաստարկներ կան: Մտահոգություններից մեկն այն է, որ արհեստական ինտելեկտի ցանկացած նման նոր օրենք բաց կթողնի հեղինակային իրավունքի բոլոր ձևերի խախտման համար: Մենք կվախենանք այն օրը, երբ թույլ տվեցինք AI-ի նման նոր օրենքները իջնել գրքերի վրա: Անկախ նրանից, թե որքան դժվար եք դա սահմանափակել միայն արհեստական ինտելեկտի տվյալների ուսուցմամբ, մյուսները գաղտագողի կամ խելամտորեն կգտնեն բացեր, որոնք կհամարեն հեղինակային իրավունքի անկաշկանդ և համատարած խախտում:

Կլոր-շրջում են փաստարկները:

Մի փաստարկ, որն առանձնապես չի կարող լինել, կապված է AI-ի դեմ դատի տալու փորձի հետ: Ուշադրություն դարձրեք, որ ես նկատի ունեի AI ստեղծողին կամ AI հետազոտողներին՝ որպես մեղավոր շահագրգիռ կողմերի: Սրանք մարդիկ և ընկերություններ են: Ոմանք առաջարկում են, որ մենք պետք է թիրախավորենք արհեստական ինտելեկտը՝ որպես դատի տալու կողմ: Ես երկար քննարկել եմ իմ սյունակում, որ մենք դեռևս չենք վերագրում իրավաբանական անձը AI-ին, տես հղումն այստեղ օրինակ, և այդպիսով, AI-ի դեմ ուղղված նման հայցերը հենց հիմա անիմաստ կհամարվեն:

Որպես հավելում այն հարցին, թե ում կամ ինչին պետք է դատի տալ, սա առաջ է բերում մեկ այլ հյութեղ թեմա։

Ենթադրենք, որ որոշակի գեներացնող AI հավելվածը ստեղծվել է AI որոշ արտադրողի կողմից, որը մենք կանվանենք Widget Company: Վիդջեթ ընկերությունը համեմատաբար փոքր է չափսերով և չունի մեծ եկամուտ, ոչ էլ ակտիվների առումով: Նրանց դատի տալը, ամենայն հավանականությամբ, չի բերի այն մեծ հարստությունը, որը կարելի է փնտրել: Առավելագույնը, դուք պարզապես բավարարվածություն կունենայիք ուղղելու այն, ինչ սխալ եք ընկալում։

Դուք ուզում եք գնալ մեծ ձկան հետևից:

Ահա թե ինչպես է դա առաջանալու: AI արտադրողը ընտրում է իր գեներացնող AI-ն հասանելի դարձնել Big Time Company-ին, որը տոննաներով խմորով և տոննա ակտիվներով խոշոր կոնգլոմերատ է: «Վիջեթ» ընկերության անունը տալու համար դատական հայցն այժմ ավելի լավ նպատակ կունենար, մասնավորապես՝ անվանելով «Բիգ Թայմ» ընկերությունը: Սա Դավթի և Գողիաթի մենամարտն է, որը փաստաբաններին հաճույք կպատճառի: Իհարկե, Big Time Company-ն, անկասկած, կփորձի դուրս գալ ձկնորսական կարթից: Արդյոք նրանք կարող են դա անել, ևս մեկ անգամ իրավական հարց է, որը անորոշ է, և նրանք կարող են անհուսորեն խրվել ցեխի մեջ:

Նախքան այս մասին շատ ավելին անցնելը, ես կցանկանայի սեղանին ինչ-որ կարևոր բան ստանալ գեներատիվ AI-ի վիճելի ոտնձգությունների վերաբերյալ տվյալների ուսուցման պատճառով: Համոզված եմ, որ դուք ինտուիտիվ կերպով հասկանում եք, որ գրագողությունը և հեղինակային իրավունքի խախտումը երկու փոքր-ինչ տարբեր գազաններ են: Նրանք շատ ընդհանրություններ ունեն, թեև դրանք նաև զգալիորեն տարբերվում են:

Ահա Դյուկի համալսարանի հակիրճ նկարագրությունը, որը բացատրում է երկուսը.

«Գագագողությունը լավագույնս սահմանվում է որպես այլ անձի աշխատանքի չճանաչված օգտագործում: Դա էթիկական խնդիր է, որը ներառում է աշխատանքի դիմաց վարկի պահանջ, որը հայցվորը չի ստեղծել: Կարելի է գրագողություն անել ուրիշի աշխատանքը՝ անկախ այդ ստեղծագործության հեղինակային իրավունքի կարգավիճակից։ Օրինակ, գրագողություն է, այնուամենայնիվ, պատճենել գրքից կամ հոդվածից, որը չափազանց հին է՝ դեռևս հեղինակային իրավունքի տակ մնալու համար: Գրագողություն է նաև չճանաչված աղբյուրից վերցված տվյալների օգտագործումը, թեև փաստացի նյութերը, ինչպիսիք են տվյալները, կարող են պաշտպանված չլինել հեղինակային իրավունքով: Գրագողությունը, սակայն, հեշտությամբ բուժվում է՝ պատշաճ կերպով հղում կատարելով նյութի սկզբնական աղբյուրին»:
«Հեղինակային իրավունքի խախտումը, մյուս կողմից, ուրիշի ստեղծագործության չարտոնված օգտագործումն է: Սա իրավական խնդիր է, որը կախված է նրանից, թե արդյոք ստեղծագործությունն առաջին հերթին պաշտպանված է հեղինակային իրավունքով, թե ոչ, ինչպես նաև այնպիսի առանձնահատկություններից, ինչպիսիք են օգտագործված քանակությունը և օգտագործման նպատակը: Եթե մեկը չափազանց շատ է կրկնօրինակում պաշտպանված ստեղծագործությունը կամ պատճենում է չարտոնված նպատակով, պարզապես սկզբնաղբյուրի ճանաչումը չի լուծի խնդիրը: Միայն հեղինակային իրավունքի սեփականատիրոջից նախնական թույլտվություն փնտրելով՝ կարելի է խուսափել խախտման համար գանձվելու վտանգից»:

Ես նշում եմ այս երկու մտահոգությունների կարևորությունը, որպեսզի դուք հասկանաք, որ միջոցները կարող են համապատասխանաբար տարբերվել: Բացի այդ, նրանք երկուսն էլ ներքաշված են AI-ի էթիկա և AI օրենք ներթափանցող նկատառումներով, ինչը նրանց հավասարապես արժե քննել:

Եկեք ուսումնասիրենք հայցվող միջոցը կամ լուծումը: Դուք կտեսնեք, որ դա կարող է օգնել կրկնակի խնդիրներից մեկին, բայց ոչ մյուսին:

Ոմանք պնդում են, որ արհեստական ինտելեկտի արտադրողներին մնում է միայն նշել իրենց աղբյուրները: Երբ գեներատիվ AI-ն ստեղծում է շարադրություն, պարզապես ներառեք կոնկրետ մեջբերումներ այն ամենի համար, ինչ նշված է շարադրությունում: Տվեք տարբեր URL-ներ և այլ ցուցումներ, թե որ ինտերնետ բովանդակությունն է օգտագործվել: Թվում է, թե դա նրանց կազատի գրագողության հետ կապված անհանգստություններից: Ենթադրվում է, որ թողարկված շարադրությունը հստակ կբացահայտի, թե ինչ աղբյուրներ են օգտագործվել պատրաստվող ձևակերպման համար:

Այդ պնդվող լուծման մեջ կան որոշ հակասություններ, բայց 30,000 ֆուտ մակարդակի վրա, ենթադրենք, դա ծառայում է որպես գրագողության երկընտրանքի կիսաբավարար բուժում: Ինչպես վերը նշված է հեղինակային իրավունքի խախտման բացատրության մեջ, սկզբնաղբյուր նյութի մեջբերումը պարտադիր չէ, որ ձեզ դուրս բերի շան տնից: Ենթադրելով, որ բովանդակությունը պաշտպանված է հեղինակային իրավունքով, և կախված այլ գործոններից, ինչպիսիք են նյութի քանակն է օգտագործվել, հեղինակային իրավունքի խախտման սպասվող սուրը կարող է կտրուկ և վերջնականապես իջնել:

Կրկնակի անախորժությունն այստեղ հիմնական բառն է:

Փորձելու են ապացուցել գրագողությունը կամ հեղինակային իրավունքի խախտումը

Ապացուցիր!

Դա այն մաշված կրկներգն է, որը մենք բոլորս լսել ենք մեր կյանքի տարբեր ժամանակներում:

Դուք գիտեք, թե ինչպես է դա ընթանում: Դուք կարող եք պնդել, որ ինչ-որ բան տեղի է ունենում կամ տեղի է ունեցել: Դուք կարող եք ձեր սրտում իմանալ, որ դա տեղի է ունեցել: Բայց երբ խոսքը վերաբերում է հրում ընդդեմ հրումին, դուք պետք է ապացույցներ ունենաք:

Այսօրվա լեզվով ասած, դուք պետք է ցույց տաք ստացականներ, ինչպես ասում են.

Իմ հարցը ձեզ սա է. Ինչպե՞ս ենք մենք ցուցադրաբար ապացուցելու, որ գեներատիվ AI-ն անպատշաճ կերպով շահագործել է համացանցի բովանդակությունը:

Ենթադրվում է, որ պատասխանը պետք է հեշտ լինի։ Դուք խնդրում կամ ասում եք գեներացնող արհեստական ինտելեկտին, որ թողարկվի շարադրություն: Այնուհետև վերցնում եք շարադրությունը և համեմատում այն, ինչ կարելի է գտնել ինտերնետում: Եթե գտնես շարադրանքը, բամ, գեներատիվ AI-ն գամված է առածական պատին:

Թվում է, թե կյանքը երբեք այդքան հեշտ չի եղել:

Պատկերացրեք, որ մենք ստանում ենք գեներատիվ AI՝ մոտ 100 բառ պարունակող էսսե պատրաստելու համար: Մենք շրջում ենք և փորձում հասնել համացանցի բոլոր անկյուններն ու անկյունները՝ փնտրելով այդ 100 բառը: Եթե մենք գտնենք 100 բառերը, որոնք ցուցադրված են նույն ճշգրիտ հերթականությամբ և նույն ձևով, մենք կարծես թե ինքներս մեզ բռնեցինք:

Ենթադրենք, թեև մենք ինտերնետում գտնում ենք թվացյալ «համեմատելի» շարադրություն, թեև այն համապատասխանում է 80 բառից միայն 100-ին: Սա, հավանաբար, դեռ բավարար է թվում: Բայց պատկերացրեք, որ մենք գտնում ենք այդ 10 բառից միայն 100 բառի օրինակ: Արդյո՞ք դա բավարա՞ր է բղավելու համար, որ կա՛մ գրագողություն է տեղի ունեցել, կա՛մ հեղինակային իրավունքի խախտում է տեղի ունեցել:

Մոխրագույնը գոյություն ունի.

Այդ կերպ տեքստը ծիծաղելի է:

Համեմատեք սա տեքստից պատկեր կամ տեքստից արվեստ հանգամանքների հետ: Երբ գեներատիվ AI-ն ապահովում է տեքստից պատկեր կամ տեքստի վերածելու հնարավորություն, դուք մուտքագրում եք տեքստային հուշում, և AI հավելվածը ստեղծում է պատկեր, որը որոշ չափով հիմնված է ձեր տրամադրած հուշման վրա: Պատկերը կարող է տարբերվել այս կամ որևէ այլ մոլորակի վրա երբևէ տեսած պատկերներից:

Մյուս կողմից, պատկերը կարող է հիշեցնել այլ պատկերներ, որոնք գոյություն ունեն: Մենք կարող ենք դիտել արհեստական ինտելեկտի գեներատիվ պատկերը և որոշ չափով աղիքային բնազդով ասել, որ այն, անշուշտ, նման է մի այլ պատկերի, որը մենք տեսել ենք նախկինում: Ընդհանրապես, տեսողական համեմատության և հակադրման ասպեկտները մի փոքր ավելի հեշտ են ձեռնարկվում: Այսպես ասված է, խնդրում եմ, իմացեք, որ հսկայական իրավական բանավեճերը ապահովում են այն մասին, թե ինչ է նշանակում մեկ պատկերի համընկնումը կամ կրկնօրինակումը մյուսից:

Մեկ այլ նմանատիպ իրավիճակ կա երաժշտության հետ կապված. Կան գեներացնող AI հավելվածներ, որոնք թույլ են տալիս մուտքագրել տեքստային հուշում, և AI-ի կողմից արտադրվող արդյունքը աուդիո երաժշտություն է: Տեքստից-աուդիո կամ տեքստ-երաժշտություն AI-ի այս հնարավորությունները հենց հիմա են սկսում ի հայտ գալ: Մի բան, որի վրա կարող եք գրազ գալ ձեր ամենաբարձր դոլարի վրա, այն է, որ գեներատիվ AI-ի կողմից արտադրված երաժշտությունը խիստ կուսումնասիրվի խախտման համար: Մենք կարծես գիտենք, երբ լսում ենք երաժշտական խախտումներ, թեև նորից սա բարդ իրավական խնդիր է, որը հիմնված չէ միայն այն բանի վրա, թե ինչպես ենք մենք վերաբերվում ընկալվող կրկնօրինակմանը:

Թույլ տվեք ևս մեկ օրինակ.

Տեքստից կոդ գեներացնող AI-ն ձեզ հնարավորություն է տալիս մուտքագրել տեքստային հուշում, և AI-ն ձեզ համար կստեղծի ծրագրավորման կոդ: Այնուհետև կարող եք օգտագործել այս կոդը համակարգչային ծրագիր պատրաստելու համար: Դուք կարող եք օգտագործել կոդը ճիշտ այնպես, ինչպես ստեղծվել է, կամ կարող եք ընտրել խմբագրել և հարմարեցնել կոդը ձեր կարիքներին համապատասխան: Անհրաժեշտ է նաև համոզվել, որ կոդը հարմար է և գործունակ, քանի որ հնարավոր է, որ գեներացված կոդում կարող են առաջանալ սխալներ և կեղծիքներ:

Ձեր առաջին ենթադրությունը կարող է լինել, որ ծրագրավորման կոդը չի տարբերվում տեքստից: Դա պարզապես տեքստ է։ Իհարկե, դա տեքստ է, որն ապահովում է որոշակի նպատակ, բայց դա դեռ տեքստ է:

Դե, ոչ ճշգրիտ: Ծրագրավորման լեզուների մեծ մասը խիստ ձևաչափ և կառուցվածք ունի այդ լեզվի կոդավորման հայտարարությունների բնույթին: Սա ինչ-որ իմաստով շատ ավելի նեղ է, քան ազատ հոսող բնական լեզուն: Դուք որոշ չափով պատկերված եք, թե ինչպես են ձևակերպվում կոդավորման հայտարարությունները: Նմանապես, հայտարարությունների օգտագործման և դասավորության հաջորդականությունը և ձևը որոշակիորեն ընդգրկված են:

Ընդհանուր առմամբ, ծրագրավորման կոդը գրագողության կամ խախտման մասին ցուցադրելու հնարավորությունը գրեթե ավելի հեշտ է, քան բոլոր ասվածները բնական լեզվով: Այսպիսով, երբ գեներատիվ AI-ն գնում է համացանցում ծրագրավորման կոդ սկանավորելու և հետագայում ծրագրավորման կոդ ստեղծելու համար, վիճելու, որ կոդը բացահայտորեն կրկնօրինակվել է, համեմատաբար ավելի համոզիչ կլինեն: Սլեմ դանկ չէ, ուստի ակնկալեք, որ դառը մարտեր են մղվելու դրա վրա:

Իմ հիմնական կետն այն է, որ մենք ունենալու ենք AI-ի էթիկայի և AI օրենքի նույն խնդիրները, որոնք առերեսվում են գեներացնող AI-ի բոլոր եղանակներին:

Գրագողությունը և հեղինակային իրավունքի խախտումը խնդրահարույց կլինեն՝

Տեքստ-տեքստ կամ տեքստ-շարադրություն
Տեքստ-պատկեր կամ տեքստ-արվեստ
Տեքստ-աուդիո կամ տեքստ-երաժշտություն
Տեքստից տեսանյութ
Տեքստ-կոդ
Etc.

Նրանք բոլորը ենթակա են նույն մտահոգություններին: Ոմանք կարող են մի փոքր ավելի հեշտ լինել «ապացուցելը», քան մյուսները: Նրանք բոլորն էլ ունենալու են AI-ի էթիկայի և AI օրենքի հիմնավորման մղձավանջների իրենց բազմազանությունը:

Գրագողության կամ հեղինակային իրավունքի խախտման գործի հարուցում

Քննարկման նպատակների համար եկեք կենտրոնանանք տեքստից տեքստ կամ տեքստից շարադրություն գեներատիվ AI-ի վրա: Ես դա անում եմ մասամբ ChatGPT-ի հսկայական ժողովրդականության պատճառով, որը տեքստից տեքստ գեներացնող AI-ի տեսակն է: Կան շատ մարդիկ, ովքեր օգտագործում են ChatGPT-ն, ինչպես նաև շատ ուրիշներ, որոնք օգտագործում են տարբեր նմանատիպ տեքստային տեքստ գեներացնող AI հավելվածներ:

Արդյո՞ք այն մարդիկ, ովքեր օգտագործում են արհեստական ինտելեկտի գեներացնող հավելվածներ, գիտե՞ն, որ նրանք պոտենցիալ հենվում են գրագողության կամ հեղինակային իրավունքի խախտման վրա:

Թվում է, թե կասկածելի է, որ նրանք անում են:

Ես կհամարձակվեմ ասել, որ գերակշռող ենթադրությունն այն է, որ եթե գեներացնող AI հավելվածը հասանելի է օգտագործման համար, ապա AI ստեղծողը կամ ընկերությունը, որը ներկայացրել է AI-ն, պետք է իմանա կամ վստահ լինի, որ ոչ մի տհաճ բան չկա այն ապրանքների հետ, որոնք իրենք առաջարկում են օգտագործման համար: Եթե դուք կարող եք օգտագործել այն, այն պետք է լինի վերևում:

Եկեք վերանայենք իմ նախկին մեկնաբանությունը այն մասին, թե ինչպես ենք մենք պատրաստվում ապացուցել, որ որոշակի գեներացնող AI-ն աշխատում է սխալ հիմունքներով տվյալների ուսուցման հարցում:

Ես կարող եմ նաև ավելացնել, որ եթե մենք կարողանանք բռնել մեկ գեներատիվ AI-ն, որն անում է դա, ապա մյուսներին բռնելու հնարավորությունները, ամենայն հավանականությամբ, կբարձրանան: Ես չեմ ասում, որ արհեստական ինտելեկտի բոլոր գեներացնող հավելվածները կլինեն նույն նավի մեջ: Բայց նրանք պատրաստվում են հայտնվել բավականին դաժան ծովերում, երբ նրանցից մեկը կպցվի պատին:

Ահա թե ինչու նույնպես անչափ արժանի կլինի հետևել առկա դատավարություններին: Առաջինը, ով հաղթում է հայցվող խախտման հարցում, եթե դա տեղի ունենա, հնարավոր է, որ կործանում և մռայլություն կբերի արհեստական ինտելեկտի այլ գեներացնող հավելվածների համար, եթե որոշ նեղություն չփախչի ավելի լայն խնդիրներից: Նրանք, ովքեր կորցնում են հայցվող խախտումը, անպայման չի նշանակում, որ գեներացնող AI հավելվածները կարող են զանգեր հնչեցնել և տոնել: Կարող է լինել, որ կորուստը վերագրվում է այլ գործոնների, որոնք այնքան էլ չեն համապատասխանում այլ գեներացնող AI հավելվածներին և այլն:

Ես նշել էի, որ եթե մենք վերցնենք 100 բառանոց շարադրություն և փորձենք գտնել այդ բառերը ճիշտ նույն հաջորդականությամբ ինտերնետում, ապա մենք կարող ենք համեմատաբար հիմնավոր դեպք ունենալ գրագողության կամ հեղինակային իրավունքի խախտման համար, մնացած բոլորը հավասար են: Բայց եթե համընկնող բառերի թիվը քիչ է, մենք կարծես բարակ սառույցի վրա ենք:

Ես կցանկանայի ավելի խորանալ դրա մեջ:

Համեմատություն կատարելու ակնհայտ ասպեկտը բաղկացած է ճիշտ նույն բառերից՝ ճիշտ նույն հաջորդականությամբ: Սա կարող է տեղի ունենալ ամբողջ հատվածների համար: Սա հարմար կլինի նկատել, գրեթե այնպես, ինչպես մեզ հանձնել են արծաթե սկուտեղի վրա:

Մենք կարող ենք նաև կասկածել, եթե միայն բառերի մի հատված համընկնի: Գաղափարը կլինի տեսնել, թե արդյոք դրանք կարևոր բառեր են կամ գուցե լրացնող բառեր, որոնք մենք կարող ենք հեշտությամբ հեռացնել կամ անտեսել: Մենք նաև չենք ցանկանում, որ մեզ խաբեն բառերի օգտագործումն իրենց անցյալի կամ ապագա ժամանակով, կամ մեկ այլ թմբիրով: Պետք է հաշվի առնել նաև բառերի այդ տատանումները:

Համեմատության մեկ այլ մակարդակ կլինի այն դեպքում, երբ բառերը մեծ չափով առանձնապես նույն բառերը չեն, բայց նույնիսկ տարբեր վիճակում գտնվող բառերը դեռևս նույն մտքերն են արտահայտում: Օրինակ, ամփոփագրում հաճախ օգտագործվում են միանգամայն նման բառեր որպես սկզբնաղբյուր, բայց մենք կարող ենք նկատել, որ ամփոփագիրը, կարծես, հիմնված է սկզբնական աղբյուրի վրա:

Համեմատության ամենադժվար մակարդակը հիմնված կլինի հասկացությունների կամ գաղափարների վրա: Ենթադրենք, մենք տեսնում ենք մի շարադրություն, որը չունի նույն կամ նման բառերը որպես համեմատության հիմք, բայց էությունը կամ գաղափարները նույնն են։ Մենք, անշուշտ, անցնում ենք կոպիտ տարածքի մեջ: Եթե մենք պատրաստակամորեն ասենք, որ գաղափարները սերտորեն պաշտպանված են, մենք կափարիչ կդնեինք գիտելիքի և գիտելիքի ընդլայնման գրեթե բոլոր ձևերի վրա:

Մենք կարող ենք ևս մեկ անգամ անդրադառնալ Դյուկի համալսարանի հարմար բացատրությանը.

«Հեղինակային իրավունքը չի պաշտպանում գաղափարները, միայն գաղափարի կոնկրետ արտահայտությունը: Օրինակ, դատարանը որոշեց, որ Դեն Բրաունը չի խախտել ավելի վաղ գրքի հեղինակային իրավունքը, երբ գրել է The Da Vinci Code քանի որ այն ամենը, ինչ նա փոխառել էր նախորդ աշխատանքից, հիմնական գաղափարներն էին, ոչ թե սյուժեի կամ երկխոսության առանձնահատկությունները: Քանի որ հեղինակային իրավունքը կոչված է խրախուսելու ստեղծագործական արտադրությունը, ուրիշի գաղափարների օգտագործումը նոր և օրիգինալ ստեղծագործություն ստեղծելու համար պաշտպանում է հեղինակային իրավունքի նպատակը, այն չի խախտում այն: Միայն այն դեպքում, եթե մեկը պատճենում է մյուսի արտահայտությունն առանց թույլտվության, հնարավոր է հեղինակային իրավունքի խախտում»:
«Մյուս կողմից, գրագողությունից խուսափելու համար պետք է ճանաչել նույնիսկ այն գաղափարների աղբյուրը, որոնք փոխառված են մեկ ուրիշից՝ անկախ նրանից, թե այդ գաղափարների արտահայտությունը փոխառված է նրանց հետ։ Այսպիսով, պարաֆրազը պահանջում է մեջբերում, թեև այն հազվադեպ է բարձրացնում հեղինակային իրավունքի որևէ խնդիր»։

Խնդրում ենք նկատի ունենալ, քանի որ ավելի վաղ պարզվել է կրկնակի խնդիրների կողմերի միջև եղած տարբերությունները:

Այժմ համեմատական մոտեցումները գործնականում կիրառելը մի բան է, որը տեղի է ունենում երկար տարիներ: Մտածեք դրա մասին այսպես. Ուսանողները, ովքեր շարադրություններ են գրում իրենց դպրոցական աշխատանքի համար, կարող են գայթակղվել համացանցից բովանդակություն վերցնելու և ձևացնել, թե իրենք են հեղինակել Պուլիցերյան մրցանակի A դասարանի խոսքերը:

Ուսուցիչները երկար ժամանակ օգտագործում էին գրագողությունը ստուգող ծրագրեր՝ դրանով զբաղվելու համար։ Ուսուցիչը վերցնում է աշակերտի շարադրությունը և այն դնում գրագողության ստուգիչի մեջ: Որոշ դեպքերում մի ամբողջ դպրոց լիցենզիա է տրամադրում գրագողության ստուգման ծրագրի օգտագործումը: Երբ ուսանողները ներկայացնում են շարադրություն, նրանք պետք է նախ ուղարկեն շարադրությունը գրագողության ստուգման ծրագրին: Ուսուցիչը տեղեկացված է, թե ինչ է հաղորդում ծրագիրը:

Ցավոք, դուք պետք է չափազանց զգույշ լինեք, թե ինչ են ասում գրագողությունը ստուգող այս ծրագրերը: Կարևոր է ուշադիր գնահատել, թե արդյոք ներկայացված ցուցումները վավեր են: Ինչպես արդեն նշվեց, աշխատանքը կրկնօրինակված լինելու մասին պարզելու կարողությունը կարող է մշուշոտ լինել: Եթե դուք անմիտ կերպով ընդունում եք ստուգման ծրագրի արդյունքը, կարող եք սուտ կերպով մեղադրել ուսանողին պատճենելու մեջ, երբ նա դա չի արել: Սա կարող է հոգին ջախջախել:

Շարժվելով առաջ՝ մենք կարող ենք փորձել օգտագործել գրագողությունը ստուգող ծրագրեր գեներատիվ AI արդյունքների փորձարկման ոլորտում: Վերաբերվեք գեներացնող AI հավելվածից ստացված շարադրություններին այնպես, կարծես այն գրված է ուսանողի կողմից: Այնուհետև մենք չափում ենք, թե ինչ է ասում գրագողության ստուգիչը: Դա արվում է աղի հատիկով։

Գոյություն ունի վերջին հետազոտական ուսումնասիրություն, որը փորձել է գործառնականացնել այս տեսակի համեմատությունները գեներատիվ AI-ի համատեքստում հենց այս ձևով: Ես կցանկանայի ձեզ հետ ծանոթանալ մի քանի հետաքրքիր բացահայտումների:

Նախ, որոշ լրացուցիչ նախապատմություն է պահանջվում: Generative AI-ն երբեմն կոչվում է LLM (մեծ լեզվական մոդելներ) կամ պարզապես LMs (լեզու մոդելներ): Երկրորդ, ChatGPT-ն հիմնված է մեկ այլ OpenAI գեներատիվ AI փաթեթի վրա, որը կոչվում է GPT-3.5: Մինչ GPT-3.5 կար GPT-3, իսկ դրանից առաջ GPT-2: Մեր օրերում GPT-2-ը համարվում է բավականին պարզունակ՝ համեմատած ավելի ուշ սերիայի հետ, և մենք բոլորս անհամբեր սպասում ենք GPT-4-ի առաջիկա բացահայտմանը, տես իմ քննարկումը. հղումն այստեղ.

Հետազոտական ուսումնասիրությունը, որը ես ուզում եմ համառոտ ուսումնասիրել, բաղկացած էր GPT-2-ի ուսումնասիրությունից: Դա կարևոր է գիտակցել, քանի որ մենք այժմ ավելի հեռու ենք GPT-2-ի հնարավորություններից: GPT-2-ի այս վերլուծության արդյունքների վերաբերյալ որևէ հապճեպ եզրակացություն մի արեք: Այնուամենայնիվ, մենք կարող ենք շատ բան սովորել GPT-2-ի գնահատումից: Ուսումնասիրությունը կրում է «Արդյո՞ք լեզվական մոդելները գրագողություն են անում» խորագիրը։ Jooyoung Lee-ի, Thai Lee-ի, Jinghui Chen-ի և Dongwon Lee-ի կողմից՝ հայտնված ACM WWW '23, մայիսի 1–5, 2023, Օսթին, Տեխաս, ԱՄՆ:

Սա նրանց հիմնական հետազոտական հարցն է.

«Որքանո՞վ (չսահմանափակվելով անգիր անելով) LM-ներն օգտագործում են արտահայտությունները կամ նախադասությունները իրենց ուսումնական նմուշներից»:

Նրանք օգտագործել են պոտենցիալ գրագողության այս երեք մակարդակները կամ կատեգորիաները.

«Բառացի գրագողություն. բառերի կամ արտահայտությունների ճշգրիտ պատճեններ՝ առանց փոխակերպման»:
«Պարաֆրազ գրագողություն. հոմանիշների փոխարինում, բառերի վերադասավորում և/կամ հետադարձ թարգմանություն»:
«Գաղափարների գրագողություն. հիմնական բովանդակության ներկայացումը երկարացված ձևով»:

GPT-2-ն իսկապես վերապատրաստվել է ինտերնետ տվյալների վրա և, հետևաբար, հարմար թեկնածու է այս տեսակի վերլուծության համար.

«GPT-2-ը նախապես վերապատրաստված է WebText-ում, որը պարունակում է ավելի քան 8 միլիոն փաստաթուղթ՝ վերցված 45 միլիոն Reddit հղումներից: Քանի որ OpenAI-ը հրապարակայնորեն չի թողարկել WebText, մենք օգտագործում ենք OpenWebText, որը WebText կորպուսի բաց կոդով վերականգնում է: Այն հուսալիորեն օգտագործվել է նախկին գրականության կողմից»։

Ընտրովի հիմնական բացահայտումները, ինչպես քաղված են ուսումնասիրությունից, բաղկացած են.

«Մենք հայտնաբերեցինք, որ նախապես վերապատրաստված GPT-2 ընտանիքները գրագողություն են անում OpenWebText-ից»:
«Մեր բացահայտումները ցույց են տալիս, որ ճշգրտումը զգալիորեն նվազեցնում է OpenWebText-ից բառացի գրագողության դեպքերը»:
«Համապատասխան Carlini et al. և Carlini et al., մենք գտնում ենք, որ ավելի մեծ GPT-2 մոդելները (մեծ և xl) սովորաբար ավելի հաճախ են ստեղծում գրագողության հաջորդականություններ, քան փոքրերը»:
«Սակայն, տարբեր LM-ներ կարող են ցույց տալ գրագողության տարբեր օրինաչափություններ, և, հետևաբար, մեր արդյունքները չեն կարող ուղղակիորեն ընդհանրացվել այլ LM-ների, ներառյալ ավելի վերջերս LM-ների, ինչպիսիք են GPT-3-ը կամ BLOOM-ը»:
«Բացի այդ, գրագողության ավտոմատ դետեկտորները, ինչպես հայտնի է, ունեն բազմաթիվ ձախողման ռեժիմներ (ինչպես կեղծ բացասական, այնպես էլ կեղծ դրական):
«Հաշվի առնելով, որ LM-ների վերապատրաստման տվյալների մեծ մասը ջնջվում է համացանցից՝ առանց բովանդակության սեփականատերերին տեղեկացնելու, նրանց բառերի, արտահայտությունների և նույնիսկ հիմնական գաղափարների կրկնությունը վերապատրաստման հավաքածուներից գեներացված տեքստերում ունի էթիկական հետևանքներ»:

Մեզ, անկասկած, այս տեսակի շատ ավելի շատ ուսումնասիրություններ են պետք:

Եթե դուք հետաքրքրված եք, թե ինչպես է GPT-2-ը համեմատվում GPT-3-ի հետ տվյալների ուսուցման հետ կապված, ապա բավականին նկատելի հակադրություն կա:

Ըստ հաղորդված ցուցումների, GPT-3-ի տվյալների ուսուցումը շատ ավելի ընդարձակ էր.

«Մոդելը վերապատրաստվել է ինտերնետից տեքստային տվյալների բազաների միջոցով: Սա ներառում էր հսկայական 570 ԳԲ տվյալներ, որոնք ստացվել են գրքերից, վեբ տեքստերից, Վիքիպեդիայից, հոդվածներից և ինտերնետում առկա այլ գրություններից: Ավելի ճշգրիտ լինելու համար, 300 միլիարդ բառ սնվել է համակարգ» (BBC գիտության կենտրոն ամսագիր, «ChatGPT. Այն ամենը, ինչ դուք պետք է իմանաք OpenAI-ի GPT-3 գործիքի մասին» Ալեքս Հյուզի կողմից, փետրվար 2023):

Ձեզանից նրանց համար, ովքեր հետաքրքրված են GPT-3-ի համար տվյալների ուսուցման ավելի խորը նկարագրություններով, ահա մի հատված GitHub-ում տեղադրված պաշտոնական GPT-3 մոդելային քարտից (վերջին թարմացման ամսաթիվը նշված է որպես սեպտեմբեր 2020):

«GPT-3 ուսուցման տվյալների բազան կազմված է ինտերնետում տեղադրված տեքստից կամ համացանցում վերբեռնված տեքստից (օրինակ՝ գրքերից): Ինտերնետային տվյալները, որոնց վրա այն վերապատրաստվել և գնահատվել է մինչ օրս, ներառում է. ) ինտերնետի վրա հիմնված երկու գրքերի կորպորա և (1) անգլերեն լեզվով Վիքիպեդիա»։
«Հաշվի առնելով իր ուսուցման տվյալները՝ GPT-3-ի արդյունքներն ու կատարումը ավելի շատ են ներկայացնում ինտերնետին միացած բնակչությանը, քան բանավոր, ոչ թվային մշակույթով տոգորվածները: Համացանցին միացած բնակչությունն ավելի շատ զարգացած երկրների ներկայացուցիչ է, հարուստ, երիտասարդ և արական սեռի հայացքներով, և հիմնականում կենտրոնացած է ԱՄՆ-ի վրա: Զարգացած երկրների ավելի հարուստ ազգերն ու բնակչությունը ցույց են տալիս ինտերնետի ավելի մեծ ներթափանցում: Թվային գենդերային բաժանումը ցույց է տալիս նաև, որ աշխարհում ավելի քիչ կանայք են ներկայացված առցանց: Բացի այդ, քանի որ աշխարհի տարբեր մասերում ինտերնետի ներթափանցման և հասանելիության տարբեր մակարդակներ կան, տվյալների բազան չի ներկայացնում ավելի քիչ կապված համայնքները»:

GPT-3-ի մասին վերը նշված ցուցումներից մեկն այն է, որ գեներացնող AI-ն ստեղծողներից մեկն այն է, որ որքան շատ ինտերնետ տվյալներ կարողանաք սկանավորել, գեներատիվ AI-ի բարելավման կամ առաջխաղացման հավանականությունը մեծանում է:

Դուք կարող եք դրան նայել երկու ձևով:

1) Բարելավված AI. Մենք ունենալու ենք գեներատիվ արհեստական ինտելեկտ, որը հնարավորին չափ սողում է համացանցում: Հետաքրքիր արդյունքն այն է, որ գեներացնող AI-ն ավելի լավը կլինի, քան կա: Դա մի բան է, որին պետք է անհամբեր սպասել:
2) Պատճենում է ներուժի առատությունը. Ինտերնետի սկանավորման այս ընդլայնումը տհաճ և գրավիչ կերպով դարձնում է գրագողության և հեղինակային իրավունքի խախտման խնդիրը պոտենցիալ ավելի ու ավելի մեծ: Մինչդեռ նախկինում այդքան շատ բովանդակություն ստեղծողներ չեն ազդվել, չափը գնալով կծաղկի: Եթե դուք իրավաբան եք բովանդակություն ստեղծողների կողմից, դա արցունքներ է բերում ձեր աչքերին (գուցե հիասթափության արցունքներ կամ ուրախության արցունքներ, թե ինչ հեռանկարներ է սա բերում դատական գործընթացների առումով):

Բաժակը կիսալե՞ր է, թե՞ կիսադատարկ։

Դուք որոշում եք:

Օրինական ականները սպասում են

Հարցը, որը դուք կարող եք մտածել, այն է, թե արդյոք ձեր տեղադրված ինտերնետային բովանդակությունը համարվում է արդար խաղ սկանավորման համար: Եթե ձեր բովանդակությունը գտնվում է վճարային պատի հետևում, ենթադրաբար այն սկանավորման թիրախ չէ, քանի որ դրան հեշտությամբ հասանելի չէ՝ կախված վճարային պատի հզորությունից:

Ես կռահեցի, որ առօրյա մարդկանց մեծամասնության բովանդակությունը փակված չէ վճարման պատի հետևում: Նրանք ցանկանում են, որ իրենց բովանդակությունը հանրությանը հասանելի լինի: Նրանք ենթադրում են, որ մարդիկ կնայեն դրան։

Արդյո՞ք ձեր բովանդակությունը հանրությանը հասանելի լինելը նաև աքսիոմատիկորեն նշանակում է, որ դուք հաստատում եք, որ այն սկանավորվի գեներատիվ AI-ի կողմից, որը մշակվում է տվյալների մշակման համար:

Գուցե այո, գուցե ոչ.

Դա այն իրավական հարցերից մեկն է, որոնք պտտվում են:

Վերադառնալով նախկինում բերվածին Բլումբերգի մասին օրենքը հոդվածում հեղինակները նշում են Պայմանների և Պայմանների (T&C) կարևորությունը, որոնք կապված են բազմաթիվ կայքերի հետ.

«Իրավական ականը, որը մեծապես անտեսվել է ակամա արհեստական ինտելեկտի ընկերությունների կողմից, որոնք օգտագործում են առցանց բոտեր տվյալների հավաքագրման համար, թաքնված է բոլոր տեսակի հանրային կայքերում սովորաբար հասանելի Պայմաններում և Պայմաններում: Ի տարբերություն ներկայումս չկարգավորված ՄՍ օրենքի և հեղինակային իրավունքի խախտման երկընտրանքի, կայքի Պայմաններն ու Պայմանները ապահովված են լավ հաստատված պայմանագրային օրենքով և սովորաբար կարող են կիրառվել դատարանում՝ հենվելով բավարար նախադեպերի վրա»:

Նրանք ցույց են տալիս, որ ենթադրելով, որ ձեր կայքը ունի արտոնագրման հետ կապված էջ, հավանական է, որ եթե օգտագործեք ստանդարտացված ժամանակակից ձևանմուշ, այն կարող է պարունակել կարևոր կետ.

«Հետևաբար, վեբկայքերի համար նախատեսված վեբկայքերի պայմաններն ու պայմանները, որոնք առատորեն հասանելի են անվճար հասանելիությամբ, պարունակում են կետ, որն արգելում է տվյալների ավտոմատացված քերծումը: Ճակատագրի հեգնանքով, նման ազատ հասանելի ձևանմուշները, հավանաբար, օգտագործվել են ChatGPT ուսուցման համար: Հետևաբար, բովանդակության սեփականատերերը կարող են ցանկանալ վերանայել իրենց Պայմաններն ու Պայմանները և զետեղել առանձին դրույթ, որը կտրականապես արգելում է ցանկացած բովանդակության օգտագործումը վեբկայքերից AI ուսուցման կամ հարակից նպատակների համար, անկախ այն բանից՝ հավաքված ձեռքով կամ ավտոմատ կերպով, առանց կայքի սեփականատիրոջ նախնական գրավոր թույլտվության: »:

Լրացուցիչ հարվածը ներառված է բովանդակություն ստեղծողների կողմից իրենց կայքերի վերաբերյալ հնարավոր գործողությունների վերլուծության մեջ.

«Հետևաբար, չգրանցման դրույթի յուրաքանչյուր խախտման համար հարկադիր լուծարված վնասների փոխհատուցման դրույթի ներդրումը, որը ընդլայնված է արգելանքով առանց պարտատոմսի դրույթով, կարող է կայուն լուծում լինել ստեղծագործական բովանդակության այն հեղինակների համար, ովքեր չեն ցանկանում ապահովել իրենց պտուղները: ինտելեկտուալ աշխատանք արհեստական ինտելեկտի ուսուցման նպատակներով՝ առանց դրա համար վարձատրվելու կամ, գոնե, իրենց աշխատանքի համար պատշաճ գնահատական տալու»:

Դուք կարող եք խորհրդակցել ձեր փաստաբանի հետ այս մասին:

Ոմանք ասում են, որ սա կենսական միջոց է փորձելու և AI ստեղծողներին ասելու, որ բովանդակություն ստեղծողները մեծապես լրջորեն են վերաբերվում իրենց բովանդակությունը պաշտպանելուն: Համոզվելով, որ ձեր լիցենզավորումն ունի պատշաճ ձևակերպում, թվում է, որ AI ստեղծողներին ուշադրություն կդարձնի:

Մյուսները, թեև մի փոքր վատն են: Նրանք վհատված ասում են, որ դուք կարող եք շարունակել ձեր վեբկայքում տեղադրել ամենակոշտ և մահաբեր իրավական լեզուն, բայց ի վերջո, AI ստեղծողները պատրաստվում են սկանավորել այն: Դուք չեք իմանա, որ նրանք այդպես են վարվել: Դուք կունենաք ժամանակի սատանան, որը ապացուցում է, որ նրանք արել են: Դուք դժվար թե հայտնաբերեք, որ դրանց արդյունքները արտացոլում են ձեր բովանդակությունը: Դժվար պայքար է, որը դուք չեք հաղթելու:

Հակափաստարկն այն է, որ դուք հանձնում եք ճակատամարտը դեռ չսկսված։ Եթե դուք գոնե բավարար իրավական լեզու չունեք, և եթե երբևէ բռնեք նրանց, նրանք կշարժվեն և կթողնեն իրենց ճանապարհը՝ խուսափելու ցանկացած պատասխանատվությունից: Բոլորը, քանի որ դուք չեք տեղադրել ճիշտ տեսակի իրավաբանական լեզու:

Միևնույն ժամանակ, մեկ այլ մոտեցում, որը ձգտում է ձգողականություն ձեռք բերել, բաղկացած կլինի նշագծման ձեր կայքը մի բանով, որը ասում է, որ կայքը չպետք է սկանավորվի գեներատիվ AI-ի միջոցով: Գաղափարն այն է, որ կստեղծվի ստանդարտացված մարկեր: Կայքերը, ենթադրաբար, կարող են նշիչը ավելացնել իրենց կայքում: AI ստեղծողներին պետք է ասվի, որ նրանք պետք է փոխեն իրենց տվյալների սկանավորումը՝ բաց թողնելով նշված կայքերը:

Կարո՞ղ է մարկերային մոտեցումը հաջողակ լինել: Մտահոգությունները ներառում են մարկերների ձեռքբերման և տեղադրման ծախսերը: Բացի այդ, AI ստեղծողները կհետևեն նշիչներին և կապահովեն, որ նրանք խուսափեն նշված կայքերի սկանավորումից: Մեկ այլ հեռանկար այն է, որ նույնիսկ եթե արհեստական ինտելեկտ ստեղծողները չեն համընկնում գծանշումների հետ, սա ևս մեկ հուշում է դատարան դիմելու և պնդելու, որ բովանդակության ստեղծողը վերջին մղոնն է անցել՝ փորձելով և զգուշացնել AI սկանավորման մասին:

Այո, այդ ամենը ստիպում է ձեր գլուխը պտտվել:

Եզրափակում

Վերջնական մի քանի դիտողություն այս փշոտ թեմայի վերաբերյալ.

Պատրա՞ստ եք այս ամբողջ արհեստական ինտելեկտի վերաբերյալ խելամիտ հայացքի համար որպես գրագող և հեղինակային իրավունքը խախտող երկընտրանք:

Գրագողության կամ հեղինակային իրավունքի խախտման ակտով գեներատիվ ինտելեկտը «բռնելու» մասին ենթադրությունների մեծ մասը կախված է արդյունքների հայտնաբերումից. շատ նման է նախորդ աշխատանքներ, ինչպիսիք են բովանդակությունը ինտերնետում, որը հնարավոր է սկանավորվել տվյալների ուսուցման ընթացքում:

Ենթադրենք, թեև այստեղ գործում է բաժանիր և տիրիր հնարքը:

Ահա թե ինչ նկատի ունեմ:

Եթե գեներատիվ AI-ն փոխառում է մի փոքր մասն այստեղից և մի փոքր քիչ այնտեղից, ի վերջո դրանք խառնելով ինչ-որ կոնկրետ արդյունք ստանալու համար, ապա շանսերը, որ կարողանանք ունենալ խելահեղ պահ, ահավոր կնվազեն: Ցանկացած արդյունք, կարծես, չի բարձրանա այն բավարար շեմին, որը դուք կարող եք վստահորեն ասել, որ այն վերցված է մեկ կոնկրետ աղբյուրից: Ստացված շարադրությունը կամ ելքի այլ եղանակները միայն կոտորակային են համընկնում: Եվ սովորական մոտեցմամբ՝ փորձելով վիճարկել, որ տեղի է ունեցել գրագողություն կամ հեղինակային իրավունքի խախտում, դուք սովորաբար պետք է ցուցադրեք ավելին, քան ինչ-որ փոքր կտոր է խաղում, հատկապես, եթե պատառը առանձնահատուկ չէ և կարելի է լայնորեն գտնել ինտերնետում (թերկապված յուրացումն ապացուցելու որևէ համարժեք բեռ):

Կարո՞ղ եք դեռևս համոզիչ կերպով հայտարարել, որ գեներացնող արհեստական ինտելեկտի կողմից տվյալների ուսուցումը կոտրել է կայքերը և բովանդակություն ստեղծողները, նույնիսկ եթե առաջարկվող ապացույցն առերեւույթ ոչ էական համամասնություն է:

Մտածեք այդ մասին:

Եթե մենք բախվում ենք մասշտաբով պոտենցիալ գրագողության և մասշտաբով հեղինակային իրավունքի խախտման, մենք գուցե կարիք ունենանք փոխել մեր մոտեցումը՝ սահմանելու, թե ինչ է նշանակում գրագողություն և/կամ հեղինակային իրավունքի խախտում: Թերևս կա գրագողության կամ հեղինակային իրավունքի խախտման դեպք հիմնականում կամ ընդհանրապես: Խճանկարը, որը բաղկացած է հազարավոր կամ միլիոնավոր մանր հատվածներից, կարող է մեկնաբանվել որպես այդպիսի խախտումներ: Այնուամենայնիվ, ակնհայտ խնդիրն այն է, որ դա կարող է ստիպել բոլոր տեսակի բովանդակությունը հանկարծակի հայտնվել խախտումների հովանու տակ: Սա կարող է լինել սայթաքուն լանջ:

Ծանր մտքեր.

Խոսելով ծանր մտքերի մասին՝ լեգենդար գրող Լև Տոլստոյը հայտնի է. «Կյանքի միակ իմաստը մարդկությանը ծառայելն է»։

Եթե ձեր կայքը և ուրիշների կայքերը սկանավորվում են արհեստական ինտելեկտի բարելավման համար, և թեև դուք դրա համար ոչ մի լումա չեք ստանում, կարո՞ղ եք հանդիսավոր մխիթարություն ունենալ այն հավատքով, որ դուք նպաստում եք մարդկության ապագային: Թվում է, թե դա վճարելու փոքր գին է:

Դե, եթե պարզվի, որ AI-ն սարսափելի էկզիստենցիալ ռիսկն է, որը ջնջում է բոլոր մարդկանց գոյությունից: Դուք չպետք է դրա համար արժանին մատուցեք: Ես ենթադրում եմ, որ դուք անմիջապես չեք նպաստի այդ սարսափելի արդյունքին: Մի կողմ դնելով այդ աղետալի կանխատեսումը, դուք կարող եք մտածել, որ եթե AI ստեղծողները գումար են վաստակում իրենց գեներացնող AI-ից, և թվում է, թե նրանք հաճույք են ստանում շահույթից, դուք նույնպես պետք է ստանաք կարկանդակի մի կտոր: Կիսվեք և կիսվեք նույն ձևով: AI ստեղծողները պետք է թույլտվություն խնդրեն սկանավորելու ցանկացած վեբ կայք, այնուհետև բանակցել այն գնի մասին, որը պետք է վճարվի սկանավորումն իրականացնելու թույլտվություն ստանալու համար:

Վարկ տվեք այնտեղ, որտեղ վարկը հասանելի է:

Եկեք առայժմ վերջին խոսքը տանք սըր Ուոլթեր Սքոթին. «Օ՜, ինչ խճճված ցանց ենք հյուսում: Երբ առաջին անգամ մենք սովորում ենք խաբել»:

Սա միգուցե կիրառելի է, եթե կարծում եք, որ խաբեությունը տեղի է ունենում, կամ գուցե չի կիրառվում, եթե կարծում եք, որ ամեն ինչ լավ է և միանգամայն պարզ և օրինական: Խնդրում եմ, մեծահոգաբար գնահատեք ինքներդ ձեզ այս մասին մտածելու համար: Դու արժանի ես դրան.

Աղբյուր՝ https://www.forbes.com/sites/lanceeliot/2023/02/26/legal-doomsday-for-generative-ai-chatgpt-if-caaught-plagiarizing-or-infringing-warns-ai-ethics- և-աի-օրենք/