Իրավական դատաստանը գեներատիվ AI ChatGPT-ի համար, եթե բռնեն գրագողության կամ խախտման մեջ, զգուշացնում է AI էթիկան և AI օրենքը

Վարկ տվեք այնտեղ, որտեղ վարկը հասանելի է:

Սա մի քիչ իմաստուն իմաստություն է, որին դուք, հավանաբար, դաստիարակվել եք, որպեսզի հաստատապես հավատաք: Իրոք, կարելի է ենթադրել կամ պատկերացնել, որ մենք բոլորս կարող ենք որոշ չափով ողջամտորեն համաձայնել, որ սա կյանքի արդար և խելամիտ կանոն է: Երբ ինչ-որ մեկն անում է մի բան, որն արժանի է ճանաչման, համոզվեք, որ նա ստանում է իր արժանի ճանաչումը:

Հակառակ տեսակետը շատ ավելի քիչ համոզիչ կթվա:

Եթե ​​ինչ-որ մեկը շրջում էր, պնդելով, որ վարկը պետք է Նշում Դուք կարող եք պնդել, որ նման համոզմունքը անբարեխիղճ է և, հնարավոր է, թաքնված: Մենք հաճախ շատ ենք անհանգստանում, երբ վարկը խաբում են մեկին, ով ինչ-որ նշանավոր բան է արել: Ես համարձակվում եմ ասել, որ մենք հատկապես դժգոհ ենք, երբ ուրիշները կեղծ կերպով վարկ են վերցնում ուրիշների աշխատանքի համար: Դա անհանգստացնող կրկնակի հարված է: Մարդը, ով պետք է ստանար վարկը, մերժվում է իր պահը արևի տակ: Բացի այդ, խաբեբայը վայելում է ուշադրության կենտրոնը, թեև նրանք սխալ կերպով խաբում են մեզ՝ յուրացնելու մեր բարենպաստ զգացմունքները:

Ինչո՞ւ է այս բոլոր խոսակցությունները ամենաճիշտ ձևերով վարկեր հավաքելու և սխալ ու արհամարհական ուղիներից խուսափելու մասին:

Քանի որ մենք, կարծես, բախվում ենք նմանատիպ դժվարության, երբ խոսքը վերաբերում է Արհեստական ​​ինտելեկտի (AI) նորագույնին:

Այո, պնդումներն այն են, որ դա տեղի է ունենում ցուցադրաբար մի տեսակի AI-ի միջոցով, որը հայտնի է որպես Գեներատիվ AI. Բազմաթիվ կարծիքներ կան, որ Generative AI-ն, այս օրերի նորությունների ամենաթեժ AI-ն, արդեն իսկ վարկ է վերցրել այն բանի համար, ինչին արժանի չէ արժանին մատուցել: Եվ սա, ամենայն հավանականությամբ, կվատթարանա, քանի որ գեներատիվ AI-ն գնալով ավելի է ընդլայնվում և օգտագործվում: Ավելի ու ավելի շատ վարկ է ներծծվում գեներացնող AI-ին, մինչդեռ, ցավոք, նրանք, ովքեր առատորեն արժանի են իսկական վարկին, մնում են փոշու մեջ:

Այս ենթադրյալ երևույթը հստակորեն նշելու իմ առաջարկած ձևը երկու հուզիչ արտահայտությունների միջոցով է.

  • 1) գրագողություն մասշտաբով
  • 2) Հեղինակային իրավունքի խախտման մասշտաբով

Ենթադրում եմ, որ դուք կարող եք տեղյակ լինել գեներատիվ AI-ի մասին՝ շնորհիվ լայնորեն տարածված AI հավելվածի, որը հայտնի է որպես ChatGPT, որը թողարկվել է նոյեմբերին OpenAI-ի կողմից: Ես մի պահ ավելին կասեմ գեներատիվ AI-ի և ChatGPT-ի մասին: Մնա այդտեղ.

Եկեք անմիջապես հասնենք այն խնդրին, թե ինչն է մարդկանց այծերը, ոնց որ ասես, ստանում:

Ոմանք ջերմեռանդորեն բողոքում են, որ գեներատիվ AI-ն կարող է պոկել մարդկանց, ովքեր բովանդակություն են ստեղծել: Տեսեք, արհեստական ​​ինտելեկտի գեներացնող հավելվածների մեծ մասը տվյալներ են, որոնք վերապատրաստվում են համացանցում հայտնաբերված տվյալների ուսումնասիրությամբ: Հիմնվելով այդ տվյալների վրա՝ ալգորիթմները կարող են հղկել AI հավելվածի ներսում օրինաչափությունների համապատասխանող հսկայական ցանց, որը հետագայում կարող է արտադրել թվացյալ նոր բովանդակություն, որը զարմանալիորեն կարծես թե ստեղծվել է մարդու ձեռքով, այլ ոչ թե ավտոմատացման կտոր։

Այս ուշագրավ սխրանքը մեծապես պայմանավորված է ինտերնետով սկանավորված բովանդակությունից օգտվելով: Առանց ինտերնետի բովանդակության ծավալի և հարուստության՝ որպես տվյալների ուսուցման աղբյուր, գեներացնող AI-ն գրեթե դատարկ կլիներ և օգտագործելու համար քիչ կամ ոչ մի հետաքրքրություն կառաջացներ: Արհեստական ​​ինտելեկտը ուսումնասիրելով միլիոնավոր միլիոնավոր առցանց փաստաթղթեր և տեքստեր, ինչպես նաև հարակից բովանդակության բոլոր տեսակները, աստիճանաբար ձևավորվում է օրինաչափությունների համընկնումը՝ փորձելով ընդօրինակել մարդու կողմից արտադրված բովանդակությունը:

Որքան ավելի շատ բովանդակություն ուսումնասիրվի, այնքան հավանական է, որ օրինաչափությունների համընկնումն ավելի կհղկվի և ավելի լավ կդարձնի միմիկան, մնացած բոլորը հավասար կլինեն:

Ահա, ուրեմն, միլիարդավոր դոլարների հարցը.

  • Մեծ Հարց. Եթե ​​դուք կամ ուրիշներ ունեք բովանդակություն ինտերնետում, որի վրա վերապատրաստվել է արհեստական ​​ինտելեկտի ինչ-որ գեներացնող հավելված՝ դա անելով, ենթադրաբար, առանց ձեր անմիջական թույլտվության և, հնարավոր է, ընդհանրապես առանց ձեր տեղեկացվածության, դուք պետք է իրավունք ունենաք մի կտոր կարկանդակ ստանալու համար, թե ինչ արժեքից է բխում: այդ գեներատիվ AI տվյալների ուսուցումը:

Ոմանք բուռն կերպով պնդում են, որ միակ ճիշտ պատասխանն է այո, հատկապես, որ այդ մարդկային բովանդակություն ստեղծողները իսկապես արժանի են իրենց գործողությունների կրճատմանը: Բանն այն է, որ ձեզ դժվար կլինի գտնել որևէ մեկին, ով ստացել է իրենց արդար բաժինը, և ավելի վատ է, որ գրեթե ոչ ոք որևէ բաժնեմաս չի ստացել: Ինտերնետային բովանդակություն ստեղծողներին, որոնք ակամա և անգիտակցաբար ներդրում են կատարել, ըստ էության մերժվում են իրենց օրինական վարկը:

Սա կարող է բնութագրվել որպես դաժան և վիրավորական: Մենք պարզապես անցանք իմաստուն իմաստության բացման միջով, որ վարկը պետք է տրվի այնտեղ, որտեղ արժանի է վարկը: Գեներատիվ AI-ի դեպքում, ըստ երևույթին, այդպես չէ: Վարկավորման մասին վաղեմի և առաքինի կանոնը կարծես կոպտորեն խախտված է:

Վա՜յ, հակադարձումը գնում է, դուք լրիվ գերագնահատում և սխալ եք ներկայացնում իրավիճակը։ Իհարկե, գեներատիվ AI-ն ուսումնասիրել է բովանդակությունը ինտերնետում: Իհարկե, սա առատորեն օգտակար էր որպես գեներացնող AI-ի տվյալների ուսուցման մի մաս: Խոստովանենք, որ տպավորիչ գեներացնող AI հավելվածներն այսօր այդքան տպավորիչ չէին լինի առանց այս դիտարկված մոտեցման: Բայց դուք չափից դուրս կամուրջ եք գնացել՝ ասելով, որ բովանդակություն ստեղծողներին պետք է հատկացվի որոշակի վարկ:

Տրամաբանությունը հետեւյալն է. Մարդիկ դուրս են գալիս ինտերնետ և սովորում ինչ-որ բան ինտերնետից՝ դա անելով սովորական և առանց որևէ աղմուկի: Անձը, ով կարդում է սանտեխնիկայի մասին բլոգեր, այնուհետև դիտում է անվճար հասանելի սանտեխնիկայի մասին տեսանյութեր, հաջորդ օրը կարող է դուրս գալ և աշխատել որպես սանտեխնիկ: Արդյո՞ք նրանք պետք է իրենց սանտեխնիկայի հետ կապված դրամական փոխանցումների մի մասը տան այն բլոգերին, որը գրել է, թե ինչպես ջրմուղ անել լվացարանը: Արդյո՞ք նրանք պետք է վճար տան վլոգերին, ով նկարահանել է տեսանյութը, որը ցույց է տալիս ծակվող լոգարանը շտկելու քայլերը:

Գրեթե հաստատ ոչ:

Գեներատիվ AI-ի տվյալների ուսուցումը զուտ օրինաչափություններ մշակելու միջոց է: Քանի դեռ գեներատիվ AI-ից ստացված արդյունքները զուտ հետազոտվածի վերագրանցում չեն, դուք կարող եք համոզիչ կերպով պնդել, որ նրանք «սովորել են» և, հետևաբար, ենթակա չեն որևէ կոնկրետ աղբյուրի որևէ հատուկ վարկ տրամադրելու: Եթե ​​դուք չեք կարող որսալ գեներատիվ AI-ն ճշգրիտ ռեգուրգիտացիան կատարելիս, ապա ցուցումները ցույց են տալիս, որ AI-ն ընդհանրացվել է որևէ կոնկրետ աղբյուրից դուրս:

Ոչ մեկին վարկ չի տրվում: Կամ, կարելի է ենթադրել, կարելի է ասել, որ վարկը պատկանում է բոլորին։ Համացանցում հայտնաբերված կոլեկտիվ տեքստը և մարդկության այլ բովանդակությունը գնահատվում են: Մենք բոլորս ստանում ենք վարկ: Կոնկրետ աղբյուրի վարկը մատնանշելու փորձն անիմաստ է: Ուրախ եղեք, որ արհեստական ​​ինտելեկտը զարգանում է, և որ մարդկությանը կշահի: Ինտերնետում այդ հրապարակումները պետք է պատիվ զգային, որ նպաստել են արհեստական ​​ինտելեկտի առաջընթացին և ինչպես դա կօգնի մարդկությանը հավերժության համար:

Այդ երկու հակադիր տեսակետների մասին էլ ավելին կասեմ:

Միևնույն ժամանակ, դուք թեքվում եք դեպի այն ճամբարը, որն ասում է, որ վարկը վճարված է և ուշացած նրանց համար, ովքեր ունեն ինտերնետային կայքեր, թե՞ գտնում եք, որ հակառակ կողմը, որն ասում է, որ ինտերնետ բովանդակություն ստեղծողները վճռական են: Նշում պոկվելն ավելի համոզիչ կեցա՞ծ է:

Մի հանելուկ և հանելուկ՝ բոլորը խցանված են:

Եկեք բացենք սա:

Այսօրվա սյունակում ես կանդրադառնամ այս արտահայտված մտահոգություններին, որ գեներատիվ AI-ն, ըստ էության, գրագողություն է կամ, հնարավոր է, խախտում է համացանցում տեղադրված բովանդակության հեղինակային իրավունքները (համարվում է մտավոր սեփականության իրավունք կամ IP խնդիր): Մենք կդիտարկենք այս անհանգստությունների հիմքը: Այս քննարկման ընթացքում ես երբեմն կանդրադառնամ ChatGPT-ին, քանի որ դա գեներատիվ AI-ի 600 ֆունտանոց գորիլա է, թեև հիշեք, որ կան բազմաթիվ այլ գեներացնող AI հավելվածներ, և դրանք հիմնականում հիմնված են նույն ընդհանուր սկզբունքների վրա:

Միևնույն ժամանակ, դուք կարող եք մտածել, թե իրականում ինչ է գեներատիվ AI-ն:

Եկեք նախ անդրադառնանք գեներատիվ արհեստական ​​ինտելեկտի հիմունքներին, այնուհետև կարող ենք ուշադիր նայել արդիական խնդրին:

Այս ամենի մեջ մտնում են AI էթիկայի և AI օրենքի նկատառումները:

Խնդրում ենք տեղյակ լինել, որ շարունակական ջանքեր են գործադրվում Արհեստական ​​արհեստական ​​ինտելեկտի էթիկական սկզբունքները ներթափանցելու AI հավելվածների մշակման և ներդրման մեջ: Մտահոգված և նախկինում արհեստական ​​ինտելեկտի էթիկայի մասնագետների աճող կոնտինգենտը փորձում է ապահովել, որ արհեստական ​​ինտելեկտը մշակելու և ընդունելու ջանքերը հաշվի են առնում անելու տեսակետը: AI For Good և կանխարգելող AI For Bad. Նմանապես, առաջարկվում են արհեստական ​​ինտելեկտի նոր օրենքներ, որոնք շրջանառվում են որպես պոտենցիալ լուծումներ, որոնք թույլ չեն տալիս AI-ի ջանքերը չխոչընդոտել մարդու իրավունքներին և նման բաներին: AI-ի էթիկայի և AI օրենքի իմ շարունակական և ընդարձակ լուսաբանման համար տե՛ս հղումն այստեղ և հղումն այստեղ, պարզապես մի քանի անուն:

Արհեստական ​​ինտելեկտի էթիկական սկզբունքների մշակումն ու տարածումը հետամուտ են լինում՝ հուսանք կանխելու համար, որ հասարակությունն ընկնի արհեստական ​​ինտելեկտը հրահրող բազմաթիվ թակարդների մեջ: ՅՈՒՆԵՍԿՕ-ի ջանքերով մոտ 200 երկրների կողմից մշակված և աջակցվող ՄԱԿ-ի AI-ի էթիկայի սկզբունքների իմ լուսաբանման համար տե՛ս. հղումն այստեղ. Նմանապես, արհեստական ​​ինտելեկտի նոր օրենքներ են ուսումնասիրվում՝ փորձելով AI-ն հավասարաչափ պահել: Վերջին վերցնումներից մեկը բաղկացած է առաջարկվող մի շարքից AI իրավունքների օրինագիծ որ ԱՄՆ Սպիտակ տունը վերջերս հրապարակեց՝ բացահայտելու մարդու իրավունքները արհեստական ​​ինտելեկտի դարաշրջանում, տես հղումն այստեղ. Գյուղ է պահանջվում AI-ի և AI-ի մշակողներին ճիշտ ուղու վրա պահելու և կանխելու նպատակային կամ պատահական թաքնված ջանքերը, որոնք կարող են վնասել հասարակությանը:

Այս քննարկման մեջ ես միահյուսելու եմ AI-ի էթիկայի և AI օրենքի հետ կապված նկատառումները:

Generative AI-ի հիմունքները

Գեներատիվ AI-ի ամենահայտնի օրինակը ներկայացված է ChatGPT անունով AI հավելվածով: ChatGPT-ն հայտնվեց հանրային գիտակցության մեջ դեռևս նոյեմբերին, երբ այն թողարկվեց AI հետազոտական ​​OpenAI ընկերության կողմից: Այն ժամանակվանից ի վեր, երբ ChatGPT-ն հավաքել է հսկայական վերնագրեր և զարմանալիորեն գերազանցել է իր հատկացված տասնհինգ րոպե փառքը:

Կարծում եմ, դուք հավանաբար լսել եք ChatGPT-ի մասին կամ գուցե նույնիսկ գիտեք մեկին, ով օգտագործել է այն:

ChatGPT-ը համարվում է արհեստական ​​ինտելեկտի գեներատիվ հավելված, քանի որ այն ընդունում է օգտատերից որոշ տեքստ, այնուհետև առաջացնում կամ արտադրում է արդյունք, որը բաղկացած է էսսեից: AI-ն տեքստից տեքստ գեներատոր է, չնայած ես նկարագրում եմ AI-ն որպես տեքստի շարադրություն գեներատոր, քանի որ դա ավելի հեշտ է պարզաբանում, թե ինչի համար է այն սովորաբար օգտագործվում: Դուք կարող եք օգտագործել գեներատիվ AI-ը երկար կոմպոզիցիաներ կազմելու համար կամ կարող եք ստիպել այն առաջարկել բավականին կարճ բովանդակալից մեկնաբանություններ: Ամեն ինչ ձեր խնդրանքով է:

Ձեզ անհրաժեշտ է միայն հուշում մուտքագրել, և AI հավելվածը ձեզ համար կստեղծի շարադրություն, որը կփորձի պատասխանել ձեր հուշմանը: Կազմված տեքստը կթվա, կարծես շարադրությունը գրված է մարդու ձեռքով և մտքով: Եթե ​​դուք պետք է մուտքագրեք հուշում, որտեղ ասվում է «Պատմեք ինձ Աբրահամ Լինքոլնի մասին», գեներատիվ AI-ն ձեզ կտրամադրի շարադրություն Լինքոլնի մասին: Գոյություն ունեն գեներատիվ AI-ի այլ եղանակներ, ինչպիսիք են՝ տեքստը-արվեստ և տեքստ-տեսանյութ: Այստեղ ես կկենտրոնանամ տեքստից տեքստ փոփոխության վրա:

Ձեր առաջին միտքը կարող է լինել այն, որ այս գեներացնող կարողությունը այնքան էլ մեծ խնդիր չի թվում էսսեներ պատրաստելու առումով: Դուք հեշտությամբ կարող եք առցանց որոնում կատարել ինտերնետում և հեշտությամբ գտնել տոննաներով ու տոննաներով էսսեներ Նախագահ Լինքոլնի մասին: Գեներատիվ AI-ի դեպքում ամենակարևորն այն է, որ ստեղծված շարադրությունը համեմատաբար եզակի է և ապահովում է բնօրինակ կոմպոզիցիա, այլ ոչ թե կրկնօրինակ: Եթե ​​դուք փորձեիք գտնել AI-ի կողմից պատրաստված շարադրությունը առցանց ինչ-որ տեղ, դժվար թե այն հայտնաբերեք:

Generative AI-ն նախապես պատրաստված է և օգտագործում է բարդ մաթեմատիկական և հաշվողական ձևակերպում, որը ստեղծվել է համացանցում գրավոր բառերի և պատմությունների օրինաչափությունների ուսումնասիրության միջոցով: Հազարավոր և միլիոնավոր գրավոր հատվածների ուսումնասիրության արդյունքում արհեստական ​​ինտելեկտը կարող է նոր էսսեներ և պատմություններ դուրս հանել, որոնք հայտնաբերվածի խառնուրդ են: Տարբեր հավանականական ֆունկցիոնալություններ ավելացնելով՝ ստացված տեքստը բավականին եզակի է՝ համեմատած այն, ինչ օգտագործվել է ուսումնական հավաքածուում:

Բազմաթիվ մտահոգություններ կան գեներատիվ AI-ի վերաբերյալ:

Կարևոր բացասական կողմերից մեկն այն է, որ գեներատիվ վրա հիմնված AI հավելվածի կողմից արտադրված էսսեները կարող են ներառել տարբեր կեղծիքներ, ներառյալ ակնհայտորեն իրականությանը չհամապատասխանող փաստեր, փաստեր, որոնք ապակողմնորոշված ​​են և ակնհայտ փաստեր, որոնք ամբողջությամբ հորինված են: Այդ հորինված ասպեկտները հաճախ կոչվում են որպես ձև AI հալյուցինացիաներ, մի բառակապակցություն, որը ես հավանություն չեմ տալիս, բայց, ցավոք, թվում է, թե ամեն դեպքում հանրաճանաչություն է ձեռք բերում (իմ մանրամասն բացատրության համար, թե ինչու է սա ոջլոտ և ոչ պիտանի տերմինաբանություն, տե՛ս իմ լուսաբանումը այստեղ հղումն այստեղ).

Մյուս մտահոգությունն այն է, որ մարդիկ կարող են հեշտությամբ արժանանալ արհեստական ​​ինտելեկտի ստեղծած շարադրության համար, չնայած իրենք չեն կազմել շարադրությունը: Դուք կարող եք լսել, որ ուսուցիչները և դպրոցները բավականին մտահոգված են արհեստական ​​ինտելեկտի գեներացնող հավելվածների առաջացմամբ: Ուսանողները կարող են պոտենցիալ օգտագործել գեներատիվ AI՝ իրենց հանձնարարված էսսեները գրելու համար: Եթե ​​ուսանողը պնդում է, որ շարադրությունը գրվել է իր ձեռքով, ապա ուսուցիչը քիչ հավանական է, որ կարողանա պարզել, թե արդյոք այն կեղծվել է գեներատիվ AI-ի կողմից: Այս աշակերտի և ուսուցչի շփոթեցնող կողմի իմ վերլուծության համար տե՛ս իմ լուսաբանումը այստեղ հղումն այստեղ և հղումն այստեղ.

Սոցցանցերում մի քանի խելահեղ չափի հայտարարություններ են հնչել Գեներատիվ AI պնդելով, որ AI-ի այս վերջին տարբերակը իրականում է զգայուն AI (ոչ, նրանք սխալվում են): Արհեստական ​​ինտելեկտի էթիկայի և արհեստական ​​ինտելեկտի իրավունքի մասնագետները հատկապես անհանգստացած են լայնածավալ պահանջների այս աճող միտումով: Դուք կարող եք քաղաքավարի կերպով ասել, որ որոշ մարդիկ գերագնահատում են այն, ինչ իրականում կարող է անել այսօրվա AI-ն: Նրանք ենթադրում են, որ AI-ն ունի կարողություններ, որոնց մենք դեռ չենք կարողացել հասնել: Դա ցավալի է: Ավելի վատն այն է, որ նրանք կարող են թույլ տալ իրենց և ուրիշներին հայտնվել սարսափելի իրավիճակներում՝ ենթադրելով, որ AI-ն խելամիտ կամ մարդանման կլինի՝ ի վիճակի լինելով գործողություններ ձեռնարկել:

Մի մարդակերպեք AI-ն:

Այդպես վարվելով՝ դուք կհայտնվեք կպչուն և կոպիտ վստահության ծուղակի մեջ՝ ակնկալելով, որ AI-ն կանի այնպիսի բաներ, որոնք ի վիճակի չէ կատարել: Ասվածով հանդերձ, գեներատիվ AI-ի վերջին տարբերակը համեմատաբար տպավորիչ է այն բանի համար, թե ինչ կարող է անել: Ուշադիր եղեք, թեև կան զգալի սահմանափակումներ, որոնք դուք պետք է անընդհատ հիշեք ցանկացած գեներացնող AI հավելված օգտագործելիս:

Մեկ վերջնական նախազգուշացում առայժմ.

Ինչ էլ որ տեսնեք կամ կարդաք գեներացնող AI պատասխանում, որ Թվում է, պետք է փոխանցվի որպես զուտ փաստացի (ամսաթվեր, վայրեր, մարդիկ և այլն), համոզվեք, որ թերահավատ եք և պատրաստ եղեք կրկնակի ստուգել այն, ինչ տեսնում եք:

Այո, ամսաթվերը կարելի է հորինել, վայրեր հորինել, և տարրեր, որոնք մենք սովորաբար ակնկալում ենք, որ անարգանքից վեր են. բոլորը ենթակա է կասկածների. Մի հավատացեք ձեր կարդացածին և թերահավատորեն նայեք, երբ ուսումնասիրում եք արհեստական ​​ինտելեկտի գեներացնող շարադրություններ կամ արդյունքներ: Եթե ​​արհեստական ​​ինտելեկտի գեներացնող հավելվածը ձեզ ասի, որ Աբրահամ Լինքոլնը թռավ ամբողջ երկրում իր անձնական ինքնաթիռով, դուք, անկասկած, կիմանաք, որ դա արատ է: Ցավոք, որոշ մարդիկ կարող են չհասկանալ, որ իր ժամանակներում ինքնաթիռները չեն եղել, կամ նրանք կարող են իմանալ, բայց չեն նկատել, որ շարադրությունը ներկայացնում է այս լկտի և սարսափելի կեղծ պնդումը:

Առողջ թերահավատության մեծ չափաբաժինը և անհավատության համառ մտածելակերպը կլինեն ձեր լավագույն առավելությունը գեներացնող AI-ն օգտագործելիս:

Մենք պատրաստ ենք անցնել այս պարզաբանման հաջորդ փուլ:

Ինտերնետը և գեներատիվ AI-ն միասին են

Այժմ, երբ դուք պատկերացում ունեք, թե ինչ է գեներատիվ AI-ն, մենք կարող ենք ուսումնասիրել այն մտահոգիչ հարցը, թե արդյոք գեներատիվ AI-ն արդարացիորեն կամ անարդարացիորեն «օգտագործում է», կամ ոմանք կասեին. բացահայտորեն շահագործումից Ինտերնետային բովանդակություն.

Ահա այս խնդրին առնչվող իմ չորս կենսական թեմաները.

  • 1) Կրկնակի խնդիր՝ գրագողություն և հեղինակային իրավունքի խախտում
  • 2) Փորձելու է ապացուցել գրագողությունը կամ հեղինակային իրավունքի խախտումը
  • 3) Գրագողության կամ հեղինակային իրավունքի խախտման համար գործ հարուցելը
  • 4) Սպասվում են օրինական ականներ

Ես կանդրադառնամ այս կարևոր թեմաներից յուրաքանչյուրին և կառաջարկեմ խորաթափանց նկատառումներ, որոնց շուրջ մենք բոլորս պետք է ուշադիր քննարկենք: Այս թեմաներից յուրաքանչյուրն ավելի մեծ գլուխկոտրուկի անբաժանելի մասն է: Դուք չեք կարող միայն մեկ կտոր նայել: Ոչ էլ կարող ես որևէ կտոր նայել մյուս կտորներից մեկուսացված:

Սա բարդ խճանկար է, և ամբողջ գլուխկոտրուկը պետք է պատշաճ ներդաշնակ դիտարկվի:

Կրկնակի խնդիր. գրագողություն և հեղինակային իրավունքի խախտում

Կրկնակի դժվարությունը, որին բախվում են արհեստական ​​ինտելեկտը արտադրող և արդյունահանողներն այն է, որ նրանց արտադրանքը կարող է երկու վատ բան անել.

  • 1) գրագողություն. Գեներատիվ AI-ն կարելի է մեկնաբանել այսպես գրագողությունը բովանդակություն, որը գոյություն ունի ինտերնետում, ըստ ինտերնետի սկանավորման, որը տեղի է ունեցել AI-ի տվյալների վերապատրաստման ժամանակ:
  • 2) Հեղինակային իրավունքի խախտում. Արտադրող AI-ն կարող է պահանջվել որպես ձեռնարկություն հեղինակային իրավունքի խախտում կապված ինտերնետ բովանդակության հետ, որը սկանավորվել է տվյալների ուսուցման ընթացքում:

Պարզաբանելու համար, ինտերնետում շատ ավելի շատ բովանդակություն կա, քան իրականում սովորաբար սկանավորվում է գեներատիվ AI-ի տվյալների ուսուցման համար: Ինտերնետի միայն մի փոքր մասն է սովորաբար օգտագործվում: Այսպիսով, մենք կարող ենք ենթադրաբար ենթադրել, որ ցանկացած բովանդակություն, որը չի սկանավորվել տվյալների ուսուցման ընթացքում, չունի հատուկ տավարի միս՝ գեներատիվ AI-ով:

Սա որոշ չափով վիճելի է, քանի որ դուք կարող եք պոտենցիալ գիծ քաշել, որը կապում է սկանավորված այլ բովանդակությունը չսկանավորված բովանդակության հետ: Բացի այդ, ևս մեկ կարևոր դրույթ այն է, որ նույնիսկ եթե կա բովանդակություն, որը չի սկանավորվել, այն դեռևս կարող է վիճարկվել որպես գրագողություն և/կամ հեղինակային իրավունքի խախտված, եթե գեներացնող AI-ի արդյունքները, ամենայն հավանականությամբ, հայտնվում են նույն բառապաշարի վրա: Իմ կարծիքն այն է, որ այս ամենի մեջ շատ ճկունություն կա:

Ներքեւի գիծ: Generative AI-ն լի է արհեստական ​​ինտելեկտի էթիկական և AI իրավունքի պոտենցիալ հանելուկներով, երբ խոսքը վերաբերում է գրագողության և հեղինակային իրավունքի խախտմանը: տվյալների վերապատրաստման գերակշռող պրակտիկաների հիմքում:

Առայժմ, AI ստեղծողները և AI հետազոտողները սահել են այս տարածքը գրեթե առանց շոտլանդացիների, չնայած նրանց գլխավերևում կախված և անորոշ կախված թուրին: Այս պրակտիկայի դեմ մինչ օրս միայն մի քանի դատական ​​գործ է հարուցվել: Հնարավոր է, որ դուք լսած կամ տեսած լինեք նման իրավական գործողությունների մասին լուրերի հոդվածներ: Մեկը, օրինակ, ներառում է Midjourney-ի և Stability AI-ի տեքստ-պատկեր ֆիրմաները՝ համացանցում տեղադրված գեղարվեստական ​​բովանդակությունը խախտելու համար: Մյուսը ենթադրում է տեքստից կոդ խախտում GitHub-ի, Microsoft-ի և OpenAI-ի դեմ՝ կապված AI հավելվածներ արտադրող Copilot ծրագրաշարի հետ: Getty Images-ը նաև նպատակ է ունեցել հետևել Stability AI-ին՝ տեքստից պատկեր խախտելու համար:

Կարելի է ակնկալել, որ նման հայցեր դեռ կներկայացվեն։

Հենց հիմա, մի քիչ հավանական է սկսել այդ հայցերը, քանի որ արդյունքը համեմատաբար անհայտ է: Արդյո՞ք դատարանը կկանգնի արհեստական ​​ինտելեկտի ստեղծողների կողմը, թե՞ նրանք, ովքեր կարծում են, որ դրանց բովանդակությունը անարդարացիորեն շահագործվել է, կհաղթեն: Ծախսատար իրավական պայքարը միշտ էլ լուրջ խնդիր է: Լայնածավալ իրավական ծախսերի ծախսումը պետք է կշռվի հաղթելու կամ պարտվելու հնարավորությունների հետ:

AI ստեղծողները կարծես թե գրեթե այլընտրանք չունեն, քան պայքար մղել: Եթե ​​նրանք թեկուզ մի փոքր զիջեին, հավանականությունն այն է, որ լրացուցիչ դատավարությունների տարափ կառաջանար (ըստ էության, դուռը բացելով ուրիշների գերակշռման մեծ հավանականության համար): Երբ ջրում օրինական արյուն լինի, մնացած օրինական շնաձկները կսկսեն հասնել համարվող «հեշտ գնահատականին», և, անշուշտ, տեղի կունենա դրամական արյունահեղություն և ծեծկռտուք:

Ոմանք կարծում են, որ մենք պետք է ընդունենք AI-ի նոր օրենքներ, որոնք կպաշտպանեն AI ստեղծողներին: Պաշտպանությունը կարող է նույնիսկ հետադարձ ուժ ունենալ: Դրա հիմքն այն է, որ եթե մենք ցանկանում ենք տեսնել արհեստական ​​ինտելեկտի գեներացնող առաջընթաց, մենք պետք է AI ստեղծողներին տրամադրենք որոշակի անվտանգ գոտի թռիչքուղի: Երբ դատավարությունները սկսեն հաղթանակներ տանել արհեստական ​​ինտելեկտի ստեղծողների դեմ, եթե դա տեղի ունենա (մենք դեռ չգիտենք), անհանգստությունն այն է, որ գեներատիվ AI-ն կգոլորշիանա, քանի որ ոչ ոք չի ցանկանա որևէ աջակցություն ցուցաբերել AI ընկերություններին:

Ինչպես հմուտ կերպով նշվեց Bloomberg-ի օրենքի վերջին հոդվածում, որը վերնագրված է դոկտոր Իլիա Կոլոչենկոյի և Գորդոն Պլաթի «ChatGPT. IP, կիբերանվտանգություն և գեներատիվ AI-ի այլ իրավական ռիսկեր», Bloomberg Law, փետրվար 2023, ահա երկու կարևոր հատված, որոնք արձագանքում են այս տեսակետներին.

  • «Այժմ բուռն բանավեճ է ծավալվում ԱՄՆ իրավաբանների և ՄՍ իրավունքի պրոֆեսորների միջև այն մասին, թե արդյոք հեղինակային իրավունքով պաշտպանված տվյալների չթույլատրված քերծումը և հետագա օգտագործումը հեղինակային իրավունքի խախտում են: Եթե ​​իրավաբանների տեսակետը, ովքեր տեսնում են հեղինակային իրավունքի խախտումներ նման պրակտիկայում, գերակշռում է, նման AI համակարգերի օգտատերերը կարող են նաև պատասխանատվություն կրել երկրորդական խախտման համար և կարող են բախվել իրավական հետևանքների»:
  • «Մարտահրավերը համակողմանիորեն լուծելու համար օրենսդիրները պետք է մտածեն ոչ միայն հեղինակային իրավունքի մասին գործող օրենսդրության արդիականացման, այլ նաև արհեստական ​​ինտելեկտի համար հատուկ օրենքների և կանոնակարգերի իրականացման մասին»:

Հիշեցնենք, որ որպես հասարակություն մենք իրականացրել ենք իրավական պաշտպանություն նրանց համար ընդլայնում Համացանցի մասին, ինչպես վկայում է Գերագույն դատարանը, որը վերանայում է հանրահայտ կամ տխրահռչակ 230-րդ բաժինը: Այսպիսով, խելամիտ և նախադեպային է թվում, որ մենք կարող ենք պատրաստ լինել նման պաշտպանություններ անել գեներատիվ AI-ի առաջխաղացման համար: Հնարավոր է, որ պաշտպանությունը կարող է ժամանակավորապես ստեղծվել, ժամկետը լրանալով այն բանից հետո, երբ գեներատիվ AI-ն հասել է հմտությունների նախապես որոշված ​​մակարդակի: Կարելի է մշակել այլ պաշտպանական դրույթներ:

Ես շուտով կհրապարակեմ իմ վերլուծությունը, թե ինչպես Գերագույն դատարանի գնահատականը և 230-րդ բաժնի վերաբերյալ վերջնական որոշումը կարող են ազդել գեներատիվ AI-ի հայտնվելու վրա: Հետևե՛ք առաջիկա հրապարակմանը:

Վերադառնալ խիստ հնչեցված կարծիքին, որ մենք պետք է ազատություն տանք հասարակության ակնածանք ներշնչող տեխնոլոգիական նորարարությանը, որը հայտնի է որպես գեներատիվ AI: Ոմանք կասեն, որ նույնիսկ եթե հեղինակային իրավունքի խախտումը տեղի է ունենում կամ տեղի է ունենում, հասարակությունը որպես ամբողջություն պետք է պատրաստ լինի թույլ տալ դա գեներացնող AI-ի առաջխաղացման հատուկ նպատակների համար:

Հույս կա, որ AI-ի նոր օրենքները խնամքով կմշակվեն և կհամապատասխանեցվեն այն մանրամասներին, որոնք կապված են գեներատիվ AI-ի համար տվյալների ուսուցման հետ:

Այս նպատակով արհեստական ​​ինտելեկտի նոր օրենքներ մշակելու այս հասկացությանը բազմաթիվ հակափաստարկներ կան: Մտահոգություններից մեկն այն է, որ արհեստական ​​ինտելեկտի ցանկացած նման նոր օրենք բաց կթողնի հեղինակային իրավունքի բոլոր ձևերի խախտման համար: Մենք կվախենանք այն օրը, երբ թույլ տվեցինք AI-ի նման նոր օրենքները իջնել գրքերի վրա: Անկախ նրանից, թե որքան դժվար եք դա սահմանափակել միայն արհեստական ​​ինտելեկտի տվյալների ուսուցմամբ, մյուսները գաղտագողի կամ խելամտորեն կգտնեն բացեր, որոնք կհամարեն հեղինակային իրավունքի անկաշկանդ և համատարած խախտում:

Կլոր-շրջում են փաստարկները:

Մի փաստարկ, որն առանձնապես չի կարող լինել, կապված է AI-ի դեմ դատի տալու փորձի հետ: Ուշադրություն դարձրեք, որ ես նկատի ունեի AI ստեղծողին կամ AI հետազոտողներին՝ որպես մեղավոր շահագրգիռ կողմերի: Սրանք մարդիկ և ընկերություններ են: Ոմանք առաջարկում են, որ մենք պետք է թիրախավորենք արհեստական ​​ինտելեկտը՝ որպես դատի տալու կողմ: Ես երկար քննարկել եմ իմ սյունակում, որ մենք դեռևս չենք վերագրում իրավաբանական անձը AI-ին, տես հղումն այստեղ օրինակ, և այդպիսով, AI-ի դեմ ուղղված նման հայցերը հենց հիմա անիմաստ կհամարվեն:

Որպես հավելում այն ​​հարցին, թե ում կամ ինչին պետք է դատի տալ, սա առաջ է բերում մեկ այլ հյութեղ թեմա։

Ենթադրենք, որ որոշակի գեներացնող AI հավելվածը ստեղծվել է AI որոշ արտադրողի կողմից, որը մենք կանվանենք Widget Company: Վիդջեթ ընկերությունը համեմատաբար փոքր է չափսերով և չունի մեծ եկամուտ, ոչ էլ ակտիվների առումով: Նրանց դատի տալը, ամենայն հավանականությամբ, չի բերի այն մեծ հարստությունը, որը կարելի է փնտրել: Առավելագույնը, դուք պարզապես բավարարվածություն կունենայիք ուղղելու այն, ինչ սխալ եք ընկալում։

Դուք ուզում եք գնալ մեծ ձկան հետևից:

Ահա թե ինչպես է դա առաջանալու: AI արտադրողը ընտրում է իր գեներացնող AI-ն հասանելի դարձնել Big Time Company-ին, որը տոննաներով խմորով և տոննա ակտիվներով խոշոր կոնգլոմերատ է: «Վիջեթ» ընկերության անունը տալու համար դատական ​​հայցն այժմ ավելի լավ նպատակ կունենար, մասնավորապես՝ անվանելով «Բիգ Թայմ» ընկերությունը: Սա Դավթի և Գողիաթի մենամարտն է, որը փաստաբաններին հաճույք կպատճառի: Իհարկե, Big Time Company-ն, անկասկած, կփորձի դուրս գալ ձկնորսական կարթից: Արդյոք նրանք կարող են դա անել, ևս մեկ անգամ իրավական հարց է, որը անորոշ է, և նրանք կարող են անհուսորեն խրվել ցեխի մեջ:

Նախքան այս մասին շատ ավելին անցնելը, ես կցանկանայի սեղանին ինչ-որ կարևոր բան ստանալ գեներատիվ AI-ի վիճելի ոտնձգությունների վերաբերյալ տվյալների ուսուցման պատճառով: Համոզված եմ, որ դուք ինտուիտիվ կերպով հասկանում եք, որ գրագողությունը և հեղինակային իրավունքի խախտումը երկու փոքր-ինչ տարբեր գազաններ են: Նրանք շատ ընդհանրություններ ունեն, թեև դրանք նաև զգալիորեն տարբերվում են:

Ահա Դյուկի համալսարանի հակիրճ նկարագրությունը, որը բացատրում է երկուսը.

  • «Գագագողությունը լավագույնս սահմանվում է որպես այլ անձի աշխատանքի չճանաչված օգտագործում: Դա էթիկական խնդիր է, որը ներառում է աշխատանքի դիմաց վարկի պահանջ, որը հայցվորը չի ստեղծել: Կարելի է գրագողություն անել ուրիշի աշխատանքը՝ անկախ այդ ստեղծագործության հեղինակային իրավունքի կարգավիճակից։ Օրինակ, գրագողություն է, այնուամենայնիվ, պատճենել գրքից կամ հոդվածից, որը չափազանց հին է՝ դեռևս հեղինակային իրավունքի տակ մնալու համար: Գրագողություն է նաև չճանաչված աղբյուրից վերցված տվյալների օգտագործումը, թեև փաստացի նյութերը, ինչպիսիք են տվյալները, կարող են պաշտպանված չլինել հեղինակային իրավունքով: Գրագողությունը, սակայն, հեշտությամբ բուժվում է՝ պատշաճ կերպով հղում կատարելով նյութի սկզբնական աղբյուրին»:
  • «Հեղինակային իրավունքի խախտումը, մյուս կողմից, ուրիշի ստեղծագործության չարտոնված օգտագործումն է: Սա իրավական խնդիր է, որը կախված է նրանից, թե արդյոք ստեղծագործությունն առաջին հերթին պաշտպանված է հեղինակային իրավունքով, թե ոչ, ինչպես նաև այնպիսի առանձնահատկություններից, ինչպիսիք են օգտագործված քանակությունը և օգտագործման նպատակը: Եթե ​​մեկը չափազանց շատ է կրկնօրինակում պաշտպանված ստեղծագործությունը կամ պատճենում է չարտոնված նպատակով, պարզապես սկզբնաղբյուրի ճանաչումը չի լուծի խնդիրը: Միայն հեղինակային իրավունքի սեփականատիրոջից նախնական թույլտվություն փնտրելով՝ կարելի է խուսափել խախտման համար գանձվելու վտանգից»:

Ես նշում եմ այս երկու մտահոգությունների կարևորությունը, որպեսզի դուք հասկանաք, որ միջոցները կարող են համապատասխանաբար տարբերվել: Բացի այդ, նրանք երկուսն էլ ներքաշված են AI-ի էթիկա և AI օրենք ներթափանցող նկատառումներով, ինչը նրանց հավասարապես արժե քննել:

Եկեք ուսումնասիրենք հայցվող միջոցը կամ լուծումը: Դուք կտեսնեք, որ դա կարող է օգնել կրկնակի խնդիրներից մեկին, բայց ոչ մյուսին:

Ոմանք պնդում են, որ արհեստական ​​ինտելեկտի արտադրողներին մնում է միայն նշել իրենց աղբյուրները: Երբ գեներատիվ AI-ն ստեղծում է շարադրություն, պարզապես ներառեք կոնկրետ մեջբերումներ այն ամենի համար, ինչ նշված է շարադրությունում: Տվեք տարբեր URL-ներ և այլ ցուցումներ, թե որ ինտերնետ բովանդակությունն է օգտագործվել: Թվում է, թե դա նրանց կազատի գրագողության հետ կապված անհանգստություններից: Ենթադրվում է, որ թողարկված շարադրությունը հստակ կբացահայտի, թե ինչ աղբյուրներ են օգտագործվել պատրաստվող ձևակերպման համար:

Այդ պնդվող լուծման մեջ կան որոշ հակասություններ, բայց 30,000 ֆուտ մակարդակի վրա, ենթադրենք, դա ծառայում է որպես գրագողության երկընտրանքի կիսաբավարար բուժում: Ինչպես վերը նշված է հեղինակային իրավունքի խախտման բացատրության մեջ, սկզբնաղբյուր նյութի մեջբերումը պարտադիր չէ, որ ձեզ դուրս բերի շան տնից: Ենթադրելով, որ բովանդակությունը պաշտպանված է հեղինակային իրավունքով, և կախված այլ գործոններից, ինչպիսիք են նյութի քանակն է օգտագործվել, հեղինակային իրավունքի խախտման սպասվող սուրը կարող է կտրուկ և վերջնականապես իջնել:

Կրկնակի անախորժությունն այստեղ հիմնական բառն է:

Փորձելու են ապացուցել գրագողությունը կամ հեղինակային իրավունքի խախտումը

Ապացուցիր!

Դա այն մաշված կրկներգն է, որը մենք բոլորս լսել ենք մեր կյանքի տարբեր ժամանակներում:

Դուք գիտեք, թե ինչպես է դա ընթանում: Դուք կարող եք պնդել, որ ինչ-որ բան տեղի է ունենում կամ տեղի է ունեցել: Դուք կարող եք ձեր սրտում իմանալ, որ դա տեղի է ունեցել: Բայց երբ խոսքը վերաբերում է հրում ընդդեմ հրումին, դուք պետք է ապացույցներ ունենաք:

Այսօրվա լեզվով ասած, դուք պետք է ցույց տաք ստացականներ, ինչպես ասում են.

Իմ հարցը ձեզ սա է. Ինչպե՞ս ենք մենք ցուցադրաբար ապացուցելու, որ գեներատիվ AI-ն անպատշաճ կերպով շահագործել է համացանցի բովանդակությունը:

Ենթադրվում է, որ պատասխանը պետք է հեշտ լինի։ Դուք խնդրում կամ ասում եք գեներացնող արհեստական ​​ինտելեկտին, որ թողարկվի շարադրություն: Այնուհետև վերցնում եք շարադրությունը և համեմատում այն, ինչ կարելի է գտնել ինտերնետում: Եթե ​​գտնես շարադրանքը, բամ, գեներատիվ AI-ն գամված է առածական պատին:

Թվում է, թե կյանքը երբեք այդքան հեշտ չի եղել:

Պատկերացրեք, որ մենք ստանում ենք գեներատիվ AI՝ մոտ 100 բառ պարունակող էսսե պատրաստելու համար: Մենք շրջում ենք և փորձում հասնել համացանցի բոլոր անկյուններն ու անկյունները՝ փնտրելով այդ 100 բառը: Եթե ​​մենք գտնենք 100 բառերը, որոնք ցուցադրված են նույն ճշգրիտ հերթականությամբ և նույն ձևով, մենք կարծես թե ինքներս մեզ բռնեցինք:

Ենթադրենք, թեև մենք ինտերնետում գտնում ենք թվացյալ «համեմատելի» շարադրություն, թեև այն համապատասխանում է 80 բառից միայն 100-ին: Սա, հավանաբար, դեռ բավարար է թվում: Բայց պատկերացրեք, որ մենք գտնում ենք այդ 10 բառից միայն 100 բառի օրինակ: Արդյո՞ք դա բավարա՞ր է բղավելու համար, որ կա՛մ գրագողություն է տեղի ունեցել, կա՛մ հեղինակային իրավունքի խախտում է տեղի ունեցել:

Մոխրագույնը գոյություն ունի.

Այդ կերպ տեքստը ծիծաղելի է:

Համեմատեք սա տեքստից պատկեր կամ տեքստից արվեստ հանգամանքների հետ: Երբ գեներատիվ AI-ն ապահովում է տեքստից պատկեր կամ տեքստի վերածելու հնարավորություն, դուք մուտքագրում եք տեքստային հուշում, և AI հավելվածը ստեղծում է պատկեր, որը որոշ չափով հիմնված է ձեր տրամադրած հուշման վրա: Պատկերը կարող է տարբերվել այս կամ որևէ այլ մոլորակի վրա երբևէ տեսած պատկերներից:

Մյուս կողմից, պատկերը կարող է հիշեցնել այլ պատկերներ, որոնք գոյություն ունեն: Մենք կարող ենք դիտել արհեստական ​​ինտելեկտի գեներատիվ պատկերը և որոշ չափով աղիքային բնազդով ասել, որ այն, անշուշտ, նման է մի այլ պատկերի, որը մենք տեսել ենք նախկինում: Ընդհանրապես, տեսողական համեմատության և հակադրման ասպեկտները մի փոքր ավելի հեշտ են ձեռնարկվում: Այսպես ասված է, խնդրում եմ, իմացեք, որ հսկայական իրավական բանավեճերը ապահովում են այն մասին, թե ինչ է նշանակում մեկ պատկերի համընկնումը կամ կրկնօրինակումը մյուսից:

Մեկ այլ նմանատիպ իրավիճակ կա երաժշտության հետ կապված. Կան գեներացնող AI հավելվածներ, որոնք թույլ են տալիս մուտքագրել տեքստային հուշում, և AI-ի կողմից արտադրվող արդյունքը աուդիո երաժշտություն է: Տեքստից-աուդիո կամ տեքստ-երաժշտություն AI-ի այս հնարավորությունները հենց հիմա են սկսում ի հայտ գալ: Մի բան, որի վրա կարող եք գրազ գալ ձեր ամենաբարձր դոլարի վրա, այն է, որ գեներատիվ AI-ի կողմից արտադրված երաժշտությունը խիստ կուսումնասիրվի խախտման համար: Մենք կարծես գիտենք, երբ լսում ենք երաժշտական ​​խախտումներ, թեև նորից սա բարդ իրավական խնդիր է, որը հիմնված չէ միայն այն բանի վրա, թե ինչպես ենք մենք վերաբերվում ընկալվող կրկնօրինակմանը:

Թույլ տվեք ևս մեկ օրինակ.

Տեքստից կոդ գեներացնող AI-ն ձեզ հնարավորություն է տալիս մուտքագրել տեքստային հուշում, և AI-ն ձեզ համար կստեղծի ծրագրավորման կոդ: Այնուհետև կարող եք օգտագործել այս կոդը համակարգչային ծրագիր պատրաստելու համար: Դուք կարող եք օգտագործել կոդը ճիշտ այնպես, ինչպես ստեղծվել է, կամ կարող եք ընտրել խմբագրել և հարմարեցնել կոդը ձեր կարիքներին համապատասխան: Անհրաժեշտ է նաև համոզվել, որ կոդը հարմար է և գործունակ, քանի որ հնարավոր է, որ գեներացված կոդում կարող են առաջանալ սխալներ և կեղծիքներ:

Ձեր առաջին ենթադրությունը կարող է լինել, որ ծրագրավորման կոդը չի տարբերվում տեքստից: Դա պարզապես տեքստ է։ Իհարկե, դա տեքստ է, որն ապահովում է որոշակի նպատակ, բայց դա դեռ տեքստ է:

Դե, ոչ ճշգրիտ: Ծրագրավորման լեզուների մեծ մասը խիստ ձևաչափ և կառուցվածք ունի այդ լեզվի կոդավորման հայտարարությունների բնույթին: Սա ինչ-որ իմաստով շատ ավելի նեղ է, քան ազատ հոսող բնական լեզուն: Դուք որոշ չափով պատկերված եք, թե ինչպես են ձևակերպվում կոդավորման հայտարարությունները: Նմանապես, հայտարարությունների օգտագործման և դասավորության հաջորդականությունը և ձևը որոշակիորեն ընդգրկված են:

Ընդհանուր առմամբ, ծրագրավորման կոդը գրագողության կամ խախտման մասին ցուցադրելու հնարավորությունը գրեթե ավելի հեշտ է, քան բոլոր ասվածները բնական լեզվով: Այսպիսով, երբ գեներատիվ AI-ն գնում է համացանցում ծրագրավորման կոդ սկանավորելու և հետագայում ծրագրավորման կոդ ստեղծելու համար, վիճելու, որ կոդը բացահայտորեն կրկնօրինակվել է, համեմատաբար ավելի համոզիչ կլինեն: Սլեմ դանկ չէ, ուստի ակնկալեք, որ դառը մարտեր են մղվելու դրա վրա:

Իմ հիմնական կետն այն է, որ մենք ունենալու ենք AI-ի էթիկայի և AI օրենքի նույն խնդիրները, որոնք առերեսվում են գեներացնող AI-ի բոլոր եղանակներին:

Գրագողությունը և հեղինակային իրավունքի խախտումը խնդրահարույց կլինեն՝

  • Տեքստ-տեքստ կամ տեքստ-շարադրություն
  • Տեքստ-պատկեր կամ տեքստ-արվեստ
  • Տեքստ-աուդիո կամ տեքստ-երաժշտություն
  • Տեքստից տեսանյութ
  • Տեքստ-կոդ
  • Etc.

Նրանք բոլորը ենթակա են նույն մտահոգություններին: Ոմանք կարող են մի փոքր ավելի հեշտ լինել «ապացուցելը», քան մյուսները: Նրանք բոլորն էլ ունենալու են AI-ի էթիկայի և AI օրենքի հիմնավորման մղձավանջների իրենց բազմազանությունը:

Գրագողության կամ հեղինակային իրավունքի խախտման գործի հարուցում

Քննարկման նպատակների համար եկեք կենտրոնանանք տեքստից տեքստ կամ տեքստից շարադրություն գեներատիվ AI-ի վրա: Ես դա անում եմ մասամբ ChatGPT-ի հսկայական ժողովրդականության պատճառով, որը տեքստից տեքստ գեներացնող AI-ի տեսակն է: Կան շատ մարդիկ, ովքեր օգտագործում են ChatGPT-ն, ինչպես նաև շատ ուրիշներ, որոնք օգտագործում են տարբեր նմանատիպ տեքստային տեքստ գեներացնող AI հավելվածներ:

Արդյո՞ք այն մարդիկ, ովքեր օգտագործում են արհեստական ​​ինտելեկտի գեներացնող հավելվածներ, գիտե՞ն, որ նրանք պոտենցիալ հենվում են գրագողության կամ հեղինակային իրավունքի խախտման վրա:

Թվում է, թե կասկածելի է, որ նրանք անում են:

Ես կհամարձակվեմ ասել, որ գերակշռող ենթադրությունն այն է, որ եթե գեներացնող AI հավելվածը հասանելի է օգտագործման համար, ապա AI ստեղծողը կամ ընկերությունը, որը ներկայացրել է AI-ն, պետք է իմանա կամ վստահ լինի, որ ոչ մի տհաճ բան չկա այն ապրանքների հետ, որոնք իրենք առաջարկում են օգտագործման համար: Եթե ​​դուք կարող եք օգտագործել այն, այն պետք է լինի վերևում:

Եկեք վերանայենք իմ նախկին մեկնաբանությունը այն մասին, թե ինչպես ենք մենք պատրաստվում ապացուցել, որ որոշակի գեներացնող AI-ն աշխատում է սխալ հիմունքներով տվյալների ուսուցման հարցում:

Ես կարող եմ նաև ավելացնել, որ եթե մենք կարողանանք բռնել մեկ գեներատիվ AI-ն, որն անում է դա, ապա մյուսներին բռնելու հնարավորությունները, ամենայն հավանականությամբ, կբարձրանան: Ես չեմ ասում, որ արհեստական ​​ինտելեկտի բոլոր գեներացնող հավելվածները կլինեն նույն նավի մեջ: Բայց նրանք պատրաստվում են հայտնվել բավականին դաժան ծովերում, երբ նրանցից մեկը կպցվի պատին:

Ահա թե ինչու նույնպես անչափ արժանի կլինի հետևել առկա դատավարություններին: Առաջինը, ով հաղթում է հայցվող խախտման հարցում, եթե դա տեղի ունենա, հնարավոր է, որ կործանում և մռայլություն կբերի արհեստական ​​ինտելեկտի այլ գեներացնող հավելվածների համար, եթե որոշ նեղություն չփախչի ավելի լայն խնդիրներից: Նրանք, ովքեր կորցնում են հայցվող խախտումը, անպայման չի նշանակում, որ գեներացնող AI հավելվածները կարող են զանգեր հնչեցնել և տոնել: Կարող է լինել, որ կորուստը վերագրվում է այլ գործոնների, որոնք այնքան էլ չեն համապատասխանում այլ գեներացնող AI հավելվածներին և այլն:

Ես նշել էի, որ եթե մենք վերցնենք 100 բառանոց շարադրություն և փորձենք գտնել այդ բառերը ճիշտ նույն հաջորդականությամբ ինտերնետում, ապա մենք կարող ենք համեմատաբար հիմնավոր դեպք ունենալ գրագողության կամ հեղինակային իրավունքի խախտման համար, մնացած բոլորը հավասար են: Բայց եթե համընկնող բառերի թիվը քիչ է, մենք կարծես բարակ սառույցի վրա ենք:

Ես կցանկանայի ավելի խորանալ դրա մեջ:

Համեմատություն կատարելու ակնհայտ ասպեկտը բաղկացած է ճիշտ նույն բառերից՝ ճիշտ նույն հաջորդականությամբ: Սա կարող է տեղի ունենալ ամբողջ հատվածների համար: Սա հարմար կլինի նկատել, գրեթե այնպես, ինչպես մեզ հանձնել են արծաթե սկուտեղի վրա:

Մենք կարող ենք նաև կասկածել, եթե միայն բառերի մի հատված համընկնի: Գաղափարը կլինի տեսնել, թե արդյոք դրանք կարևոր բառեր են կամ գուցե լրացնող բառեր, որոնք մենք կարող ենք հեշտությամբ հեռացնել կամ անտեսել: Մենք նաև չենք ցանկանում, որ մեզ խաբեն բառերի օգտագործումն իրենց անցյալի կամ ապագա ժամանակով, կամ մեկ այլ թմբիրով: Պետք է հաշվի առնել նաև բառերի այդ տատանումները:

Համեմատության մեկ այլ մակարդակ կլինի այն դեպքում, երբ բառերը մեծ չափով առանձնապես նույն բառերը չեն, բայց նույնիսկ տարբեր վիճակում գտնվող բառերը դեռևս նույն մտքերն են արտահայտում: Օրինակ, ամփոփագրում հաճախ օգտագործվում են միանգամայն նման բառեր որպես սկզբնաղբյուր, բայց մենք կարող ենք նկատել, որ ամփոփագիրը, կարծես, հիմնված է սկզբնական աղբյուրի վրա:

Համեմատության ամենադժվար մակարդակը հիմնված կլինի հասկացությունների կամ գաղափարների վրա: Ենթադրենք, մենք տեսնում ենք մի շարադրություն, որը չունի նույն կամ նման բառերը որպես համեմատության հիմք, բայց էությունը կամ գաղափարները նույնն են։ Մենք, անշուշտ, անցնում ենք կոպիտ տարածքի մեջ: Եթե ​​մենք պատրաստակամորեն ասենք, որ գաղափարները սերտորեն պաշտպանված են, մենք կափարիչ կդնեինք գիտելիքի և գիտելիքի ընդլայնման գրեթե բոլոր ձևերի վրա:

Մենք կարող ենք ևս մեկ անգամ անդրադառնալ Դյուկի համալսարանի հարմար բացատրությանը.

  • «Հեղինակային իրավունքը չի պաշտպանում գաղափարները, միայն գաղափարի կոնկրետ արտահայտությունը: Օրինակ, դատարանը որոշեց, որ Դեն Բրաունը չի խախտել ավելի վաղ գրքի հեղինակային իրավունքը, երբ գրել է The Da Vinci Code քանի որ այն ամենը, ինչ նա փոխառել էր նախորդ աշխատանքից, հիմնական գաղափարներն էին, ոչ թե սյուժեի կամ երկխոսության առանձնահատկությունները: Քանի որ հեղինակային իրավունքը կոչված է խրախուսելու ստեղծագործական արտադրությունը, ուրիշի գաղափարների օգտագործումը նոր և օրիգինալ ստեղծագործություն ստեղծելու համար պաշտպանում է հեղինակային իրավունքի նպատակը, այն չի խախտում այն: Միայն այն դեպքում, եթե մեկը պատճենում է մյուսի արտահայտությունն առանց թույլտվության, հնարավոր է հեղինակային իրավունքի խախտում»:
  • «Մյուս կողմից, գրագողությունից խուսափելու համար պետք է ճանաչել նույնիսկ այն գաղափարների աղբյուրը, որոնք փոխառված են մեկ ուրիշից՝ անկախ նրանից, թե այդ գաղափարների արտահայտությունը փոխառված է նրանց հետ։ Այսպիսով, պարաֆրազը պահանջում է մեջբերում, թեև այն հազվադեպ է բարձրացնում հեղինակային իրավունքի որևէ խնդիր»։

Խնդրում ենք նկատի ունենալ, քանի որ ավելի վաղ պարզվել է կրկնակի խնդիրների կողմերի միջև եղած տարբերությունները:

Այժմ համեմատական ​​մոտեցումները գործնականում կիրառելը մի բան է, որը տեղի է ունենում երկար տարիներ: Մտածեք դրա մասին այսպես. Ուսանողները, ովքեր շարադրություններ են գրում իրենց դպրոցական աշխատանքի համար, կարող են գայթակղվել համացանցից բովանդակություն վերցնելու և ձևացնել, թե իրենք են հեղինակել Պուլիցերյան մրցանակի A դասարանի խոսքերը:

Ուսուցիչները երկար ժամանակ օգտագործում էին գրագողությունը ստուգող ծրագրեր՝ դրանով զբաղվելու համար։ Ուսուցիչը վերցնում է աշակերտի շարադրությունը և այն դնում գրագողության ստուգիչի մեջ: Որոշ դեպքերում մի ամբողջ դպրոց լիցենզիա է տրամադրում գրագողության ստուգման ծրագրի օգտագործումը: Երբ ուսանողները ներկայացնում են շարադրություն, նրանք պետք է նախ ուղարկեն շարադրությունը գրագողության ստուգման ծրագրին: Ուսուցիչը տեղեկացված է, թե ինչ է հաղորդում ծրագիրը:

Ցավոք, դուք պետք է չափազանց զգույշ լինեք, թե ինչ են ասում գրագողությունը ստուգող այս ծրագրերը: Կարևոր է ուշադիր գնահատել, թե արդյոք ներկայացված ցուցումները վավեր են: Ինչպես արդեն նշվեց, աշխատանքը կրկնօրինակված լինելու մասին պարզելու կարողությունը կարող է մշուշոտ լինել: Եթե ​​դուք անմիտ կերպով ընդունում եք ստուգման ծրագրի արդյունքը, կարող եք սուտ կերպով մեղադրել ուսանողին պատճենելու մեջ, երբ նա դա չի արել: Սա կարող է հոգին ջախջախել:

Շարժվելով առաջ՝ մենք կարող ենք փորձել օգտագործել գրագողությունը ստուգող ծրագրեր գեներատիվ AI արդյունքների փորձարկման ոլորտում: Վերաբերվեք գեներացնող AI հավելվածից ստացված շարադրություններին այնպես, կարծես այն գրված է ուսանողի կողմից: Այնուհետև մենք չափում ենք, թե ինչ է ասում գրագողության ստուգիչը: Դա արվում է աղի հատիկով։

Գոյություն ունի վերջին հետազոտական ​​ուսումնասիրություն, որը փորձել է գործառնականացնել այս տեսակի համեմատությունները գեներատիվ AI-ի համատեքստում հենց այս ձևով: Ես կցանկանայի ձեզ հետ ծանոթանալ մի քանի հետաքրքիր բացահայտումների:

Նախ, որոշ լրացուցիչ նախապատմություն է պահանջվում: Generative AI-ն երբեմն կոչվում է LLM (մեծ լեզվական մոդելներ) կամ պարզապես LMs (լեզու մոդելներ): Երկրորդ, ChatGPT-ն հիմնված է մեկ այլ OpenAI գեներատիվ AI փաթեթի վրա, որը կոչվում է GPT-3.5: Մինչ GPT-3.5 կար GPT-3, իսկ դրանից առաջ GPT-2: Մեր օրերում GPT-2-ը համարվում է բավականին պարզունակ՝ համեմատած ավելի ուշ սերիայի հետ, և մենք բոլորս անհամբեր սպասում ենք GPT-4-ի առաջիկա բացահայտմանը, տես իմ քննարկումը. հղումն այստեղ.

Հետազոտական ​​ուսումնասիրությունը, որը ես ուզում եմ համառոտ ուսումնասիրել, բաղկացած էր GPT-2-ի ուսումնասիրությունից: Դա կարևոր է գիտակցել, քանի որ մենք այժմ ավելի հեռու ենք GPT-2-ի հնարավորություններից: GPT-2-ի այս վերլուծության արդյունքների վերաբերյալ որևէ հապճեպ եզրակացություն մի արեք: Այնուամենայնիվ, մենք կարող ենք շատ բան սովորել GPT-2-ի գնահատումից: Ուսումնասիրությունը կրում է «Արդյո՞ք լեզվական մոդելները գրագողություն են անում» խորագիրը։ Jooyoung Lee-ի, Thai Lee-ի, Jinghui Chen-ի և Dongwon Lee-ի կողմից՝ հայտնված ACM WWW '23, մայիսի 1–5, 2023, Օսթին, Տեխաս, ԱՄՆ:

Սա նրանց հիմնական հետազոտական ​​հարցն է.

  • «Որքանո՞վ (չսահմանափակվելով անգիր անելով) LM-ներն օգտագործում են արտահայտությունները կամ նախադասությունները իրենց ուսումնական նմուշներից»:

Նրանք օգտագործել են պոտենցիալ գրագողության այս երեք մակարդակները կամ կատեգորիաները.

  • «Բառացի գրագողություն. բառերի կամ արտահայտությունների ճշգրիտ պատճեններ՝ առանց փոխակերպման»:
  • «Պարաֆրազ գրագողություն. հոմանիշների փոխարինում, բառերի վերադասավորում և/կամ հետադարձ թարգմանություն»:
  • «Գաղափարների գրագողություն. հիմնական բովանդակության ներկայացումը երկարացված ձևով»:

GPT-2-ն իսկապես վերապատրաստվել է ինտերնետ տվյալների վրա և, հետևաբար, հարմար թեկնածու է այս տեսակի վերլուծության համար.

  • «GPT-2-ը նախապես վերապատրաստված է WebText-ում, որը պարունակում է ավելի քան 8 միլիոն փաստաթուղթ՝ վերցված 45 միլիոն Reddit հղումներից: Քանի որ OpenAI-ը հրապարակայնորեն չի թողարկել WebText, մենք օգտագործում ենք OpenWebText, որը WebText կորպուսի բաց կոդով վերականգնում է: Այն հուսալիորեն օգտագործվել է նախկին գրականության կողմից»։

Ընտրովի հիմնական բացահայտումները, ինչպես քաղված են ուսումնասիրությունից, բաղկացած են.

  • «Մենք հայտնաբերեցինք, որ նախապես վերապատրաստված GPT-2 ընտանիքները գրագողություն են անում OpenWebText-ից»:
  • «Մեր բացահայտումները ցույց են տալիս, որ ճշգրտումը զգալիորեն նվազեցնում է OpenWebText-ից բառացի գրագողության դեպքերը»:
  • «Համապատասխան Carlini et al. և Carlini et al., մենք գտնում ենք, որ ավելի մեծ GPT-2 մոդելները (մեծ և xl) սովորաբար ավելի հաճախ են ստեղծում գրագողության հաջորդականություններ, քան փոքրերը»:
  • «Սակայն, տարբեր LM-ներ կարող են ցույց տալ գրագողության տարբեր օրինաչափություններ, և, հետևաբար, մեր արդյունքները չեն կարող ուղղակիորեն ընդհանրացվել այլ LM-ների, ներառյալ ավելի վերջերս LM-ների, ինչպիսիք են GPT-3-ը կամ BLOOM-ը»:
  • «Բացի այդ, գրագողության ավտոմատ դետեկտորները, ինչպես հայտնի է, ունեն բազմաթիվ ձախողման ռեժիմներ (ինչպես կեղծ բացասական, այնպես էլ կեղծ դրական):
  • «Հաշվի առնելով, որ LM-ների վերապատրաստման տվյալների մեծ մասը ջնջվում է համացանցից՝ առանց բովանդակության սեփականատերերին տեղեկացնելու, նրանց բառերի, արտահայտությունների և նույնիսկ հիմնական գաղափարների կրկնությունը վերապատրաստման հավաքածուներից գեներացված տեքստերում ունի էթիկական հետևանքներ»:

Մեզ, անկասկած, այս տեսակի շատ ավելի շատ ուսումնասիրություններ են պետք:

Եթե ​​դուք հետաքրքրված եք, թե ինչպես է GPT-2-ը համեմատվում GPT-3-ի հետ տվյալների ուսուցման հետ կապված, ապա բավականին նկատելի հակադրություն կա:

Ըստ հաղորդված ցուցումների, GPT-3-ի տվյալների ուսուցումը շատ ավելի ընդարձակ էր.

  • «Մոդելը վերապատրաստվել է ինտերնետից տեքստային տվյալների բազաների միջոցով: Սա ներառում էր հսկայական 570 ԳԲ տվյալներ, որոնք ստացվել են գրքերից, վեբ տեքստերից, Վիքիպեդիայից, հոդվածներից և ինտերնետում առկա այլ գրություններից: Ավելի ճշգրիտ լինելու համար, 300 միլիարդ բառ սնվել է համակարգ» (BBC գիտության կենտրոն ամսագիր, «ChatGPT. Այն ամենը, ինչ դուք պետք է իմանաք OpenAI-ի GPT-3 գործիքի մասին» Ալեքս Հյուզի կողմից, փետրվար 2023):

Ձեզանից նրանց համար, ովքեր հետաքրքրված են GPT-3-ի համար տվյալների ուսուցման ավելի խորը նկարագրություններով, ահա մի հատված GitHub-ում տեղադրված պաշտոնական GPT-3 մոդելային քարտից (վերջին թարմացման ամսաթիվը նշված է որպես սեպտեմբեր 2020):

  • «GPT-3 ուսուցման տվյալների բազան կազմված է ինտերնետում տեղադրված տեքստից կամ համացանցում վերբեռնված տեքստից (օրինակ՝ գրքերից): Ինտերնետային տվյալները, որոնց վրա այն վերապատրաստվել և գնահատվել է մինչ օրս, ներառում է. ) ինտերնետի վրա հիմնված երկու գրքերի կորպորա և (1) անգլերեն լեզվով Վիքիպեդիա»։
  • «Հաշվի առնելով իր ուսուցման տվյալները՝ GPT-3-ի արդյունքներն ու կատարումը ավելի շատ են ներկայացնում ինտերնետին միացած բնակչությանը, քան բանավոր, ոչ թվային մշակույթով տոգորվածները: Համացանցին միացած բնակչությունն ավելի շատ զարգացած երկրների ներկայացուցիչ է, հարուստ, երիտասարդ և արական սեռի հայացքներով, և հիմնականում կենտրոնացած է ԱՄՆ-ի վրա: Զարգացած երկրների ավելի հարուստ ազգերն ու բնակչությունը ցույց են տալիս ինտերնետի ավելի մեծ ներթափանցում: Թվային գենդերային բաժանումը ցույց է տալիս նաև, որ աշխարհում ավելի քիչ կանայք են ներկայացված առցանց: Բացի այդ, քանի որ աշխարհի տարբեր մասերում ինտերնետի ներթափանցման և հասանելիության տարբեր մակարդակներ կան, տվյալների բազան չի ներկայացնում ավելի քիչ կապված համայնքները»:

GPT-3-ի մասին վերը նշված ցուցումներից մեկն այն է, որ գեներացնող AI-ն ստեղծողներից մեկն այն է, որ որքան շատ ինտերնետ տվյալներ կարողանաք սկանավորել, գեներատիվ AI-ի բարելավման կամ առաջխաղացման հավանականությունը մեծանում է:

Դուք կարող եք դրան նայել երկու ձևով:

  • 1) Բարելավված AI. Մենք ունենալու ենք գեներատիվ արհեստական ​​ինտելեկտ, որը հնարավորին չափ սողում է համացանցում: Հետաքրքիր արդյունքն այն է, որ գեներացնող AI-ն ավելի լավը կլինի, քան կա: Դա մի բան է, որին պետք է անհամբեր սպասել:
  • 2) Պատճենում է ներուժի առատությունը. Ինտերնետի սկանավորման այս ընդլայնումը տհաճ և գրավիչ կերպով դարձնում է գրագողության և հեղինակային իրավունքի խախտման խնդիրը պոտենցիալ ավելի ու ավելի մեծ: Մինչդեռ նախկինում այդքան շատ բովանդակություն ստեղծողներ չեն ազդվել, չափը գնալով կծաղկի: Եթե ​​դուք իրավաբան եք բովանդակություն ստեղծողների կողմից, դա արցունքներ է բերում ձեր աչքերին (գուցե հիասթափության արցունքներ կամ ուրախության արցունքներ, թե ինչ հեռանկարներ է սա բերում դատական ​​գործընթացների առումով):

Բաժակը կիսալե՞ր է, թե՞ կիսադատարկ։

Դուք որոշում եք:

Օրինական ականները սպասում են

Հարցը, որը դուք կարող եք մտածել, այն է, թե արդյոք ձեր տեղադրված ինտերնետային բովանդակությունը համարվում է արդար խաղ սկանավորման համար: Եթե ​​ձեր բովանդակությունը գտնվում է վճարային պատի հետևում, ենթադրաբար այն սկանավորման թիրախ չէ, քանի որ դրան հեշտությամբ հասանելի չէ՝ կախված վճարային պատի հզորությունից:

Ես կռահեցի, որ առօրյա մարդկանց մեծամասնության բովանդակությունը փակված չէ վճարման պատի հետևում: Նրանք ցանկանում են, որ իրենց բովանդակությունը հանրությանը հասանելի լինի: Նրանք ենթադրում են, որ մարդիկ կնայեն դրան։

Արդյո՞ք ձեր բովանդակությունը հանրությանը հասանելի լինելը նաև աքսիոմատիկորեն նշանակում է, որ դուք հաստատում եք, որ այն սկանավորվի գեներատիվ AI-ի կողմից, որը մշակվում է տվյալների մշակման համար:

Գուցե այո, գուցե ոչ.

Դա այն իրավական հարցերից մեկն է, որոնք պտտվում են:

Վերադառնալով նախկինում բերվածին Բլումբերգի մասին օրենքը հոդվածում հեղինակները նշում են Պայմանների և Պայմանների (T&C) կարևորությունը, որոնք կապված են բազմաթիվ կայքերի հետ.

  • «Իրավական ականը, որը մեծապես անտեսվել է ակամա արհեստական ​​ինտելեկտի ընկերությունների կողմից, որոնք օգտագործում են առցանց բոտեր տվյալների հավաքագրման համար, թաքնված է բոլոր տեսակի հանրային կայքերում սովորաբար հասանելի Պայմաններում և Պայմաններում: Ի տարբերություն ներկայումս չկարգավորված ՄՍ օրենքի և հեղինակային իրավունքի խախտման երկընտրանքի, կայքի Պայմաններն ու Պայմանները ապահովված են լավ հաստատված պայմանագրային օրենքով և սովորաբար կարող են կիրառվել դատարանում՝ հենվելով բավարար նախադեպերի վրա»:

Նրանք ցույց են տալիս, որ ենթադրելով, որ ձեր կայքը ունի արտոնագրման հետ կապված էջ, հավանական է, որ եթե օգտագործեք ստանդարտացված ժամանակակից ձևանմուշ, այն կարող է պարունակել կարևոր կետ.

  • «Հետևաբար, վեբկայքերի համար նախատեսված վեբկայքերի պայմաններն ու պայմանները, որոնք առատորեն հասանելի են անվճար հասանելիությամբ, պարունակում են կետ, որն արգելում է տվյալների ավտոմատացված քերծումը: Ճակատագրի հեգնանքով, նման ազատ հասանելի ձևանմուշները, հավանաբար, օգտագործվել են ChatGPT ուսուցման համար: Հետևաբար, բովանդակության սեփականատերերը կարող են ցանկանալ վերանայել իրենց Պայմաններն ու Պայմանները և զետեղել առանձին դրույթ, որը կտրականապես արգելում է ցանկացած բովանդակության օգտագործումը վեբկայքերից AI ուսուցման կամ հարակից նպատակների համար, անկախ այն բանից՝ հավաքված ձեռքով կամ ավտոմատ կերպով, առանց կայքի սեփականատիրոջ նախնական գրավոր թույլտվության: »:

Լրացուցիչ հարվածը ներառված է բովանդակություն ստեղծողների կողմից իրենց կայքերի վերաբերյալ հնարավոր գործողությունների վերլուծության մեջ.

  • «Հետևաբար, չգրանցման դրույթի յուրաքանչյուր խախտման համար հարկադիր լուծարված վնասների փոխհատուցման դրույթի ներդրումը, որը ընդլայնված է արգելանքով առանց պարտատոմսի դրույթով, կարող է կայուն լուծում լինել ստեղծագործական բովանդակության այն հեղինակների համար, ովքեր չեն ցանկանում ապահովել իրենց պտուղները: ինտելեկտուալ աշխատանք արհեստական ​​ինտելեկտի ուսուցման նպատակներով՝ առանց դրա համար վարձատրվելու կամ, գոնե, իրենց աշխատանքի համար պատշաճ գնահատական ​​տալու»:

Դուք կարող եք խորհրդակցել ձեր փաստաբանի հետ այս մասին:

Ոմանք ասում են, որ սա կենսական միջոց է փորձելու և AI ստեղծողներին ասելու, որ բովանդակություն ստեղծողները մեծապես լրջորեն են վերաբերվում իրենց բովանդակությունը պաշտպանելուն: Համոզվելով, որ ձեր լիցենզավորումն ունի պատշաճ ձևակերպում, թվում է, որ AI ստեղծողներին ուշադրություն կդարձնի:

Մյուսները, թեև մի փոքր վատն են: Նրանք վհատված ասում են, որ դուք կարող եք շարունակել ձեր վեբկայքում տեղադրել ամենակոշտ և մահաբեր իրավական լեզուն, բայց ի վերջո, AI ստեղծողները պատրաստվում են սկանավորել այն: Դուք չեք իմանա, որ նրանք այդպես են վարվել: Դուք կունենաք ժամանակի սատանան, որը ապացուցում է, որ նրանք արել են: Դուք դժվար թե հայտնաբերեք, որ դրանց արդյունքները արտացոլում են ձեր բովանդակությունը: Դժվար պայքար է, որը դուք չեք հաղթելու:

Հակափաստարկն այն է, որ դուք հանձնում եք ճակատամարտը դեռ չսկսված։ Եթե ​​դուք գոնե բավարար իրավական լեզու չունեք, և եթե երբևէ բռնեք նրանց, նրանք կշարժվեն և կթողնեն իրենց ճանապարհը՝ խուսափելու ցանկացած պատասխանատվությունից: Բոլորը, քանի որ դուք չեք տեղադրել ճիշտ տեսակի իրավաբանական լեզու:

Միևնույն ժամանակ, մեկ այլ մոտեցում, որը ձգտում է ձգողականություն ձեռք բերել, բաղկացած կլինի նշագծման ձեր կայքը մի բանով, որը ասում է, որ կայքը չպետք է սկանավորվի գեներատիվ AI-ի միջոցով: Գաղափարն այն է, որ կստեղծվի ստանդարտացված մարկեր: Կայքերը, ենթադրաբար, կարող են նշիչը ավելացնել իրենց կայքում: AI ստեղծողներին պետք է ասվի, որ նրանք պետք է փոխեն իրենց տվյալների սկանավորումը՝ բաց թողնելով նշված կայքերը:

Կարո՞ղ է մարկերային մոտեցումը հաջողակ լինել: Մտահոգությունները ներառում են մարկերների ձեռքբերման և տեղադրման ծախսերը: Բացի այդ, AI ստեղծողները կհետևեն նշիչներին և կապահովեն, որ նրանք խուսափեն նշված կայքերի սկանավորումից: Մեկ այլ հեռանկար այն է, որ նույնիսկ եթե արհեստական ​​ինտելեկտ ստեղծողները չեն համընկնում գծանշումների հետ, սա ևս մեկ հուշում է դատարան դիմելու և պնդելու, որ բովանդակության ստեղծողը վերջին մղոնն է անցել՝ փորձելով և զգուշացնել AI սկանավորման մասին:

Այո, այդ ամենը ստիպում է ձեր գլուխը պտտվել:

Եզրափակում

Վերջնական մի քանի դիտողություն այս փշոտ թեմայի վերաբերյալ.

Պատրա՞ստ եք այս ամբողջ արհեստական ​​ինտելեկտի վերաբերյալ խելամիտ հայացքի համար որպես գրագող և հեղինակային իրավունքը խախտող երկընտրանք:

Գրագողության կամ հեղինակային իրավունքի խախտման ակտով գեներատիվ ինտելեկտը «բռնելու» մասին ենթադրությունների մեծ մասը կախված է արդյունքների հայտնաբերումից. շատ նման է նախորդ աշխատանքներ, ինչպիսիք են բովանդակությունը ինտերնետում, որը հնարավոր է սկանավորվել տվյալների ուսուցման ընթացքում:

Ենթադրենք, թեև այստեղ գործում է բաժանիր և տիրիր հնարքը:

Ահա թե ինչ նկատի ունեմ:

Եթե ​​գեներատիվ AI-ն փոխառում է մի փոքր մասն այստեղից և մի փոքր քիչ այնտեղից, ի վերջո դրանք խառնելով ինչ-որ կոնկրետ արդյունք ստանալու համար, ապա շանսերը, որ կարողանանք ունենալ խելահեղ պահ, ահավոր կնվազեն: Ցանկացած արդյունք, կարծես, չի բարձրանա այն բավարար շեմին, որը դուք կարող եք վստահորեն ասել, որ այն վերցված է մեկ կոնկրետ աղբյուրից: Ստացված շարադրությունը կամ ելքի այլ եղանակները միայն կոտորակային են համընկնում: Եվ սովորական մոտեցմամբ՝ փորձելով վիճարկել, որ տեղի է ունեցել գրագողություն կամ հեղինակային իրավունքի խախտում, դուք սովորաբար պետք է ցուցադրեք ավելին, քան ինչ-որ փոքր կտոր է խաղում, հատկապես, եթե պատառը առանձնահատուկ չէ և կարելի է լայնորեն գտնել ինտերնետում (թերկապված յուրացումն ապացուցելու որևէ համարժեք բեռ):

Կարո՞ղ եք դեռևս համոզիչ կերպով հայտարարել, որ գեներացնող արհեստական ​​ինտելեկտի կողմից տվյալների ուսուցումը կոտրել է կայքերը և բովանդակություն ստեղծողները, նույնիսկ եթե առաջարկվող ապացույցն առերեւույթ ոչ էական համամասնություն է:

Մտածեք այդ մասին:

Եթե ​​մենք բախվում ենք մասշտաբով պոտենցիալ գրագողության և մասշտաբով հեղինակային իրավունքի խախտման, մենք գուցե կարիք ունենանք փոխել մեր մոտեցումը՝ սահմանելու, թե ինչ է նշանակում գրագողություն և/կամ հեղինակային իրավունքի խախտում: Թերևս կա գրագողության կամ հեղինակային իրավունքի խախտման դեպք հիմնականում կամ ընդհանրապես: Խճանկարը, որը բաղկացած է հազարավոր կամ միլիոնավոր մանր հատվածներից, կարող է մեկնաբանվել որպես այդպիսի խախտումներ: Այնուամենայնիվ, ակնհայտ խնդիրն այն է, որ դա կարող է ստիպել բոլոր տեսակի բովանդակությունը հանկարծակի հայտնվել խախտումների հովանու տակ: Սա կարող է լինել սայթաքուն լանջ:

Ծանր մտքեր.

Խոսելով ծանր մտքերի մասին՝ լեգենդար գրող Լև Տոլստոյը հայտնի է. «Կյանքի միակ իմաստը մարդկությանը ծառայելն է»։

Եթե ​​ձեր կայքը և ուրիշների կայքերը սկանավորվում են արհեստական ​​ինտելեկտի բարելավման համար, և թեև դուք դրա համար ոչ մի լումա չեք ստանում, կարո՞ղ եք հանդիսավոր մխիթարություն ունենալ այն հավատքով, որ դուք նպաստում եք մարդկության ապագային: Թվում է, թե դա վճարելու փոքր գին է:

Դե, եթե պարզվի, որ AI-ն սարսափելի էկզիստենցիալ ռիսկն է, որը ջնջում է բոլոր մարդկանց գոյությունից: Դուք չպետք է դրա համար արժանին մատուցեք: Ես ենթադրում եմ, որ դուք անմիջապես չեք նպաստի այդ սարսափելի արդյունքին: Մի կողմ դնելով այդ աղետալի կանխատեսումը, դուք կարող եք մտածել, որ եթե AI ստեղծողները գումար են վաստակում իրենց գեներացնող AI-ից, և թվում է, թե նրանք հաճույք են ստանում շահույթից, դուք նույնպես պետք է ստանաք կարկանդակի մի կտոր: Կիսվեք և կիսվեք նույն ձևով: AI ստեղծողները պետք է թույլտվություն խնդրեն սկանավորելու ցանկացած վեբ կայք, այնուհետև բանակցել այն գնի մասին, որը պետք է վճարվի սկանավորումն իրականացնելու թույլտվություն ստանալու համար:

Վարկ տվեք այնտեղ, որտեղ վարկը հասանելի է:

Եկեք առայժմ վերջին խոսքը տանք սըր Ուոլթեր Սքոթին. «Օ՜, ինչ խճճված ցանց ենք հյուսում: Երբ առաջին անգամ մենք սովորում ենք խաբել»:

Սա միգուցե կիրառելի է, եթե կարծում եք, որ խաբեությունը տեղի է ունենում, կամ գուցե չի կիրառվում, եթե կարծում եք, որ ամեն ինչ լավ է և միանգամայն պարզ և օրինական: Խնդրում եմ, մեծահոգաբար գնահատեք ինքներդ ձեզ այս մասին մտածելու համար: Դու արժանի ես դրան.

Աղբյուր՝ https://www.forbes.com/sites/lanceeliot/2023/02/26/legal-doomsday-for-generative-ai-chatgpt-if-caaught-plagiarizing-or-infringing-warns-ai-ethics- և-աի-օրենք/