Правен суден ден за генеративен разговор за вештачка интелигенција, GPT, ако биде фатен како плагијат или прекршува, предупредува за етика и закон за вештачка интелигенција

Дали генеративната вештачка интелигенција, како што е ChatGPT, ги откинува нашите веб-локации и содржината создадена од човекот? Бидете свесни, бидете … [+] вознемирени, бидете подготвени.

Getty

Дајте кредит таму каде што ви следува кредит.

Тоа е малку мудра мудрост во која можеби сте израснати да верувате. Навистина, некој претпоставува или замислува дека сите донекаде разумно би можеле да се согласиме дека ова е фер и разумно правило во животот. Кога некој прави нешто што заслужува признание, погрижете се да го добие заслуженото признание.

Спротивното гледиште би изгледало многу помалку привлечно.

Ако некој одеше наоколу инсистирајќи дека кредитот треба не да биде признаен кога ќе доспее кредитот, па, може да тврдите дека таквото верување е неучтиво и можеби прикриено. Честопати се наоѓаме себеси бурно вознемирени кога ќе се измами заслугата за некој што постигнал нешто значајно. Се осмелувам да кажам дека особено не навредуваме кога другите лажно ја земаат заслугата за работата на другите. Тоа е вознемирувачки двоен удар. На лицето кое требало да ја добие заслугата му се ускратува моментот на сонце. Покрај тоа, измамникот ужива во центарот на вниманието, иако погрешно нè залажуваат да ги присвоиме нашите поволни наклонетости.

Зошто целиот овој дискурс за прибирање заслуги на најправилните начини и избегнување на погрешни и презирни начини?

Затоа што се чини дека се соочуваме со слична неволја кога станува збор за најновото во Вештачката интелигенција (ВИ).

Да, тврдењата се дека ова се случува демонстративно преку тип на вештачка интелигенција познат како Генеративна АИ. Многу се пишува дека Генеративната вештачка интелигенција, најжешката вештачка интелигенција во вестите овие денови, веќе ја презеде заслугата за она за што не заслужува. И ова веројатно ќе се влоши бидејќи генеративната вештачка интелигенција се повеќе се шири и користи. Се повеќе и повеќе се заслуга на генеративната вештачка интелигенција, додека, за жал, оние кои богато ја заслужуваат вистинската заслуга се оставени во прашина.

Мојот понуден начин јасно да го означам овој наводен феномен е преку две прекрасни фрази:

1) Плагијат на скала
2) Повреда на авторски права на размер

Претпоставувам дека можеби сте свесни за генеративната вештачка интелигенција поради широко популарната апликација за вештачка интелигенција позната како ChatGPT која беше објавена во ноември од OpenAI. Ќе кажам повеќе за генеративната вештачка интелигенција и ChatGPT за момент. Издржи.

Ајде веднаш да дојдеме до суштината на она што ги добива козите на луѓето, како да се каже.

Некои жестоко се жалат дека генеративната вештачка интелигенција потенцијално ги уништува луѓето што создале содржина. Гледате, повеќето генеративни апликации за вештачка интелигенција се податоци обучени со испитување на податоците пронајдени на Интернет. Врз основа на тие податоци, алгоритмите можат да усовршат огромна внатрешна мрежа за совпаѓање на шаблони во апликацијата за вештачка интелигенција која последователно може да произведе навидум нова содржина која неверојатно изгледа како да е смислена од човечка рака, а не од автоматизација.

Овој извонреден подвиг во голема мера се должи на користењето на Интернет скенирана содржина. Без обемот и богатството на содржините на Интернет како извор за обука на податоци, генеративната вештачка интелигенција би била прилично празна и би била од мал или никаков интерес да се користи. Со тоа што вештачката интелигенција испитува милиони и милиони онлајн документи и текстови, заедно со сите видови поврзани содржини, совпаѓањето на шаблонот постепено се изведува за да се обиде да имитира содржина произведена од човекот.

Колку повеќе се испитува содржината, шансите се дека совпаѓањето на шаблонот ќе биде посилно усовршено и уште подобро во мимикријата, а сè друго ќе биде еднакво.

Еве го прашањето од милони долари:

Големо прашање: Ако вие или другите имате содржина на Интернет за која е обучена некоја генеративна апликација за вештачка интелигенција, што го прави тоа веројатно без ваша директна дозвола и можеби целосно без ваша свест, дали имате право на дел од колачот за која било вредност што произлегува од таа генеративна обука за податоци со вештачка интелигенција?

Некои жестоко тврдат дека единствениот соодветен одговор е Да, особено што тие креатори на човечки содржини навистина го заслужуваат нивното намалување на акцијата. Работата е во тоа што ќе ви биде тешко да најдете некој што го добил својот фер дел, а уште полошо, речиси никој не добил никаков удел. На креаторите на интернет содржини кои неволно и несвесно придонеле, во суштина им се ускратува нивната вистинска заслуга.

Ова може да се окарактеризира како грозно и срамотно. Само што поминавме низ распакувањето на мудрската мудрост дека заслугата треба да се даде онаму каде што се должи. Во случај на генеративна вештачка интелигенција, очигледно не е така. Се чини дека долгогодишното и доблесно правило за заслугите е бесчувствително прекршено.

Уф, возвраќањето оди, целосно ја претеруваш и погрешно ја прикажуваш ситуацијата. Секако, генеративната вештачка интелигенција ја испитуваше содржината на Интернет. Секако, ова беше многу корисно како дел од обуката за податоци на генеративната вештачка интелигенција. Мора да се признае, импресивните генеративни апликации за вештачка интелигенција денес не би биле толку импресивни без овој разгледуван пристап. Но, отидовте предалеку кога велите дека на креаторите на содржината треба да им се додели одредена привидна заслуга.

Логиката е следна. Луѓето излегуваат на Интернет и учат работи од Интернет, правејќи го тоа рутински и без никаква врева по себе. Лицето што чита блогови за водовод, а потоа прекумерно гледа бесплатно достапни видеа за поправање водовод, може следниот ден да излезе и да добие работа како водоводџија. Дали треба да дадат дел од нивната дознака поврзана со водоводот на блогерот кој напишал за тоа како да водоводи мијалник? Дали треба да му дадат такса на блогерот што го направи видеото во кое ги прикажува чекорите за да се поправи кадата што протекува?

Речиси сигурно не.

Обуката за податоци на генеративната вештачка интелигенција е само средство за развивање шеми. Сè додека резултатите од генеративната вештачка интелигенција не се обична регургитација на она што е испитувано, може убедливо да тврдите дека тие „научиле“ и затоа не подлежат на давање специфични кредити на кој било конкретен извор. Освен ако не можете да ја фатите генеративната вештачка интелигенција при извршување на точна регургитација, индикациите се дека вештачката интелигенција се генерализирала надвор од кој било одреден извор.

Никому не му се должи заслуга. Или, се претпоставува, може да се каже дека заслугите одат на сите. Заслугата ја добива колективниот текст и другите содржини на човештвото што се наоѓаат на Интернет. Сите ја добиваме заслугата. Бесмислено е да се обидувате прецизно да ја одредите заслугата на одреден извор. Бидете радосни што вештачката интелигенција напредува и дека човештвото ќе има корист. Тие објави на Интернет треба да се чувствуваат почестени што придонеле за иднината на напредок во вештачката интелигенција и како тоа ќе му помага на човештвото за вечност.

Ќе имам повеќе да кажам за двете спротивставени ставови.

Во меѓувреме, дали се приклонувате кон таборот кој вели дека заслугите се доспеани и задоцнети за оние што имаат веб-страници на Интернет, или сметате дека спротивната страна која вели дека креаторите на интернет содржини се решително не да се откине дали е поцврсто држење на телото?

Енигма и загатка се заглавени заедно.

Ајде да го распакуваме ова.

Во денешната колумна, ќе се осврнам на овие изразени грижи дека генеративната вештачка интелигенција во суштина претставува плагијат или евентуално кршење на авторските права на содржината што е објавена на Интернет (се смета за право на интелектуална сопственост или прашање на ИП). Ќе ја разгледаме основата за овие несогласувања. Повремено ќе се осврнам на ChatGPT за време на оваа дискусија, бидејќи тоа е горилата од 600 фунти на генеративната вештачка интелигенција, иако имајте на ум дека има многу други генеративни апликации за вештачка интелигенција и тие генерално се засноваат на истите општи принципи.

Во меѓувреме, можеби се прашувате што е всушност генеративната вештачка интелигенција.

Ајде прво да ги покриеме основите на генеративната вештачка интелигенција, а потоа можеме внимателно да ја разгледаме актуелната материја.

Во сето ова доаѓа голем број на размислувања за етика на вештачката интелигенција и закон за вештачка интелигенција.

Имајте предвид дека постојат тековни напори за вградување на етичките принципи на вештачка интелигенција во развојот и спроведувањето на апликациите за вештачка интелигенција. Растечкиот контингент на загрижени и некогашни етичари за вештачка интелигенција се обидуваат да обезбедат дека напорите за осмислување и усвојување на вештачката интелигенција го земаат предвид погледот на правење AI за добро и избегнување AI за лошо. Слично на тоа, има предложени нови закони за вештачка интелигенција кои се опфатени како потенцијални решенија за спречување на напорите за вештачка интелигенција да не се мешаат во однос на човековите права и слично. За моето тековно и опширно покривање на етиката на вештачката интелигенција и законот за вештачка интелигенција, видете врската овде врската овде, само за да именуваме неколку.

Развојот и објавувањето на етичките прописи за вештачка интелигенција се спроведуваат за да се надеваме да се спречи општеството да падне во огромен број стапици што предизвикуваат вештачка интелигенција. За моето покривање на етичките принципи за вештачка интелигенција на ОН како што е смислено и поддржано од речиси 200 земји преку напорите на УНЕСКО, види врската овде. На сличен начин, се истражуваат нови закони за вештачка интелигенција за да се обидат да ја задржат вештачката интелигенција на изедначена рамнина. Еден од најновите преземања се состои од збир на предложени АИ Бил за права што Белата куќа на САД неодамна ги објави за да ги идентификува човековите права во ера на вештачка интелигенција, види врската овде. Потребно е едно село за да ги задржи програмерите на вештачката интелигенција и вештачката интелигенција на вистинскиот пат и да ги одврати намерните или случајните прикриени напори што може да го поткопаат општеството.

Во оваа дискусија ќе ги преплетам размислувањата за етика на вештачката интелигенција и Законот за вештачка интелигенција.

Основи на генеративната вештачка интелигенција

Најпознатиот пример на генеративна вештачка интелигенција е претставена со апликација за вештачка интелигенција наречена ChatGPT. ChatGPT се појави во јавната свест уште во ноември кога беше објавен од истражувачката компанија за вештачка интелигенција OpenAI. Оттогаш ChatGPT собра огромни наслови и неверојатно ги надмина доделените петнаесет минути слава.

Претпоставувам дека веројатно сте слушнале за ChatGPT или можеби дури и знаете некој што го користел.

ChatGPT се смета за генеративна апликација за вештачка интелигенција бидејќи зема како влез некој текст од корисникот, а потоа генерира или произведува излез кој се состои од есеј. Вештачката интелигенција е генератор на текст-во-текст, иако јас ја опишувам вештачката интелигенција како генератор на текст-во-есеј бидејќи тоа полесно појаснува за што најчесто се користи. Можете да ја користите генеративната вештачка интелигенција за да составите долги композиции или можете да ја натерате да дава прилично кратки тесни коментари. Сè е на ваша желба.

Сè што треба да направите е да внесете известување и апликацијата за вештачка интелигенција ќе генерира за вас есеј што ќе се обиде да одговори на вашето барање. Составениот текст ќе изгледа како есејот да е напишан од човечка рака и ум. Ако внесете известување што вели „Кажи ми за Абрахам Линколн“, генеративната вештачка интелигенција ќе ви обезбеди есеј за Линколн. Постојат и други начини на генеративна вештачка интелигенција, како што се текст-во-уметност и текст-во-видео. Овде ќе се фокусирам на варијацијата од текст во текст.

Вашата прва мисла може да биде дека оваа генеративна способност не изгледа толку голема работа во однос на производството на есеи. Можете лесно да направите онлајн пребарување на Интернет и лесно да најдете тони и тони есеи за претседателот Линколн. Најважното во случајот со генеративната вештачка интелигенција е тоа што генерираниот есеј е релативно уникатен и обезбедува оригинална композиција наместо копирање. Ако се обидете да го пронајдете есејот изработен од вештачка интелигенција некаде на интернет, тешко дека ќе го откриете.

Генеративната вештачка интелигенција е претходно обучена и користи сложена математичка и пресметковна формулација што е поставена со испитување на обрасци во пишани зборови и приказни низ мрежата. Како резултат на испитување на илјадници и милиони пишани пасуси, вештачката интелигенција може да исфрли нови есеи и приказни кои се мешавина од она што е пронајдено. Со додавање на различни веројатни функционалности, добиениот текст е прилично уникатен во споредба со она што е користено во комплетот за обука.

Постојат бројни грижи за генеративната вештачка интелигенција.

Еден клучен недостаток е тоа што есеите произведени од апликација за вештачка интелигенција заснована на генерација може да имаат вградени различни невистини, вклучително очигледно невистинити факти, факти кои се прикажани на заблуда и очигледни факти кои се целосно измислени. Тие фабрикувани аспекти често се нарекуваат форма на Халуцинации со вештачка интелигенција, фраза што не ми се допаѓа, но за жал се чини дека сепак добива популарно внимание (за моето детално објаснување зошто ова е лоша и несоодветна терминологија, видете ја мојата покриеност на врската овде).

Друга грижа е тоа што луѓето лесно можат да ја преземат заслугата за генеративен есеј произведен од вештачка интелигенција, и покрај тоа што самите не го составиле есејот. Можеби сте слушнале дека наставниците и училиштата се прилично загрижени за појавата на генеративни апликации за вештачка интелигенција. Студентите можат потенцијално да користат генеративна вештачка интелигенција за да ги напишат нивните доделени есеи. Ако ученикот тврди дека есејот е напишан со своја рака, мали се шансите наставникот да може да препознае дали наместо тоа е фалсификуван од генеративна вештачка интелигенција. За мојата анализа на овој збунувачки аспект на ученикот и наставникот, видете го моето покривање на врската овде врската овде.

Имаше некои луди големи тврдења на социјалните мрежи за Генеративна АИ тврдејќи дека оваа најнова верзија на ВИ е всушност чувствителна вештачка интелигенција (не, грешат!). Оние кои се во етика за вештачка интелигенција и Законот за вештачка интелигенција се особено загрижени за овој растечки тренд на распространети барања. Можеби учтиво ќе кажете дека некои луѓе преценуваат што всушност може да направи денешната вештачка интелигенција. Тие претпоставуваат дека вештачката интелигенција има способности што сè уште не сме можеле да ги постигнеме. Тоа е жално. Уште полошо, тие можат да си дозволат себе си и другите да влезат во страшни ситуации поради претпоставката дека вештачката интелигенција ќе биде чувствителна или слична на човекот за да може да преземе акција.

Не ја антропоморфизирајте вештачката интелигенција.

Со тоа ќе бидете фатени во леплива и непријатна замка за потпирање на очекување од вештачката интелигенција да прави работи што не може да ги изврши. Со тоа што е кажано, најновата во генеративната вештачка интелигенција е релативно импресивна за она што може да го направи. Сепак, бидете свесни дека постојат значителни ограничувања што треба постојано да ги имате на ум кога користите која било генеративна апликација за вештачка интелигенција.

Едно последно предупредување засега.

Што и да видите или прочитате во генеративниот одговор на вештачката интелигенција Изгледа да бидат пренесени како чисто фактички (датуми, места, луѓе итн.), погрижете се да останете скептични и да бидете спремни двојно да го проверите она што го гледате.

Да, датумите може да се измислуваат, местата може да се измислуваат, а елементите за кои обично очекуваме да бидат над срам се сите предмет на сомнежи. Не верувајте во она што го читате и внимавајте на скептицизмот кога ги испитувате есеите или резултатите од генеративната вештачка интелигенција. Ако генеративната апликација за вештачка интелигенција ви каже дека Абрахам Линколн летал низ земјата со својот приватен авион, несомнено би знаеле дека ова е неволја. За жал, некои луѓе можеби нема да сфатат дека млазниците не постоеле во негово време, или можеби знаат, но не успеваат да забележат дека есејот го прави ова дрско и безобразно лажно тврдење.

Силна доза на здрав скептицизам и постојан начин на размислување на неверување ќе бидат вашата најдобра предност кога користите генеративна вештачка интелигенција.

Подготвени сме да преминеме во следната фаза од ова разјаснување.

Интернетот и генеративната вештачка интелигенција се заедно

Сега кога имате привид на тоа што е генеративна вештачка интелигенција, можеме да го истражиме вознемирувачкото прашање дали генеративната вештачка интелигенција правично или неправедно „искористува“, или некои би рекле бесрамно искористувајќи Интернет содржини.

Еве ги моите четири витални теми поврзани со оваа работа:

1) Двојна неволја: плагијат и прекршување на авторските права
2) Ќе се обиде да се докаже плагијат или прекршување на авторските права
3) Изработка на случај за плагијат или повреда на авторските права
4) Очекуваат легални нагазни мини

Ќе ја опфатам секоја од овие важни теми и ќе предложам проникливи размислувања за кои сите треба внимателно да размислуваме. Секоја од овие теми е составен дел на поголема загатка. Не можете да погледнете само едно парче. Ниту, пак, можете да погледнете кое било парче изолирано од другите парчиња.

Ова е сложен мозаик и на целата загатка треба да и се даде соодветно хармонично разгледување.

Двојна неволја: плагијат и прекршување на авторските права

Двојната неволја со која се соочуваат оние што создаваат и полеваат генерирачка вештачка интелигенција е дека нивните производи можеби прават две лоши работи:

1) Плагијат. Генеративната вештачка интелигенција може да се толкува како плагијат содржина што постои на Интернет според скенирањето на Интернет што се случи за време на обуката за податоци на вештачката интелигенција.
2) Повреда на авторски права. Генеративната вештачка интелигенција може да се тврди како претпријатие кршење на авторските права поврзани со содржината на Интернет што била скенирана за време на обуката за податоци.

Да се разјасни, има многу повеќе содржина на Интернет отколку што всушност обично се скенира за обука за податоци за генеративна вештачка интелигенција. Обично се користи само мал дел од Интернетот. Така, можеме да претпоставиме дека секоја содржина што не била скенирана за време на обуката за податоци нема посебно говедско месо со генеративна вештачка интелигенција.

Ова е донекаде дискутабилно, бидејќи потенцијално може да нацртате линија што поврзува друга содржина што била скенирана со содржина што не била скенирана. Исто така, уште една важна одредба е дека дури и ако има содржина што не е скенирана, сепак може да се тврди дека е плагијат и/или прекршени авторски права доколку излезите од генеративната вештачка интелигенција се појавуваат на истиот збор. Поентата ми е дека во сето ова има многу мрзливост.

Крајна линија: Генеративната вештачка интелигенција е преполна со потенцијални правни загатки за етички и закон за вештачка интелигенција кога станува збор за плагијат и кршење на авторските права поддршка на преовладувачките практики за обука на податоци.

Досега, креаторите на вештачка интелигенција и истражувачите на вештачката интелигенција скејтуваа низ оваа речиси без шкотска, и покрај наѕирниот и несигурно виси меч што виси над нив. Против овие практики до денес се покренати само неколку тужби. Можеби сте слушнале или виделе написи за вести за такви правни дејствија. Една од нив, на пример, ги вклучува фирмите за текст во слика на Midjourney и Stability AI за кршење на уметничката содржина објавена на Интернет. Друга повлекува прекршување на текст во код против GitHub, Microsoft и OpenAI поради софтверот Copilot кој произведува апликации за вештачка интелигенција. Getty Images, исто така, има за цел да тргне по Stability AI за прекршување текст-на-слика.

Може да очекувате дека ќе бидат поднесени уште вакви тужби.

Во моментов, малку е шанса да се покренат тие тужби бидејќи исходот е релативно непознат. Дали судот ќе застане на страната на креаторите на вештачката интелигенција или ќе бидат победници оние кои веруваат дека нивната содржина била неправедно искористена? Скапата правна битка е секогаш сериозна работа. Трошењето на големи правни трошоци треба да се одмери наспроти шансите за победа или губење.

Изгледа дека креаторите на вештачката интелигенција немаат речиси никаков избор освен да се борат. Кога би се попуштиле, макар и малку, шансите се дека ќе произлезе порој од дополнителни тужби (во суштина, отворајќи ја вратата за зголемени шанси да преовладуваат и други). Штом ќе има легална крв во водата, преостанатите легални ајкули ќе брзаат до сметаната „лесна оценка“ и сигурно ќе се случи лоша и тепачка монетарна крвопролевање.

Некои веруваат дека треба да донесеме нови закони за вештачка интелигенција кои ќе ги заштитат креаторите на вештачката интелигенција. Заштитата може да биде дури и ретроактивна. Основата за ова е дека ако сакаме да видиме генеративен напредок на вештачката интелигенција, треба да им дадеме на креаторите на вештачката интелигенција одредена писта за безбедна зона. Откако тужбите ќе почнат да постигнуваат победи против производителите на вештачка интелигенција, ако тоа се случи (сè уште не знаеме), загриженоста е дека генеративната вештачка интелигенција ќе испари бидејќи никој нема да биде подготвен да им даде поддршка на фирмите за вештачка интелигенција.

Како што умешно беше истакнато во неодамнешното парче од Законот за Блумберг со наслов „ChatGPT: IP, сајбер безбедност и други правни ризици на генеративната вештачка интелигенција“ од д-р Илија Колоченко и Гордон Плат, Законот за Блумберг, февруари 2023 година, еве два витални извадоци кои ги повторуваат овие гледишта:

„Сега беснее жестока дебата меѓу американските правници и професорите по право на ИС за тоа дали неовластеното стругање и последователната употреба на податоци заштитени со авторски права претставува прекршување на авторските права. Доколку преовладува ставот на правните практичари кои гледаат прекршувања на авторските права во таквата практика, корисниците на таквите системи за вештачка интелигенција исто така може да бидат одговорни за секундарно прекршување и потенцијално да се соочат со правни последици“.
„За сеопфатно да се справат со предизвикот, законодавците треба да размислат не само за модернизирање на постојното законодавство за авторски права, туку и за имплементација на збир на закони и прописи специфични за вештачката интелигенција“.

Потсетиме дека како општество воведовме правна заштита за проширување на Интернет, како што сега сведочи Врховниот суд кој го разгледува познатиот или озлогласениот Дел 230. Така, се чини во разум и преседан дека можеби сме подготвени да направиме некоја слична заштита за унапредување на генеративната вештачка интелигенција. Можеби заштитата би можела да се постави привремено, што ќе истече откако генеративната вештачка интелигенција ќе достигне одредено однапред одредено ниво на владеење. Може да се смислат и други заштитни одредби.

Наскоро ќе ја објавам мојата анализа за тоа како проценката на Врховниот суд и конечната одлука за Дел 230 може да влијаат на појавата на генеративната вештачка интелигенција. Бидете во потрага по претстојното објавување!

Назад на жестоко изразеното мислење дека треба да дадеме простор за општествената технолошка иновација позната како генеративна вештачка интелигенција. Некои би рекле дека дури и ако наводното прекршување на авторските права има или се случува, општеството како целина треба да биде подготвено да го дозволи тоа за специфичните цели на унапредување на генеративната вештачка интелигенција.

Се надеваме дека новите закони за вештачка интелигенција ќе бидат внимателно изработени и прилагодени на деталите поврзани со обуката за податоци за генеративна вештачка интелигенција.

Има многу контрааргументи за овој поим за осмислување нови закони за вештачка интелигенција за оваа цел. Една загриженост е дека секој таков нов закон за вештачка интелигенција ќе ги отвори вратите за секаков вид прекршување на авторските права. Ќе се жалиме на денот кога дозволивме таквите нови закони за вештачка интелигенција да стапат во книгите. Без разлика колку напорно се обидувате да го ограничите ова само на обука за податоци со вештачка интелигенција, другите подмолно или паметно ќе најдат дупки што ќе претставуваат неограничено и неконтролирано кршење на авторските права.

Заокружете ги аргументите.

Еден аргумент кој особено не држи вода е поврзан со обидот да се тужи самата вештачка интелигенција. Забележете дека јас се осврнував на создавачот на ВИ или истражувачите на вештачката интелигенција како виновни засегнати страни. Тоа се луѓе и компании. Некои сугерираат дека треба да ја насочиме вештачката интелигенција како страна што треба да биде тужена. Во мојата колумна нашироко разговарав дека сè уште не и припишуваме правно лице на вештачката интелигенција, види врската овде на пример, и на тој начин таквите тужби насочени кон вештачката интелигенција сама по себе ќе се сметаат за бесмислени во моментов.

Како додаток на прашањето кој или што треба да се тужи, ова отвора уште една сочна тема.

Да претпоставиме дека одредена генеративна апликација за вештачка интелигенција е смислена од некој производител на вештачка интелигенција што ќе ја наречеме компанија за виџети. Компанијата за виџети е релативно мала по големина и нема многу приходи, ниту пак многу средства. Со тужба против нив веројатно нема да се соберат големото богатство што некој би можел да го бара. Најмногу, само ќе го имаш задоволството да го исправиш она што го сметаш за погрешно.

Сакате да тргнете по големата риба.

Еве како тоа ќе настане. Производителот на вештачка интелигенција одлучува да ја направи својата генеративна вештачка интелигенција достапна за Big Time Company, голем конгломерат со тони тесто и тони средства. Тужбата за именување на компанијата за виџети сега би имала подобра цел, имено и со именување на компанијата Биг Тајм. Ова е борба на Давид и Голијат во која адвокатите би уживале. Се разбира, компанијата Big Time несомнено ќе се обиде да се оттргне од риболовната кука. Дали тие можат да го сторат тоа е уште еднаш правно прашање кое е неизвесно, и тие би можеле безнадежно да се заглават во нечистотија.

Пред да продолжиме подалеку за ова, би сакал да добијам нешто клучно на масата за спорните навлегувања на генеративната вештачка интелигенција поради обуката за податоци. Сигурен сум дека интуитивно сфаќате дека плагијатот и прекршувањето на авторските права се два малку различни ѕверови. Тие имаат многу заедничко, иако тие исто така значително се разликуваат.

Еве еден практичен краток опис од Универзитетот Дјук кој ги објаснува двете:

„Плагијатот најдобро се дефинира како непризнаена употреба на туѓо дело. Тоа е етичко прашање кое вклучува барање за кредит за работа што подносителот на барањето не го создал. Може да се плагијат на туѓо дело без оглед на статусот на авторските права на тоа дело. На пример, сепак е плагијат да се копира од книга или статија која е премногу стара за да биде под авторско право. Исто така, плагијат е да се користат податоци земени од непризнаен извор, иако фактичкиот материјал како што е податоците можеби не е заштитен со авторски права. Плагијатот, сепак, лесно се лекува - соодветно цитирање на оригиналниот извор на материјалот“.
„Повреда на авторските права, од друга страна, е неовластена употреба на туѓа работа. Ова е правно прашање кое зависи од тоа дали делото е или не е заштитено со авторски права на прво место, како и од спецификите како колку е искористено и целта на користењето. Ако некој копира премногу заштитено дело или копира за неовластена цел, едноставното признавање на оригиналниот извор нема да го реши проблемот. Само со барање претходна дозвола од носителот на авторските права, се избегнува ризикот од наплата за прекршување“.

Ја истакнувам важноста на овие две грижи за да сфатите дека лековите може да се разликуваат соодветно. Исто така, и двајцата се вплеткани во размислувањата што ги проникнуваат етика на вештачката интелигенција и Законот за вештачка интелигенција, што ги прави подеднакво вредни за испитување.

Ајде да истражиме потврден лек или решение. Ќе видите дека тоа може да помогне во едно од двојните проблеми, но не и на другото.

Некои инсистираа дека сè што треба да направат креаторите на вештачка интелигенција е да ги наведат своите извори. Кога генеративната вештачка интелигенција произведува есеј, само вклучете специфични цитати за што и да е наведено во есејот. Наведете различни URL-адреси и други индикации за тоа кои содржини на Интернет се користени. Се чини дека ова ќе ги ослободи од дилеми за плагијат. Излезениот есеј веројатно јасно ќе идентификува кои извори се користени за формулацијата што се произведува.

Има некои препирки во тоа тврдено решение, но на ниво од 30,000 стапки да речеме дека тоа служи како полузадоволителен лек за дилемата за плагијат. Како што е наведено погоре во објаснувањето за прекршување на авторските права, цитирањето на изворниот материјал не мора да ве извлекува од куќата за кучиња. Претпоставувајќи дека содржината е заштитена со авторски права, и во зависност од други фактори, како што е колкав дел од материјалот е користен, мечот за прекршување на авторските права може да се заниша нагло и конечно.

Двојна неволја е клучот овде.

Ќе се обиде да докаже плагијат или кршење на авторските права

Докажи!

Тоа е добро носениот рефрен што сите сме го слушнале во различни периоди од животот.

Знаеш како оди. Може да тврдите дека нешто се случува или се случило. Можеби во срцето знаете дека тоа се случило. Но, кога станува збор за туркање наспроти туркање, мора да имате доказ.

Во денешниот јазик, треба да го покажете потврди, како што велат.

Моето прашање до вас е ова: Како демонстративно ќе докажеме дека генеративната вештачка интелигенција несоодветно ја искористила содржината на Интернет?

Се претпоставува дека одговорот треба да биде лесен. Барате или му кажувате на генеративната вештачка интелигенција да изработи излезен есеј. Потоа земете го есејот и споредете го со она што може да се најде на Интернет. Ако го пронајдете есејот, бам, ја имате генеративната вештачка интелигенција прикована на ѕидот на пословичен.

Се чини дека животот никогаш не бил толку лесен.

Замислете дека ќе добиеме генеративна вештачка интелигенција за да изработиме есеј што содржи околу 100 зборови. Одиме наоколу и се обидуваме да дојдеме до сите ќошиња и агли на Интернет, барајќи ги тие 100 зборови. Ако ги најдеме 100-те зборови, прикажани по ист точен редослед и на идентичен начин, се чини дека сме фатиле жешко.

Да претпоставиме дека на Интернет наоѓаме навидум „споредлив“ есеј иако се совпаѓа само со 80 од 100 зборови. Се чини дека ова е сепак доволно, можеби. Но, замислете дека наоѓаме само пример од 10 зборови од 100-те што се совпаѓаат. Дали е тоа доволно за да се тврди дека или се случил плагијат или дека се случило прекршување на авторските права?

Сивилото постои.

Текстот е смешен на тој начин.

Споредете го ова со околностите од текст во слика или текст во уметност. Кога генеративната вештачка интелигенција обезбедува можност за текст-во-слика или текст-во-уметност, внесувате текстуално известување и апликацијата за вештачка интелигенција произведува слика донекаде врз основа на известувањето што сте го дале. Сликата може да не наликува на која било слика што некогаш била видена на оваа или на која било друга планета.

Од друга страна, сликата може да потсетува на други слики што постојат. Можеме да ја погледнеме генеративната слика произведена од вештачка интелигенција и донекаде по инстинкт да кажеме дека сигурно изгледа како некоја друга слика што сме ја виделе претходно. Општо земено, на визуелна аспектите на споредба и контраст се малку полесно преземени. Како што е кажано, ве молиме знајте дека огромните правни дебати обезбедуваат што претставува преклопување или репликација на една слика од друга.

Друга слична ситуација постои со музиката. Постојат генеративни апликации за вештачка интелигенција кои ви дозволуваат да внесете текстуална порака, а излезот што го произведува вештачката интелигенција е аудио музика. Овие способности за вештачка интелигенција за текст-во-аудио или текст-во-музика штотуку почнуваат да се појавуваат. Едно нешто на кое можете да се обложите за вашиот врвен долар е дека музиката произведена од генеративната вештачка интелигенција ќе биде под строга контрола за прекршување. Се чини дека знаеме кога слушаме музичко прекршување, иако повторно ова е сложено правно прашање кое не се заснова само на тоа како се чувствуваме за воочената репликација.

Дозволете ми уште еден пример.

Генеративната вештачка интелигенција од текст во код ви дава можност да внесете текстуална порака и вештачката интелигенција ќе произведе програмски код за вас. Потоа можете да го користите овој код за подготовка на компјутерска програма. Може да ја користите шифрата токму онака како што е генерирана, или можеби ќе се одлучите да го уредите и приспособите кодот за да одговара на вашите потреби. Исто така, треба да се увериме дека кодот е соодветен и работен бидејќи е можно да се појават грешки и невистини во генерираниот код.

Вашата прва претпоставка може да биде дека програмскиот код не се разликува од текстот. Тоа е само текст. Секако, тоа е текст кој дава одредена цел, но сепак е текст.

Па, не баш. Повеќето програмски јазици имаат строг формат и структура за природата на кодираните изјави на тој јазик. Ова во извесна смисла е многу потесно од природен јазик што слободно тече. Донекаде сте зацртани за тоа како се формулирани изјавите за кодирање. Слично на тоа, редоследот и начинот на кој се користат и подредени изјавите се донекаде оформени.

Сè на сè, можноста да се покаже дека програмскиот код е плагијат или прекршен е речиси полесна отколку што се кажува природен јазик. Така, кога генеративната вештачка интелигенција ќе го скенира програмскиот код на Интернет и подоцна ќе генерира програмски код, шансите да се тврди дека кодот е бесрамно реплициран ќе бидат релативно поубедливи. Не е слем-данк, па очекувајте да се водат горчливи битки за ова.

Мојата главна поента е дека ќе ги имаме истите прашања за етика на вештачката интелигенција и закон за вештачка интелигенција кои се соочуваат со сите начини на генеративна вештачка интелигенција.

Плагијатот и прекршувањето на авторските права ќе бидат проблематични за:

Текст во текст или текст во есеј
Текст во слика или текст во уметност
Текст во аудио или текст во музика
Текст во видео
Текст во код
Итн

Сите тие се предмет на исти грижи. Некои можеби ќе бидат малку полесно да се „докажат“ од другите. Сите тие ќе имаат своја разновидност на кошмари за основање на етика на вештачката интелигенција и Законот за вештачка интелигенција.

Изработка на случај за плагијат или кршење на авторските права

За цели на дискусија, да се фокусираме на генеративната вештачка интелигенција од текст во текст или текст во есеј. Тоа го правам делумно поради огромната популарност на ChatGPT, кој е тип на генеративна вештачка интелигенција од текст во текст. Има многу луѓе кои користат ChatGPT, заедно со многу други кои користат различни слични апликации за генерирање на вештачка интелигенција од текст во текст.

Дали оние луѓе кои користат генеративни апликации за вештачка интелигенција знаат дека потенцијално се потпираат на плагијат или прекршување на авторските права?

Се чини сомнително дека го прават тоа.

Би се осмелил да кажам дека преовладува претпоставката дека ако генеративната апликација за вештачка интелигенција е достапна за употреба, производителот на вештачка интелигенција или компанијата што ја применила вештачката интелигенција мора да знае или да биде уверена дека нема ништо непријатно за производите што ги нудат за употреба. Ако можете да го користите, мора да биде над одборот.

Ајде повторно да го разгледаме мојот претходен коментар за тоа како ќе се обидеме да докажеме дека одредена генеративна вештачка интелигенција работи на погрешна основа во однос на обуката за податоци.

Исто така, би можел да додадам дека ако можеме да фатиме една генеративна вештачка интелигенција како го прави тоа, шансите да ги фатиме другите веројатно ќе се зголемат. Не велам дека сите генеративни апликации за вештачка интелигенција ќе бидат во ист брод. Но, тие ќе се најдат во прилично сурово море откако еден од нив ќе биде закачен на ѕидот.

Затоа, исто така, ќе биде неизмерно вредно да се внимава на постоечките тужби. Првиот што ќе победи во однос на тврдениот прекршок, доколку се случи тоа, веројатно ќе значи пропаст и мрак за другите генеративни апликации за вештачка интелигенција, освен ако некоја теснотија не ги избегне пошироките проблеми што се во прашање. Оние што губат во однос на наводниот прекршок не мора да значи дека генеративните апликации за вештачка интелигенција можат да ѕвонат и да слават. Можеби загубата се припишува на други фактори кои не се толку релевантни за другите генеративни апликации за вештачка интелигенција итн.

Спомнав дека ако земеме есеј од 100 зборови и се обидеме да ги најдеме токму тие зборови во истата низа на Интернет, можеби ќе имаме релативно солиден случај за плагијат или прекршување на авторските права, а сè друго е еднакво. Но, ако бројот на зборови што се совпаѓаат е мал, се чини дека сме на тенок мраз.

Би сакал да копам подлабоко во тоа.

Очигледен аспект на правење споредба се состои од исти зборови во иста низа. Ова може да се случи за цели пасуси. Ова би било погодно да се забележи, речиси како да ни го даваат на сребрен послужавник.

Може да бидеме и сомнителни ако се совпадне само дел од зборовите. Идејата би била да видиме дали тие се клучни зборови или можеби зборови за пополнување што можеме лесно да ги отстраниме или игнорираме. Ние, исто така, не сакаме да нè измами употребата на зборови во нивното минато или идно време, или друга глупост. Треба да се земат предвид и тие варијации во зборовите.

Друго ниво на споредба би било кога зборовите не се особено исти зборови во голема мера, но сепак се чини дека зборовите дури и во разновидна состојба сè уште ги истакнуваат истите поенти. На пример, резимето често ќе користи доста слични зборови како оригинален извор, но можеме да забележиме дека резимето се чини дека е засновано на оригиналниот извор.

Најтешкото ниво на споредба ќе се заснова на концепти или идеи. Да претпоставиме дека гледаме есеј кој нема исти или слични зборови како основа за споредба, но суштината или идеите се исти. Мора да се признае дека навлегуваме во груба територија. Кога би сакале лесно да кажеме дека идеите се строго заштитени, би ставиле капак на речиси сите форми на знаење и проширување на знаењето.

Можеме уште еднаш да се повикаме на практичното објаснување од Универзитетот Дјук:

„Авторските права не ги штитат идеите, само специфичното изразување на идејата. На пример, судот одлучи дека Ден Браун не ги прекршил авторските права на претходната книга кога пишувал Кодот на Да Винчи бидејќи сè што позајмил од претходната работа биле основните идеи, а не спецификите на заплетот или дијалогот. Бидејќи авторското право е наменето да поттикне креативна продукција, користењето туѓи идеи за изработка на ново и оригинално дело ја поддржува целта на авторското право, тоа не го прекршува. Само ако некој копира туѓ израз без дозвола е потенцијално прекршено авторското право“.
„За да се избегне плагијат, од друга страна, мора да се признае изворот дури и на идеите што се позајмени од некој друг, без разлика дали изразот на тие идеи е позајмен со нив. Така, парафразата бара цитирање, иако ретко покренува проблем со авторските права“.

Ве молиме имајте предвид, како што претходно ги идентификувавме разликите помеѓу аспектите на двојни проблеми.

Сега тогаш, спроведувањето на споредбените пристапи во пракса е нешто што се случува многу години. Размислете за тоа на овој начин. Учениците кои пишуваат есеи за нивните училишни задачи може да бидат во искушение да зграпчат содржина од Интернет и да се преправаат дека тие се автори на зборовите наградени со Пулицерова награда од А одделение.

Наставниците веќе долго време користат програми за проверка на плагијати за да се справат со ова. Наставникот зема есеј на ученикот и го внесува во проверката на плагијати. Во некои случаи, цело училиште ќе лиценцира употреба на програма за проверка на плагијати. Секогаш кога студентите ќе се пријават за есеј, тие прво треба да го испратат есејот до програмата за проверка на плагијат. Наставникот е информиран што известува програмата.

За жал, мора да бидете крајно претпазливи за тоа што имаат да кажат овие програми за проверка на плагијати. Важно е внимателно да се процени дали пријавените индикации се валидни. Како што веќе споменавме, способноста да се утврди дали делото е копирано може да биде магливо. Ако непромислено го прифатите исходот од програмата за проверка, можете лажно да го обвините ученикот дека копирал кога не го сторил тоа. Ова може да ја уништи душата.

Продолжувајќи понатаму, можеме да се обидеме да користиме програми за проверка на плагијати во доменот на тестирање на генеративни излези за вештачка интелигенција. Однесувајте се кон излезените есеи од генеративна апликација за вештачка интелигенција како да се напишани од студент. Потоа проценуваме што вели проверувачот на плагијат. Ова се прави со зрно сол.

Постои неодамнешна истражувачка студија која се обиде да ги операционализира овие типови споредби во контекст на генеративната вештачка интелигенција на овој начин. Би сакал да разгледам неколку интересни наоди со вас.

Прво, потребна е дополнителна позадина. Генеративната вештачка интелигенција понекогаш се нарекува LLM (големи јазични модели) или едноставно LMs (јазични модели). Второ, ChatGPT се заснова на верзија на друг OpenAI генеративен AI пакет наречен GPT-3.5. Пред GPT-3.5, имаше GPT-3, а пред тоа беше GPT-2. Во денешно време, GPT-2 се смета за прилично примитивен во споредба со подоцнежните серии, и сите со нетрпение го очекуваме претстојното откривање на GPT-4, видете ја мојата дискусија на врската овде.

Истражувачката студија што сакам накратко да ја истражам се состоеше од испитување на GPT-2. Тоа е важно да се сфати бидејќи сега сме подалеку од можностите на GPT-2. Не донесувајте непромислени заклучоци за резултатите од оваа анализа на GPT-2. Сепак, можеме да научиме многу од проценката на GPT-2. Студијата е насловена „Дали јазичните модели прават плагијат? од Jooyoung Lee, Thai Le, Jinghui Chen и Dongwon Lee, кои се појавуваат во ACM WWW '23, 1-5 мај 2023 година, Остин, Тексас, САД.

Ова е нивното главно истражувачко прашање:

„До кој степен (не ограничено на меморирање) LM-ите ги користат фразите или речениците од нивните примероци за обука?

Тие ги користеа овие три нивоа или категории на потенцијален плагијат:

„Дусловно плагијат: точни копии на зборови или фрази без трансформација“.
„Парафраза плагијат: синонимна замена, прередување зборови и/или заден превод“.
„Плагијат на идејата: Претставување на основната содржина во издолжена форма“.

GPT-2 навистина беше обучен за интернет податоци и со тоа е соодветен кандидат за овој тип на анализа:

„GPT-2 е претходно обучен на WebText, кој содржи над 8 милиони документи преземени од 45 милиони врски на Reddit. Бидејќи OpenAI не објави јавно WebText, ние користиме OpenWebText кој е рекреација со отворен код на корпусот WebText. Тоа е сигурно користено од претходната литература“.

Селективни клучни наоди како што се извадени од студијата се состојат од:

„Откривме дека претходно обучените GPT-2 семејства прават плагијат од OpenWebText.
„Нашите наоди покажуваат дека дотерувањето значително ги намалува дословните случаи на плагијат од OpenWebText.
„Во согласност со Карлини и сор. и Carlini et al., откриваме дека поголемите GPT-2 модели (големи и xl) генерално генерираат плагијатни секвенци почесто од помалите.
„Сепак, различни LMs може да демонстрираат различни модели на плагијат, а со тоа нашите резултати може директно да не се генерализираат на други LMs, вклучително и поновите LMs како GPT-3 или BLOOM“.
„Покрај тоа, познато е дека автоматските детектори за плагијат имаат многу начини на неуспех (и во лажни негативни и лажни позитиви).
„Со оглед на тоа што поголемиот дел од податоците за обуката на LM се бришат од Интернет без да се информираат сопствениците на содржината, нивното повторување на зборови, фрази, па дури и основни идеи од комплетите за обука во генерирани текстови има етички импликации“.

Дефинитивно ни требаат многу повеќе студии од овој вид.

Ако сте љубопитни за тоа како GPT-2 се споредува со GPT-3 во врска со обуката за податоци, постои прилично изразен контраст.

Според пријавените индикации, обуката за податоци за GPT-3 беше многу пообемна:

„Моделот беше обучен со користење на текстуални бази на податоци од интернет. Ова вклучуваше огромни 570 GB податоци добиени од книги, веб текстови, Википедија, статии и други пишувања на Интернет. Да бидеме уште попрецизни, 300 милијарди зборови беа внесени во системот“ (БиБиСи научен фокус списание, „ChatGPT: Сè што треба да знаете за алатката GPT-3 на OpenAI“ од Алекс Хјуз, февруари 2023 година).

За оние од вас заинтересирани за подетални описи на обуката за податоци за GPT-3, еве извадок од официјалната моделска картичка GPT-3 објавена на GitHub (последниот датум на ажурирање наведен како септември 2020 година):

„Збирката на податоци за обука GPT-3 е составена од текст објавен на интернет или од текст поставен на интернет (на пример, книги). Интернет-податоците за кои досега биле обучени и оценети вклучуваат: (1) верзија на базата на податоци CommonCrawl, филтрирана врз основа на сличност со висококвалитетни референтни корпуси, (2) проширена верзија на базата на податоци на веб-текст, (3 ) две корпуси за книги базирани на интернет и (4) Википедија на англиски јазик“.
„Со оглед на податоците за обуката, излезите и перформансите на GPT-3 се порепрезентативни за популациите поврзани на интернет отколку оние кои се натопени во вербална, недигитална култура. Популацијата поврзана на интернет е порепрезентативна за развиените земји, има богати, помлади и машки погледи и главно е насочена кон САД. Побогатите нации и популации во развиените земји покажуваат поголема пенетрација на интернет. Дигиталната родова поделба покажува и помалку жени застапени на интернет ширум светот. Дополнително, бидејќи различни делови од светот имаат различни нивоа на пенетрација и пристап до интернет, сетот на податоци недоволно ги претставува помалку поврзаните заедници“.

Едно од горенаведените индикации за GPT-3 е дека правилото меѓу оние што ја создаваат генеративната вештачка интелигенција е дека колку повеќе интернет податоци можете да скенирате, шансите за подобрување или унапредување на генеративната вештачка интелигенција се зголемуваат.

Можете да го погледнете ова на кој било од двата начина.

1) Подобрена АИ. Ќе имаме генеративна вештачка интелигенција која ползи низ колку што е можно повеќе Интернет. Возбудливиот исход е дека генеративната вештачка интелигенција ќе биде подобра отколку што е веќе. Тоа е нешто што треба да се очекува.
2) Копирање на големиот потенцијал. Ова проширување на скенирањето на Интернет непријатно и привлечно го прави проблемот со плагијатот и кршењето на авторските права потенцијално поголем и поголем. Додека порано немаше толку многу креатори на содржини погодени, големината ќе процвета. Ако сте правник на страната на креаторите на содржината, ова ви носи солзи во очите (можеби солзи на вознемиреност или солзи радосници за тоа какви изгледи носи ова во однос на тужбите).

Дали чашата е полуполна или полупразна?

Ти одлучи.

Се чекаат легални нагазни мини

Прашање за кое можеби размислувате е дали вашата објавена интернет содржина се смета за фер игра за скенирање. Ако вашата содржина е зад платежниот ѕид, веројатно таа не е цел за скенирање бидејќи не може лесно да се достигне, во зависност од јачината на ѕидот за плаќање.

Претпоставувам дека на повеќето секојдневни луѓе нивната содржина не е ставена зад платежниот ѕид. Тие сакаат нивната содржина да биде јавно достапна. Тие претпоставуваат дека луѓето ќе го погледнат.

Дали вашата содржина јавно достапна исто така аксиоматски значи дека одобрувате таа да биде скенирана за употреба од генеративна вештачка интелигенција што се обучува за податоци?

Можеби да, можеби не.

Тоа е една од оние правни работи со вртење очи.

Да се вратам на претходно наведеното Закон за Блумберг написот, авторите ја споменуваат важноста на Условите и правилата (T&C) поврзани со многу веб-локации:

„Легалната нагазна мина - многу игнорирана од несвесните компании за вештачка интелигенција кои управуваат со онлајн ботови за стругање податоци - е скриена во Условите и правилата кои вообичаено се достапни на јавните веб-локации од сите видови. За разлика од моментално нерешениот закон за ИС и дилемата за прекршување на авторските права, Условите и правилата на веб-локацијата се поддржани со добро воспоставено договорно право и обично може да се спроведат на суд, потпирајќи се на доволен број преседани“.

Тие укажуваат дека ако се претпостави дека вашата веб-страница има страница поврзана со лиценцирање, шансите се дека ако сте користеле стандардизиран современ шаблон, може да содржи клучна клаузула:

„Следствено, повеќето Услови и одредби за котли за веб-локации - изобилно достапни во бесплатен пристап - содржат клаузула која забранува автоматско стругање податоци. Иронично, таквите слободно достапни шаблони веројатно се користени за обука за ChatGPT. Затоа, сопствениците на содржини можеби ќе сакаат да ги прегледаат нивните Услови и правила и да вметнат посебна клаузула која категорично забранува секаква употреба на која било содржина од веб-локациите за обука за вештачка интелигенција или какви било сродни цели, без разлика дали се собираат рачно или автоматски, без претходна писмена дозвола од сопственикот на веб-локацијата .“

Во нивната анализа на потенцијалните дејствија што креаторите на содржини треба да ги преземат за нивните веб-локации е вклучен дополнителен крик:

„Затоа, внесувањето извршна одредба за ликвидирана отштета за секое прекршување на клаузулата за забрана на гребење, засилена со одредба за забрана без обврзница, може да биде издржано решение за оние автори на креативна содржина кои не сакаат да ги дадат плодовите од нивните интелектуален труд за целите на обука за вештачка интелигенција без да бидат платени за тоа или, барем, да им се даде соодветна заслуга за нивната работа“.

Можеби ќе сакате да се консултирате со вашиот адвокат за ова.

Некои велат дека ова е витален начин да се обидете да им кажете на креаторите на вештачката интелигенција дека креаторите на содржина се многу сериозни во заштитата на нивната содржина. Да се осигурате дека вашата лиценца има соодветна формулација, се чини дека ги известува креаторите на вештачката интелигенција.

Сепак, другите се малку послаби. Тие очајно велат дека можете да продолжите да го ставате најсуровиот и најсмртоносниот правен јазик на вашата веб-страница, но на крајот, креаторите на вештачката интелигенција ќе го скенираат. Нема да знаете дека го сториле тоа. Ќе имате ѓавол од времето што ќе докаже дека тие го направиле тоа. Малку е веројатно дека ќе откриете дека нивните резултати ја одразуваат вашата содржина. Тоа е тешка битка која нема да ја победите.

Контрааргументот е дека ја предавате битката уште пред да се води. Ако барем немате доволно правен јазик, и ако некогаш ги фатите, тие ќе се размрдаат и ќе го избегнат патот за да избегаат од секаква одговорност. Сето тоа затоа што не го објавивте вистинскиот вид на правна реч.

Во меѓувреме, друг пристап кој се обидува да добие влечење би се состои од означување вашата веб-страница со нешто што вели дека страницата не треба да се скенира со генеративна вештачка интелигенција. Идејата е дека би се измислил стандардизиран маркер. Веројатно, веб-страниците би можеле да го додадат маркерот на нивната локација. На креаторите на вештачка интелигенција ќе им биде кажано дека треба да го променат скенирањето на податоците за да ги прескокнат означените веб-локации.

Може ли маркерскиот пристап да биде успешен? Загриженоста ги вклучува трошоците за добивање и објавување на маркерите. Заедно со тоа дали креаторите на вештачката интелигенција ќе се придржуваат до маркерите и ќе се погрижат да избегнуваат скенирање на означените локации. Друга перспектива е дека дури и ако креаторите на вештачка интелигенција не одат заедно со ознаките, ова дава уште еден клучен поим за одење на суд и тврдење дека создавачот на содржината ја поминал последната милја за да се обиде и да предупреди за скенирањето со вештачка интелигенција.

Да, сето тоа ви ја врти главата.

Заклучок

Неколку завршни забелешки на оваа трнлива тема.

Дали сте подготвени за перспектива што го навредува умот на целата оваа вештачка интелигенција како дилема за плагијатор и за прекршување на авторските права?

Голем дел од претпоставката за „фаќање“ на генеративна вештачка интелигенција при чин на плагијат или кршење на авторските права зависи од откривањето на резултатите кои многу личат претходните работи како што се содржината на Интернет што била потенцијално скенирана за време на обуката за податоци.

Да претпоставиме дека тука е во игра трик раздели и владеј.

Еве што мислам.

Ако генеративната вештачка интелигенција позајми малку од овде и малку од таму, на крајот измешајќи ги заедно за да произведе одреден излез, шансите да се биде во можност да се доживее моментот на гота се значително намалени. Каков било излез навидум нема да се искачи на доволен праг за кој со сигурност може да се каже дека е пресечен од една одредена изворна ставка. Резултантниот есеј или другите начини на излез ќе се совпаѓаат само фракционо. И со вообичаениот пристап на обидот да се аргументира дека се случил плагијат или прекршување на авторските права, обично треба да покажете повеќе од она што е во игра, особено ако залакот не е значаен и може да се најде нашироко низ Интернет (поткопување секое соодветно оптоварување на докажување за злоупотреба).

Дали сè уште можете убедливо да изјавите дека обуката за податоци со генеративна вештачка интелигенција ги откорнала веб-локациите и креаторите на содржина, дури и ако предложениот доказ е навидум нематеријален дел?

Размислете за тоа.

Ако се соочуваме со потенцијален плагијат и/или прекршување на авторските права во обем, можеби ќе треба да го промениме нашиот пристап за дефинирање на тоа што претставува плагијат и/или прекршување на авторските права. Можеби постои случај да се направи за плагијат или прекршување на авторските права главно или воопшто. Мозаикот кој се состои од илјадници или милиони ситни фрагменти може да се толкува како извршување на такви прекршувања. Сепак, очигледната неволја е што ова може да направи секаква содржина одеднаш да дојде под чадор на прекршувања. Ова може да биде лизгава патека.

Тешки мисли.

Зборувајќи за тешки мисли, Лео Толстој, легендарниот писател, славно изјавил: „Единствената смисла на животот е да му служиш на човештвото“.

Ако вашата веб-страница и веб-страниците на другите се скенираат за подобрување на вештачката интелигенција, и иако не добивате ниту денар за тоа, дали би можеле да имате свечена утеха во жестокото верување дека придонесувате за иднината на човештвото? Се чини дека е мала цена што треба да се плати.

Па, освен ако вештачката интелигенција не се покаже дека е страшниот егзистенцијален ризик што ги брише сите луѓе од постоењето. Не треба да земате заслуга за тоа. Претпоставувам дека веднаш нема да придонесеш за тој страшен исход. Ако го оставите настрана тоа катастрофално предвидување, можеби мислите дека ако креаторите на вештачка интелигенција заработуваат пари од нивната генеративна вештачка интелигенција и се чини дека уживаат во профитерството, и вие би требало да добиете дел од колачот. Споделете и споделувајте подеднакво. Креаторите на вештачката интелигенција треба да побараат дозвола за скенирање на која било веб-страница, а потоа да преговараат за цената што треба да се плати за тоа што им било дозволено да го преземат скенирањето.

Дајте кредит таму каде што ви следува кредит.

Ајде да му го дадеме на Сер Волтер Скот последниот збор засега: „О, каква заплеткана мрежа плетеме. Кога прво вежбаме да измамиме“.

Ова можеби важи ако верувате дека измамата е во тек, или можеби не важи ако мислите дека сè е добро и совршено искрено и легитимно. Ве молиме великодушно дајте си заслуга што размислувате за ова. Ти го заслужи тоа.

Извор: https://www.forbes.com/sites/lanceeliot/2023/02/26/legal-doomsday-for-generative-ai-chatgpt-if-caught-plagiarizing-or-infringing-warns-ai-ethics- и-ai-прав/