Американският издателски гигант HarperCollins е сключил договор с неназована технологична компания, който ѝ позволява да използва някои от книгите ѝ за обучение на моделите на генеративния изкуствен интелект.
В писмо, видяно от АФП, технологичната компания предлага заплащане от 2500 долара за всяка избрана книга, за да обучава своя т.нар. голям езиков модел (LLM) за период до три години.
Моделите на изкуствен интелект се нуждаят от огромни количества текстове, за да тренират ежедневната си употреба на езика.
„HarperCollins постигна споразумение с технологична компания за изкуствен интелект, за да позволи ограничено използване на избрани нехудожествени заглавия от бек-листа за обучение на модели на изкуствен интелект с цел подобряване на качеството и ефективността на модела“, се казва в изявление на издателството.
Тя заяви, че споразумението има „ограничен обхват и ясни предпазни огради за изходните данни на модела, които зачитат правата на автора“.
Авторите „имат възможност да изберат дали да се присъединят към споразумението или да се въздържат от тази възможност“, добави тя.
Предложението бе прието със смесени чувства в издателския свят, като писатели като Даниел Кибълсмит отказаха с лека ръка.
„Вероятно бих го направил за един милиард долара. Бих го направил за сума пари, която няма да изисква от мен да работя повече, тъй като това е крайната цел на тази технология“, написа авторът в социалната мрежа Bluesky.
HarperCollins е едно от най-големите издателства, които са постигнали такова споразумение, но не и първото.
Американското научно издателство Wiley съобщи, че е разрешило „достъп до публикувано преди това академично и професионално книжно съдържание за специфично използване при обучението на моделите на LLM“ в договор на стойност 23 млн. долара с неидентифицирана „голяма технологична компания“.
Споразуменията подчертават напрежението, което се крие зад моделите с изкуствен интелект, които събират огромни количества съдържание в мрежата, създавайки риск от широко разпространени нарушения на авторските права.
Джиада Пистили, ръководител на отдела по етика в Hugging Face, френско-американска платформа за свободен достъп до ИИ, заяви, че тези споразумения са стъпка напред, тъй като включват плащания към издателите. Но тя изразява съжаление, че те оставят малко възможности за преговаряне на авторите.
„Това, което ще видим, е механизъм на двустранни споразумения между нови технологични компании и издатели или притежатели на авторски права, докато според мен се нуждаем от по-широк разговор, който да включва малко повече заинтересовани страни“, каза тя.
Жулиен Шураки, правен директор на Френския съюз на издателите (SNE), заяви, че споразуменията представляват „напредък“.
„Едно споразумение означава, че е имало диалог и желание да се постигне баланс между използването на изходни данни, които са обект на авторско право и които ще генерират стойност“, каза той.
Пресата също се организира, за да посрещне предизвикателствата, създадени от изкуствения интелект.
В края на 2023 г. “Ню Йорк Тайм“ съди OpenAI, създателя на ChatGPT, както и Microsoft, основния му инвеститор, за нарушаване на защитата на авторските права. Други медийни групи са сключили сделки с OpenAI.
Технологичните компании може да нямат друг избор, освен да плащат, за да подобрят продуктите си, особено след като започват да изчерпват новите материали, които да захранват моделите им.
„В интернет се намират много законни и незаконни твърдения, както и много пиратски копия. Това не само поражда правни проблеми, но и повдига въпроси относно качеството на данните“, заяви Чураки в SNE.
„Ако се стремим да развиваме пазара на добродетелна основа, трябва да включим всички участници“, каза той. | БГНЕС