Стрімкий розвиток технологій штучного інтелекту (ШІ) докорінно змінив підходи до обробки інформації, аналізу даних та створення нових цифрових продуктів. Основою функціонування більшості сучасних моделей ШІ є text and data mining (TDM) — автоматизований процес аналізу великих масивів текстів і даних з метою виявлення закономірностей, трендів та кореляцій.
Водночас TDM неминуче передбачає копіювання та вилучення інформації з об’єктів, що охороняються авторським правом, що породжує складні правові питання. У відповідь на ці виклики Європейський Союз ухвалив Директиву (ЄС) 2019/790 про авторське право на цифровому єдиному ринку (DSM Directive), яка вперше системно врегулювала використання творів для TDM у статтях 3 і 4.
Метою цієї статті є аналіз правового режиму TDM у ЄС, оцінка впливу цих норм на розвиток ШІ та визначення балансу між інтересами інновацій і правовласників.
Правове регулювання TDM у Директиві DSM
Стаття 3: обов’язковий виняток для наукових досліджень.
Стаття 3 DSM Директиви передбачає обов’язковий виняток із авторського права для використання творів у цілях наукових досліджень. Вона дозволяє дослідницьким організаціям і установам культурної спадщини здійснювати копіювання та вилучення інформації з творів, до яких вони мають законний доступ, з метою проведення TDM.
Ключові характеристики цієї норми:
- Суб’єкти: університети, наукові установи, бібліотеки, архіви;
- Мета: виключно наукові дослідження;
- Умова: наявність законного доступу до матеріалів;
- Юридична сила: імперативний виняток (правовласник не може його скасувати).
Особливістю статті 3 є те, що вона не допускає можливості opt-out з боку правовласників. Це означає, що навіть за наявності договірних обмежень або застережень, дослідницькі установи мають право використовувати матеріали для TDM.
Таким чином, ЄС створює сприятливе правове середовище для розвитку академічної науки та некомерційних досліджень у сфері ШІ.
Стаття 4: загальний виняток із можливістю заборони
На відміну від статті 3, стаття 4 DSM Директиви встановлює ширший виняток, який застосовується до будь-яких користувачів, включаючи комерційні компанії, стартапи та розробників ШІ.
Основні елементи статті 4:
- Суб’єкти: будь-які фізичні або юридичні особи;
- Мета: будь-які види TDM (включаючи комерційні);
- Умова: законний доступ до матеріалів;
- Обмеження: можливість правовласника прямо заборонити використання (opt-out);
- Зберігання: копії можуть зберігатися стільки, скільки необхідно.
Ключовим елементом є саме механізм opt-out, який дозволяє правовласникам обмежити використання своїх творів для TDM. Така заборона може бути реалізована:
- через договірні умови;
- за допомогою технічних або машинозчитуваних засобів (наприклад, метаданих або robots.txt для веб-контенту).
У результаті, хоча стаття 4 формально розширює можливості використання творів, на практиці вона значною мірою залежить від волі правовласників.
Поняття “законного доступу”

Центральним елементом обох статей є поняття “lawful access” (законний доступ). Воно означає, що користувач повинен отримати доступ до матеріалів правомірним способом — наприклад:
- через підписку;
- за ліцензією;
- або через відкритий доступ в Інтернеті.
Проте важливо підкреслити, що законний доступ не означає автоматичного права на використання для ШІ. Користувач може мати право читати або переглядати контент, але це не завжди дає йому право:
- копіювати його у великих масштабах;
- використовувати для тренування моделей ШІ.
Це створює складну правову межу між доступом і використанням, яка є предметом сучасних правових дискусій.
Вплив на розвиток штучного інтелекту

Сприяння інноваціям
Директива DSM є важливим кроком у напрямку легалізації TDM у ЄС. Вона:
- зменшує правову невизначеність;
- створює передбачувані правила гри;
- стимулює інвестиції в AI-технології.
Особливо значущою є стаття 3, яка гарантує свободу досліджень для академічного сектору без необхідності отримання дозволів від правовласників.
Обмеження для бізнесу
Водночас стаття 4 створює суттєві обмеження для комерційного сектору. Механізм opt-out означає, що:
- доступ до даних може бути фрагментованим;
- великі масиви даних можуть бути частково недоступними;
- виникає необхідність перевірки правового статусу кожного джерела.
Це призводить до:
- збільшення витрат на комплаєнс;
- правової невизначеності;
- ризику порушення авторських прав.
Порівняння з підходом США
На відміну від ЄС, у США використовується більш гнучкий підхід через доктрину fair use. Американські суди часто визнають TDM та тренування ШІ як трансформативне використання, що може бути законним навіть без згоди правовласника.
Наприклад, у справі Authors Guild v. Google суд визнав масову оцифровку книг правомірною в рамках fair use.
У результаті:
- США забезпечують більшу гнучкість;
- ЄС — більшу правову визначеність, але з більшими обмеженнями.
Баланс між інноваціями та захистом прав
Директива DSM демонструє спробу досягти компромісу між двома цілями:
- розвитком технологій та інновацій;
- захистом економічних інтересів правовласників.
Стаття 3 явно орієнтована на підтримку суспільного інтересу та науки, тоді як стаття 4 надає пріоритет контролю правовласників.
Однак критики зазначають, що механізм opt-out може:
- обмежити доступ до даних;
- створити бар’єри для малих інноваційних компаній;
- знизити конкурентоспроможність ЄС у сфері ШІ.
Висновок
Для юристів у всьому світі дедалі більшого значення набуває не лише аналіз чинного законодавства, але й здатність прогнозувати його трансформацію. У сфері штучного інтелекту ця динаміка особливо очевидна: технологічний розвиток суттєво випереджає правове регулювання, змушуючи держави та міжнародні інституції шукати нові моделі балансу між інноваціями та захистом прав.
У цьому контексті норми Директиви DSM можна розглядати як лише перший крок до формування принципово нової архітектури авторського права, адаптованої до епохи даних. Уже сьогодні стає очевидним, що традиційні підходи до ліцензування — зокрема, ліцензії на публічне виконання, трансляцію чи онлайн-розповсюдження контенту — не здатні повною мірою охопити нові форми використання творів у процесі тренування моделей штучного інтелекту.
Ймовірно, у найближчому майбутньому правова система еволюціонуватиме у напрямку створення нових типів ліцензій, спрямованих не на «показ» чи «відтворення» у класичному розумінні, а на обробку, аналіз і трансформацію даних. Такі ліцензії можуть регулювати доступ до масивів інформації для цілей TDM, встановлювати умови використання даних для навчання алгоритмів, а також визначати механізми винагороди правовласників за використання їхніх творів у складі навчальних датасетів.
У певному сенсі це нагадуватиме еволюцію медіаіндустрії — від кінотеатрів до телебачення, а згодом до стримінгових платформ. Проте на відміну від попередніх етапів, де об’єктом регулювання був доступ до контенту як такого, нова парадигма зосередиться на використанні контенту як ресурсу для створення нових знань і технологій.
Таким чином, ключовим викликом для сучасного права стане розробка гнучких і технологічно нейтральних механізмів, які дозволять одночасно стимулювати розвиток штучного інтелекту та забезпечувати справедливу компенсацію правовласникам. Від того, наскільки ефективно буде знайдено цей баланс, залежатиме не лише майбутнє авторського права, але й конкурентоспроможність правових систем у глобальній цифровій економіці.
Олена Яремчук Юрист, патентний повірений Управляючий партнер «Міжнародної Юридичної Консалтингової Группи «Яремчук та партнери»
www.yaremchukandpartners.com



