Microsoft удалила блог, в котором просила пользователей обучать ИИ на пиратских книгах о Гарри Поттере

Microsoft удалила блог, в котором просила пользователей обучать ИИ на пиратских книгах о Гарри Поттере



Microsoft удалила блог, в котором просила пользователей обучать ИИ на пиратских книгах о Гарри Поттере

«Я думаю, что возрождение и создание фанфиков могут обозначать проблемы авторского права, поскольку фанфики часто должны основываться на выразительных элементах, персонаже, защищенном авторским правом, персонаже, который достаточно известен, чтобы быть защищенным законом об авторском праве, или сюжетных историях или сиквелах», — сказал Смит. «Если эти вещи копируются и воспроизводятся, эти результаты могут потенциально нарушать авторские права».

Но это все еще серая зона. Учитывая блог, Смит сказал: «Я был бы обеспокоен», но «я бы не сказал, что это автоматически является нарушением».

Смит сказал Ars, что, закрыв блог, Microsoft поступила «вероятно умно», поскольку суды, как правило, постановляют, что обучение ИИ на книгах, защищенных авторским правом, является добросовестным использованием. Но суды продолжают расследовать вопросы о пиратских учебных материалах по искусственному интеллекту.

На удаленной странице набора данных Kaggle Мендола ранее объяснил, что в качестве источника данных он «загружал электронные книги, а затем преобразовывал их в текстовые файлы».

Microsoft могла нарушить авторские права

Если бы Microsoft когда-нибудь столкнулась с вопросом, использовала ли компания пиратские книги сознательно для обучения образцовых моделей, добросовестное использование «может стать серьезным аргументом», сказал Смит.

Комментаторы Hacker News предположили, что использование блога можно считать добросовестным, поскольку учебное пособие предназначено для «образовательных целей», а Смит заявил, что Microsoft может привести несколько «веских аргументов» в свою защиту.

Однако он также предположил, что Microsoft может быть привлечена к ответственности за содействие нарушению на каком-то уровне после закрытия блога на год. Перед удалением набор данных Kaggle был загружен более 10 000 раз.

«Конечный результат — создать что-то, нарушающее авторские права, сказав: «Эй, идите, возьмите этот контент, нарушающий авторские права, и используйте его в нашей системе», — сказал Смит. «Потенциально они могут нести некоторую вторичную ответственность за нарушение авторских прав, загрузку и последующее использование для поощрения других к использованию в учебных целях».

Leave a Reply

Your email address will not be published. Required fields are marked *