Не спите во время съемок, гиганты искусственного интеллекта — покупатели (гостевая колонка)

Что отличает высококачественный продукт генеративного ИИ? Как одно такое решение ИИ выделяется среди конкурентов на все более переполненном рынке? По мере появления новых решений ИИ и усиления конкуренции понимание того, что делает продукт хорошим, становится критически важным. Качество контента, используемого для обучения моделей ИИ, стоящих за этими продуктами генеративного ИИ, играет важную роль в ответе на этот вопрос.

Чтобы гарантировать, что модель ИИ выдает ожидаемые результаты, ее необходимо изначально обучить на обширных, надежных и точных наборах данных. Часто эти модели обучаются с использованием веб-контента, который мог не быть проверен. Такая практика может вызвать проблемы при создании продукта. Например, если многочисленные системы ИИ обучаются на одних и тех же легкодоступных ресурсах, их алгоритмы могут начать делать похожие прогнозы или выдавать похожие результаты, что снижает уникальность и ценность как моделей ИИ, так и создаваемых ими выходных данных для пользователей.

Более того, использование контента без какой-либо оценки, например, проверки его происхождения или подлинности, может представлять риски с разных точек зрения. Например, может ли использование определенного контента в обучении ИИ нарушить права интеллектуальной собственности других лиц? Эти сложные вопросы интеллектуальной собственности в настоящее время обсуждаются в судах. А как насчет потенциальных предубеждений или неточностей в контенте? Как управляется риск, связанный с этими проблемами?

Это развитие прокладывает путь к бурно развивающемуся рынку лицензирования в области ИИ, позволяя разработчикам приобретать лицензированный материал для обучения своих моделей из надежных источников. В оживленном ландшафте продуктов ИИ разработчики не только сосредотачиваются на минимизации рисков во время обучения, но и на том, чтобы выделить свои модели ИИ среди конкурентов. Обучая свои модели ИИ с помощью уникального контента и данных, они стремятся разрабатывать алгоритмы, которые генерируют отличительные и, следовательно, более ценные результаты.

Одновременно разработчики контента и правообладатели изучают методы получения дохода от своего контента на рынке ИИ, а также предотвращают несанкционированное использование своей интеллектуальной собственности для обучения моделей ИИ, если только они не дали на это явного согласия.

Качественный контент часто бывает в дефиците, и сфера обучения ИИ не является исключением. Недоиспользованным источником качественного контента, который может принести пользу как создателям ИИ, так и поставщикам или владельцам контента, являются кадры B-roll и архивный контент. Этот вид кадров предлагает новые возможности для монетизации для владельцев контента, у которых ранее не было таких возможностей, в то время как для разработчиков ИИ он представляет собой обширную коллекцию потенциально уникальных учебных материалов с пониженным риском.

Создатели, которые делятся видео на таких платформах, как YouTube, Instagram и TikTok, уже выходят на прибыльный рынок, лицензируя свой неиспользованный видеоконтент компаниям, занимающимся искусственным интеллектом (ИИ). Как сообщает Bloomberg News, эти транзакции могут приносить тысячи долларов за сделку, при этом разработчики ИИ обычно платят от 1 до 4 долларов за каждую минуту отснятого материала. Ценность этого материала зависит от нескольких факторов, включая качество видео, его уникальность и то, насколько он малодоступен для других разработчиков ИИ.

При такой схеме лицензирования преимущества получают как создатель контента, так и разработчик ИИ. С одной стороны, создатели контента теперь могут получать доход от ранее не монетизированных или недостаточно используемых активов, сохраняя при этом право собственности и контроль над своим контентом посредством стратегического лицензирования. Это означает, что они могут устанавливать договорные условия, которые ограничивают применение их контента определенными сценариями и защищают от неправильного использования или ненадлежащего воспроизведения премиум-контента. Например, создатели могут стремиться ограничить использование своего контента в системах ИИ, используемых в целях, потенциально вредных для их собственной отрасли или приносящих пользу конкурентам.

С другой стороны, этот лицензированный контент представляет четыре существенных преимущества для создателей ИИ. Изначально он предлагает отличие от конкурентов за счет эксклюзивного, конфиденциального учебного материала, который недоступен широкой публике. Это может дать преимущество на рынке, где многочисленные модели ИИ были обучены на идентичных данных. Следовательно, разработчики ИИ, стремящиеся разработать модель ИИ следующего поколения, могут найти это преимуществом.

Как геймер, я отдаю приоритет обеспечению высококачественного игрового опыта с использованием аутентичного контента, созданного игроками. Это помогает мне избегать растущей проблемы загрязнения контента, создаваемого искусственным интеллектом. Все дело в том, чтобы не допустить обучения и копирования моделями ИИ контента, изначально созданного ИИ, что может ухудшить качество и креативность результатов.

Третья стратегия заключается в минимизации потенциальных угроз безопасности путем использования данных с проверяемым происхождением, которые включают полную историю их создания, изменений и людей, которые работали с ними в этом процессе. Это имеет решающее значение для предотвращения повреждения их систем ИИ зараженными данными во время обучения.

Преимущество четвертого пункта в том, что он дает больше гарантий относительно прав интеллектуальной собственности и потенциальных рисков от внешних источников, когда речь идет о контенте, используемом для обучения. Однако эта привилегия эксклюзивного контента не дается бесплатно; она приводит к более высоким расходам на этапах разработки и обучения.

В последнее время DeepSeek — китайская модель ИИ, родственная ChatGPT — привлекает внимание как одно из самых скачиваемых приложений в мире. Хотя она похожа на другие доступные модели ИИ, DeepSeek выделяется из-за своих сокращенных затрат на разработку и обучение. Ходят слухи, что DeepSeek мог обучаться с использованием дистилляции, распространенного метода, при котором данные берутся из более крупных и более эффективных моделей ИИ, что обеспечивает экономически эффективное обучение. Однако использование дистилляции подчеркивает важность поиска уникального контента и данных для целей обучения, позволяя модели ИИ предлагать особые результаты, которые отличают ее от других вариантов на рынке, путем генерации результатов на основе эксклюзивных данных.

Развивающийся рынок лицензирования B-roll представляет собой особую платформу, где разработчики ИИ и поставщики контента могут наладить взаимовыгодное партнерство. Чтобы воспользоваться этим шансом, создатели и владельцы должны разработать методы оценки и выбора подходящих ресурсов, установить условия лицензирования для защиты ценного контента, получить необходимые разрешения на права и построить модели ценообразования, учитывающие такие аспекты, как эксклюзивность, качество и тип контента.

В то же время создатели ИИ должны отдать приоритет созданию надежных процессов проверки и оценки контента, решению потенциальных проблем копирования в выходных данных и разработке гибких систем данных для управления многочисленными лицензионными соглашениями и защиты контента. Если обе стороны реализуют эти стратегии, это может способствовать созданию процветающей среды, в которой создатели контента и разработчики ИИ смогут процветать вместе.

Эдриан Перри и Робин Полашук — коллеги по юридической фирме Covington & Burling, где они оба занимают должности руководителей отдела развлечений и медиа.

Смотрите также

2025-02-13 19:25