Posted in

Anthropic знищила мільйони книг для навчання AI

Процес сканування книг для навчання штучного інтелекту

Компанія Anthropic, яка займається штучним інтелектом, витратила мільйони доларів на фізичне сканування друкованих книг для створення свого AI-асистента, схожого на ChatGPT, відомого як Claude. У процесі компанія знищила мільйони книг, вирізаючи їх з обкладинок, скануючи в цифрові файли та викидаючи оригінали виключно для навчання свого AI. Ці деталі стали відомі завдяки судовим документам про рішення щодо авторського права, які були опубліковані в понеділок.

У 32-сторінковому юридичному рішенні йдеться про те, що в лютому 2024 року компанія найняла Тома Терві, колишнього керівника партнерств проекту Google Books, з метою отримати «всі книги у світі». Це стратегічне призначення, здається, було спробою відтворити успішний підхід Google до цифровізації книг, який витримав виклики авторського права.

Хоча подібне знищувальне сканування є звичайною практикою для невеликих компаній, підхід Anthropic вражає своїм масштабом. Для компанії швидкість і нижча вартість цього процесу виявилися важливішими, ніж збереження фізичних книг.

Врешті-решт, суддя Вільям Алсуп визнав, що ця операція знищувального сканування відповідає принципам добросовісного використання, але лише тому, що Anthropic спочатку легально придбала книги, знищила кожен примірник після сканування та зберігала цифрові файли внутрішньо. Суддя порівняв цей процес з “економією простору” через конвертацію формату і визнав його трансформаційним. Якби Anthropic дотримувалася цього підходу з самого початку, вона могла б досягти першого легально санкціонованого випадку добросовісного використання AI.