Anthropic adquire milhões de livros e treina IA com ex-chefe do Google Books

a Anthropic comprou milhões de livros, treinou sua IA e os destruiu, graças a um ex-chefe do Google Books — Foto: Xataka

A empresa de inteligência artificial Anthropic está enfrentando um processo judicial por suposto uso indevido de conteúdo de terceiros para treinar sua inteligência artificial, chamada Claude. A controvérsia envolve a utilização de milhões de livros, que a empresa afirma ter adquirido legalmente. Recentemente, surgiram novas informações sobre o destino desses livros após o uso.

Relatórios indicam que, para desenvolver Claude, a Anthropic investiu grandes quantias na digitalização de livros impressos. Em um processo descrito em documentos judiciais, a empresa cortou as encadernações de milhões de livros, converteu os conteúdos em arquivos digitais e, em seguida, destruiu os originais. Essa prática chamou a atenção, considerando a discussão em torno do uso de textos e obras criativas para o treinamento de modelos de IA.

O avanço das tecnologias de IA geradoras de texto tem gerado debates sobre como esses sistemas aprendem a produzir conteúdo. Muitas vezes, essas máquinas são alimentadas com dados que incluem livros e textos, frequentemente sem a autorização dos autores ou sem pagamento de royalties, o que levanta questões sobre direitos autorais.

Documentos judiciais também revelaram que, em fevereiro de 2024, a Anthropic contratou Tom Turvey, um ex-executivo do Google Books, com a missão de conseguir “todos os livros do mundo”. Essa contratação reforça a intenção da empresa de expandir suas fontes de dados para treinamento de suas IAs.

A questão que fica no ar é como as práticas da Anthropic e de outras empresas desse setor afetarão o futuro do conteúdo literário e os direitos dos autores. O caso ainda está em andamento e poderá impactar a forma como as tecnologias de IA são desenvolvidas e supervisionadas no mercado.