Meta admite ter treinado a Llama AI com livros pirateados

Meta admite ter treinado a Llama AI com livros pirateados

17 Janeiro, 2024 0 Por Sandro Sotto

Levado a tribunal por possíveis violações de propriedade intelectual como parte de seu projeto Llama AI (um modelo de linguagem concorrente do GPT da OpenAI ), a Meta finalmente desistiu num tribunal federal da Califórnia e confessou “usou extratos da base de dados Books3 para treinar o seu Llama AI”.

Llama AI treinado com a base de dados do Books3

Sendo o Books3 (ou melhor… era) uma base de dados de livros em formato digital, muitos dos quais foram simplesmente pirateados, a revelação de Meta tem todos os ingredientes de uma bomba. A Meta certamente não é a única empresa a aproveitar os 37 GB de obras do site pirata, mas o “armário” da empresa já está tão cheio de negócios questionáveis ​​(como Cambridge Analytica) que não é certo que uma confissão seja o suficiente para suavizar os juízes.

Estas novas revelações somam-se agora a uma grande pilha de “vergonha” no sector da IA, com a OpenAI e outras empresas do género a admitirem o uso regular de dados protegidos por direitos de autor para treinar os seus modelos de linguagem.

Normalmente, as empresas destacadas citam a doutrina do “uso justo”, que afirma que “breves trechos de material protegido por direitos autor podem, sob certas circunstâncias, ser citados literalmente para fins como crítica, reportagem, ensino e pesquisa, sem permissão ou pagamento do proprietário dos direitos de autor.”

facebook Meta

Os juízes ficarão convencidos por este sistema de defesa bastante “clássico” no contexto? A evolução da IA ​​do tipo LLM depende, sem dúvida, em parte da sua resposta…

FONTE

Sandro Sotto

Licenciado em Educação Física e apaixonado por novas tecnologias e gadgets. O meu hobbie alem da família e os amigos são os desportos motorizados e mais recentemente comecei a dedicar-me ao mergulho.