Empreiteiros OpenAI solicitados a enviar trabalhos anteriores para treinamento em IA

20

A OpenAI, a empresa por trás do ChatGPT, está solicitando que prestadores de serviços terceirizados enviem amostras de trabalho genuínas de seus empregos anteriores e atuais. Esta prática, revelada num relatório da Wired, levanta questões sobre propriedade intelectual e segurança de dados na indústria de IA em rápida evolução.

A indústria de IA sedenta de dados

A mudança parece fazer parte de uma tendência mais ampla entre os desenvolvedores de IA. Estas empresas dependem cada vez mais de prestadores de serviços para gerar dados de formação de alta qualidade, com o objetivo final de automatizar mais tarefas administrativas. A lógica é simples: melhores dados de treinamento levam a modelos de IA mais capazes. A apresentação interna da OpenAI, conforme descrita no relatório, pede explicitamente aos empreiteiros que forneçam exemplos de “trabalho real no trabalho” – incluindo documentos, planilhas, imagens e até repositórios de código.

Riscos e advertências

Embora a OpenAI instrua os prestadores de serviços a limpar informações confidenciais e pessoais antes de carregá-las, os especialistas jurídicos alertam que esta abordagem é inerentemente arriscada.

“Qualquer laboratório de IA que adote essa abordagem está se colocando em grande risco”, afirma o advogado de propriedade intelectual Evan Brown. “É preciso muita confiança nos empreiteiros para decidir o que é ou não confidencial.”

A empresa ainda fornece acesso a uma ferramenta alimentada por ChatGPT, chamada “Superstar Scrubbing”, para auxiliar na higienização de dados. No entanto, a confiança no auto-policiamento dos contratantes levanta preocupações sobre potenciais fugas de informações confidenciais ou proprietárias. A OpenAI se recusou a comentar o assunto.

Por que isso é importante

Esta prática destaca a intensa pressão que as empresas de IA enfrentam para adquirir dados de formação de alta qualidade. À medida que os modelos se tornam mais sofisticados, a procura de exemplos do mundo real – em vez de conjuntos de dados sintéticos ou disponíveis publicamente – provavelmente aumentará. As implicações éticas e legais desta abordagem permanecem pouco claras, especialmente no que diz respeito aos direitos dos trabalhadores, à propriedade intelectual e à privacidade dos dados.

A dependência de prestadores de serviços também sublinha o trabalho oculto por trás do desenvolvimento da IA. Embora grande parte da conversa se centre na tecnologia em si, o esforço humano necessário para treinar estes modelos muitas vezes não é reconhecido.

No final, as ações da OpenAI revelam uma estratégia pragmática, mas potencialmente imprudente: aproveitar o trabalho humano para alimentar o progresso da IA, mesmo que isso signifique navegar em território jurídico e ético obscuro.