Uso de dados públicos da internet para treinar IA da Google é preocupante, alerta especialista

Atualização da política de privacidade reserva à empresa o direito de usar dados disponíveis em qualquer parte da web pública para treinamento do Bard e IA na nuvem

Pela primeira vez, a Google LCC – empresa multinacional americana de tecnologia – cita, de forma expressa, que ela poderá coletar informações disponíveis publicamente online ou de outras fontes públicas para ajudar a treinar seus modelos de Inteligência Artificial (IA). A Big Tech já utilizava essa forma de coleta para alimentar recursos como o Google Tradutor, mas desta vez acrescentou o Bard e o CloudAI (IA na nuvem). O advogado especialista em Direito Digital e Proteção de Dados Rafael Maciel avalia que a cláusula é incomum para uma política de privacidade e alerta que a atualização é preocupante porque torna a gigante da tecnologia uma espécie de “dona da internet”.

Rafael esclarece que, na nova política, a Google se reserva o direito de coletar e aproveitar os dados publicados em qualquer parte da web pública. Na prática, a situação levanta questões de privacidade, uma vez que não se trata mais de quem pode ver essas informações, mas como elas podem ser utilizadas. “Talvez seja uma estratégia de que ela pode realmente usar os conteúdos, por exemplo, no blogger ou em outros sites e informações coletadas em serviços da Google. É como se ela dissesse que tudo o que está na internet que você deixou publicado e que o Google Buscador identificar, localizar e indexar como resultado de pesquisa, poderá ser usado para o aprendizado da máquina”, aponta.

A mudança não é exatamente uma novidade no mundo das IAs generativas. De acordo com o advogado, já há discussões sobre o uso de imagens que estão disponíveis no Google para outros aprendizados. “No entanto, não está claro, na maioria das vezes, se essa coleta de dados é legal ou não”, pontua. Enquanto a questão jurídica não se consolida, Rafael orienta que quem não quiser ter suas informações “raspadas”, deve selecionar as ferramentas de não indexação, para que o robô da Google – o robots.txt – identifique que aquele conteúdo tem uma limitação. “Esse conflito sobre informações dará uma alavancada com a Google dizendo que o conteúdo é todo dela. Preocupante sim, sem dúvidas, o que mostra que essa guerra pela tecnologia IA está longe de acabar”, arremata.

Uso de dados públicos da internet para treinar IA da Google é preocupante, alerta especialista

COMMENTS

Deixe um comentário Cancelar resposta

Uso de dados públicos da internet para treinar IA da Google é preocupante, alerta especialista

RECOMMENDED FOR YOU

COMMENTS

Deixe um comentário Cancelar resposta