Uso de dados públicos da internet para treinar IA da Google é preocupante, alerta especialista

HomeMundo

Uso de dados públicos da internet para treinar IA da Google é preocupante, alerta especialista

Lançamento da My Broker Hidrolândia em Goiás
Empresário é preso por venda ilegal de anabolizantes e medicamentos, em Goiânia
Criolo será uma das atrações do Fica 2023

Atualização da política de privacidade reserva à empresa o direito de usar dados disponíveis em qualquer parte da web pública para treinamento do Bard e IA na nuvem

 Pela primeira vez, a Google LCC – empresa multinacional americana de tecnologia – cita, de forma expressa, que ela poderá coletar informações disponíveis publicamente online ou de outras fontes públicas para ajudar a treinar seus modelos de Inteligência Artificial (IA). A Big Tech já utilizava essa forma de coleta para alimentar recursos como o Google Tradutor, mas desta vez acrescentou o Bard e o CloudAI (IA na nuvem). O advogado especialista em Direito Digital e Proteção de Dados Rafael Maciel avalia que a cláusula é incomum para uma política de privacidade e alerta que a atualização é preocupante porque torna a gigante da tecnologia uma espécie de “dona da internet”.

Rafael esclarece que, na nova política, a Google se reserva o direito de coletar e aproveitar os dados publicados em qualquer parte da web pública. Na prática, a situação levanta questões de privacidade, uma vez que não se trata mais de quem pode ver essas informações, mas como elas podem ser utilizadas. “Talvez seja uma estratégia de que ela pode realmente usar os conteúdos, por exemplo, no blogger ou em outros sites e informações coletadas em serviços da Google. É como se ela dissesse que tudo o que está na internet que você deixou publicado e que o Google Buscador identificar, localizar e indexar como resultado de pesquisa, poderá ser usado para o aprendizado da máquina”, aponta.

A mudança não é exatamente uma novidade no mundo das IAs generativas. De acordo com o advogado, já há discussões sobre o uso de imagens que estão disponíveis no Google para outros aprendizados. “No entanto, não está claro, na maioria das vezes, se essa coleta de dados é legal ou não”, pontua. Enquanto a questão jurídica não se consolida, Rafael orienta que quem não quiser ter suas informações “raspadas”, deve selecionar as ferramentas de não indexação, para que o robô da Google – o robots.txt – identifique que aquele conteúdo tem uma limitação. “Esse conflito sobre informações dará uma alavancada com a Google dizendo que o conteúdo é todo dela. Preocupante sim, sem dúvidas, o que mostra que essa guerra pela tecnologia IA está longe de acabar”, arremata.

COMMENTS

WORDPRESS: 0
    Hoje é