Relatório divulgado por ONG aponta que problema também aparece quanto aos nomes, localização e legendas
O total de 170 fotos de crianças de dez estados brasileiros, entre eles Mato Grosso do Sul, foi encontrado em uso por ferramentas de IA (inteligência artificial) sem que houvesse conhecimento ou consentimento de seus responsáveis.
A constatação aparece em relatório divulgado nesta segunda-feira (10) pela ONG Human Rights Watch. O documento aponta que foram encontrados links para imagens identificáveis de crianças nos dados reunidos por “raspagem” de informações da internet.
Os dados são chamados de LAION-5B e treinam ferramentas populares de IA, conforme explica matéria publicada pela Folha de S. Paulo hoje. A organização sem fins lucrativos alemã que gere essas informações confirmou à Human que o conjunto de dados continha fotos pessoais de crianças e se comprometeu-se a removê-las.
Mas a ONG alerta que as fotos encontradas podem ser só uma pequena amostra do problema, já que o LAION-5B tem 5,85 bilhões imagens e legendas e foram analisadas só 0,0001% do total para a produção do relatório.
Os outros nove estados com crianças identificadas são Alagoas, Bahia, Ceará, Mato Grosso do Sul, Minas Gerais, Paraná, Rio de Janeiro, Rio Grande do Sul, Santa Catarina e São Paulo.
Dá para rastrear – As plataformas de IA também mantém os nomes de algumas crianças nas legendas ou no endereço da Web onde a imagem está armazenada originalmente.
A análise da organização viu que, em muitos casos, as identidades das crianças são rastreáveis por meio de informações sobre quando e onde elas estavam no momento em que a foto foi feita.
Uma das fotos encontradas é de uma menina de dois anos que olha boquiaberta para a irmã recém-nascida. Na legenda, é possível ler o nome das crianças, a localização do hospital e a data em que a bebê nasceu.
Outros exemplos são bebês nas mãos de médicos, crianças soprando velas em aniversário, dançando de cueca em casa, fazendo uma apresentação na escola ou se divertindo no Carnaval.
Algumas das imagens foram postadas por crianças, seus pais ou outros familiares em blogs pessoais e sites de compartilhamento de fotos e vídeos.
Ameaças – O uso indevido das fotos pode acarretar dois problemas, segundo a ONG.
O primeiro é quanto à privacidade, pois informações pessoais podem vazar e cópias idênticas podem ser reproduzidas a partir do material em que a plataforma foi treinada para ler.
O segundo é quando clones de qualquer criança são criados a partir de uma ou mais fotos, uma vez que a plataforma é treinada para modificar imagens.
A Human Rights Watch alerta ainda que as ferramentas podem gerar imagens explícitas de crianças a partir de fotos inofensivas. Vídeos podem ser manipulados mostrando-as falando ou fazendo o que jamais falaram ou fizeram.
Providências – A ONG recomenda que o governo deve reforçar a lei de proteção de dados adotando leis abrangentes para a proteção das crianças.
Ressalta que, em abril, o Conanda (Conselho Nacional dos Direitos da Criança e do Adolescente) publicou uma resolução orientando a si mesmo e ao Ministério dos Direitos Humanos e Cidadania a desenvolver uma política nacional para proteger os direitos das crianças e adolescentes no ambiente digital no prazo de 90 dias.
“Atualmente, sob a lei brasileira, a privacidade de dados das crianças não tem proteção. É preciso ter algum tipo de legislação que realmente proteja as imagens de serem usadas”, disse a pesquisadora da Human Rights Watch, Hye Jung Han, à Folha.