Legenda da foto, Paul Skye Lehrman e Linnea Sage entraram com uma ação coletiva contra a plataforma Lovo.

  • Author, Ben Derico
  • Role, Repórter de tecnologia, de São Francisco (EUA) para a BBC News

Mas, para Paul Skye Lehrman, este alerta foi particularmente pessoal, inesperado e assustador. Ele ouviu o aviso com a sua própria voz.

Em junho de 2023, Lehrman e sua parceira Linnea Sage andavam de carro perto de casa, em Nova York, nos Estados Unidos. Eles ouviam um podcast sobre as greves em Hollywood e como a inteligência artificial (IA) poderá afetar aquele setor.

O episódio era interessante porque o casal é profissional de dublagem. E, como muitos outros artistas criativos, eles receiam que os geradores de voz que parecem humanos logo poderão ser empregados para substituí-los.

E aquele podcast tinha um atrativo específico. Era uma entrevista com um chatbot gerado por IA, equipado com software que transforma texto em fala. A intenção era saber dele quais as possíveis consequências do uso da inteligência artificial para os empregos em Hollywood.

Mas, quando o chatbot falou, sua voz se parecia exatamente com a de Paul Lehrman.

“Tivemos de estacionar o carro”, ele conta. “A ironia era que a IA está chegando à indústria do entretenimento e ali estava a minha voz, falando sobre a possível destruição do setor. Realmente, foi muito assustador.”

Naquela noite, eles passaram horas online procurando indicações sobre o que poderia ter ocorrido, até que eles chegaram ao site da plataforma Lovo, que transforma texto em fala. Ali, Sage conta que também encontrou uma cópia da voz dela.

“Fiquei impressionada”, relembra ela. “Não conseguia acreditar. Uma empresa de tecnologia roubou as nossas vozes, fez clones delas com IA e as vendeu, talvez centenas de milhares de vezes.”

O casal processou a Lovo e a empresa ainda não respondeu à ação, nem aos pedidos de comentários da BBC.

Guerra dos clones

Mas como a Lovo conseguiu recriar as duas vozes? O casal afirma que tudo foi feito sob falsos pretextos.

Um dos fundadores da Lovo, Tom Lee, havia dito anteriormente que seu software de clonagem de voz precisa apenas que o usuário leia cerca de 50 sentenças para criar um clone confiável.

“Nós conseguimos capturar o tom, as características, o estilo, os fonemas e, até se você tiver sotaque, também conseguimos capturar”, contou ele ao podcast Future Visionaries, em 2021.

Na ação judicial, Lehrman e Sage descrevem como eles acreditam que a Lovo tenha conseguido essa gravação das suas vozes.

Eles alegam que funcionários anônimos da Lovo entraram em contato com eles para gravar trechos de áudio no popular website Fiverr, para talentos freelancer. Lá, eles vendiam seus serviços para fornecer áudio para o rádio, televisão, videogames e outros meios.

Sage conta que, em 2019, um usuário entrou em contato com ela, pedindo que ela gravasse dezenas de testes de roteiros de rádio, aparentemente genéricos.

As gravações de teste costumam ser usadas no cinema e na televisão para grupos de referência, reuniões internas ou para reservar espaços para trabalhos em andamento. E, como estas gravações não serão amplamente compartilhadas, elas custam muito menos do que o áudio destinado a transmissão.

Sage afirma que realizou o trabalho, forneceu os arquivos e recebeu por eles US$ 400 (cerca de R$ 2.200).

Lehrman conta que recebeu um pedido similar de gravação de dezenas de anúncios de rádio com sons genéricos, cerca de seis meses depois.

Crédito, Reprodução

Legenda da foto, As mensagens da plataforma Fiverr indicam que as gravações se dedicavam a pesquisas ‘sobre síntese de fala com diferentes sotaques e vozes’

Nas mensagens compartilhadas pelo casal com a BBC, o usuário anônimo do Fiverr afirma que o áudio seria usado para pesquisas com “síntese de fala”.

Depois de pedir ao usuário a garantia de que os roteiros não serão empregados fora do seu projeto de pesquisa específico, Lehrman perguntou qual seria o objetivo do projeto.

“Os roteiros não serão empregados para nada além disso”, declarou o usuário, “e ainda não posso contar o objetivo, pois é um trabalho confidencial em andamento. Desculpe, haha.”

Lehrman perguntou se os arquivos terminados seriam redirecionados ou empregados em outra ordem. O usuário respondeu que os arquivos seriam utilizados apenas para fins de pesquisa.

Ele conta que enviou os arquivos e recebeu US$ 1.200 (cerca de R$ 6.700). E a conexão entre o usuário anônimo e a Lovo veio, segundo eles, da própria Lovo.

Eles apresentaram as evidências encontradas sobre a clonagem das suas vozes para a Lovo, que respondeu que não havia feito nada de errado. A empresa indicou as comunicações entre eles e o usuário anônimo, como prova de que havia feito contato com o casal legalmente.

“Nas nossas carreiras, já fornecemos mais de 100 mil gravações de áudio”, conta Lehrman, sobre seu trabalho no Fiverr por mais de meia década. “Conseguimos encontrar esta agulha no palheiro.”

Nos dois casos, Lehrman e Sage afirmam que não tinham contrato por escrito, apenas os diálogos. A BBC não conseguiu verificar todas as suas conversas. O casal declarou que o usuário com quem eles conversaram também parece ter excluído algumas mensagens.

A BBC entrou em contato com a Lovo em diversas ocasiões para pedir uma entrevista com Lee e buscar uma resposta às afirmações do casal. A empresa não respondeu às nossas mensagens.

Crédito, Reprodução

Legenda da foto, O usuário do Fiverr afirmou ao casal que eram ‘roteiros de teste para anúncios’

O que diz a lei?

O casal deu entrada no processo em maio. A ação alega que a Lovo usou as gravações para criar cópias que concorrem ilegalmente com as vozes reais de Sage e Lehrman. Eles afirmam que a empresa agiu sem permissão, nem remuneração adequada.

Esta é uma ação coletiva, ou seja, o casal espera que outros demandantes entrem no processo, o que, até agora, não aconteceu.

A professora Kristelia Garcia, especialista em direito da propriedade intelectual da Universidade Georgetown em Washington DC, nos Estados Unidos, afirma que o caso provavelmente se enquadra em uma área da legislação norte-americana referente aos direitos de publicidade.

Também denominados direitos de personalidade, eles incluem as violações da personalidade de alguém, frequentemente devido ao abuso ou desvirtuamento da voz ou da imagem de uma pessoa.

Garcia também afirma que, provavelmente, haverá uma quebra de contrato em relação às licenças concedidas por Sage e Lehrman ao usuário que encomendou as gravações.

“As licenças são permissões de uso restrito e muito específico”, explicou ela à BBC.

“Eu posso dar a você uma licença para usar minha piscina por uma tarde, mas isso não significa que você pode vir sempre que quiser e dar uma festa na minha piscina. Isso excederia os termos da licença.”

Seja qual for o resultado do processo, esta é mais uma em uma longa lista de ações judiciais apresentadas por artistas, escritores, ilustradores e músicos, que não querem perder o controle do seu trabalho e do seu sustento. E, provavelmente, eles são apenas a ponta do iceberg.

No início de setembro, a empresa financeira Klarna anunciou que pretende usar a IA para reduzir sua equipe de trabalho pela metade. E alguns especialistas preveem que 40% de todos os empregos irão sofrer os impactos da IA.

Mas, para Paul Skye Lehrman e Linnea Sage, as preocupações com o futuro chegaram mais cedo.

Para Sage, “toda esta experiência parece surreal. Quando pensamos em inteligência artificial, pensamos na IA dobrando nossa roupa lavada e fazendo o jantar, não explorando os esforços de criação dos indivíduos”.