Veículos bloqueiam rastreador do ChatGPT porque querem remuneração pelo conteúdo

Publicado originalmente em *Desinformante por Matheus Soares. Para acessar, clique aqui.

Desde agosto, pelo menos 535 veículos de notícias já bloquearam os mecanismos de extração de dados da OpenAI para treinamento dos sistemas de Inteligência Artificial, como o ChatGPT. É o que afirma a jornalista norte-americana Nitasha Tiku em matéria recente no The Washington Post. Alguns veículos já estão em negociação com a empresa de tecnologia para que as informações utilizadas sejam remuneradas.

The New York Times, Reuters e CNN são alguns dos veículos de comunicação que já adicionaram mecanismos nos seus sites para bloquear o GPTBot, um rastreador da web desenvolvido pela OpenAI que verifica páginas online para extração de informações a serem usadas para melhorar os sistemas de IA da empresa.  Funcionalidades como o ChatGPT precisam de uma grande quantidade de dados para o seu funcionamento.

Nos últimos anos, a extração de conteúdos publicados de forma pública na Internet, incluindo notícias produzidas por veículos de comunicação e até postagens de usuários nas redes sociais, é uma das principais práticas realizadas pelas corporações de tecnologia para criar banco de dados de aperfeiçoamento de sistemas IA.

Desde o início do ano, os veículos vêm criticando o uso indiscriminado dos dados pelas corporações de IA. Em abril, o conselheiro geral da News Corp, empresa norte-americana proprietária de marcas como Fox News e The Wall Street Journal, afirmou que “qualquer pessoa que queira usar o trabalho dos jornalistas do Wall Street Journal para treinar inteligência artificial deveria licenciar adequadamente os direitos para fazê-lo”.

No site da OpenAI, a empresa publicou um tutorial ensinando como bloquear o GPTBot ou até mesmo selecionar quais partes do site o mecanismo de extração pode acessar. O Google também anunciou recentemente uma nova funcionalidade chamada “Google-Extended” que permitirá que editores de sites em geral possam decidir se as publicações serão rastreadas pelos mecanismos de extração de dados que alimentam os sistemas inteligentes da bigtech. De acordo com a plataforma, o bloqueio dos rastreadores não afetará a indexação dos sites nas páginas de resultados de buscas.

Veículos negociam remuneração com OpenAI

Ainda de acordo com a matéria do The Washington Post, algumas organizações de mídia já começaram a entrar em negociações com a OpenAI para que a corporação pague diretamente aos jornais pelos conteúdos utilizados. Segundo as fontes ouvidas pela reportagem, os veículos buscam também um acordo para adicionar links das notícias nas respostas dadas pelo ChatGPT, o que pode aumentar o tráfego para suas respectivas páginas.

Em julho, a empresa de IA já havia fechado um acordo com a Associated Press para usar os conteúdos textuais da agência de notícias norte-americana. Detalhes financeiros da negociação não foram divulgados. “Estamos satisfeitos que a OpenAI reconheça que o conteúdo de notícias apartidário e baseado em fatos é essencial para esta tecnologia em evolução e que respeita o valor de nossa propriedade intelectual”, disse em declaração Kristin Heitmann, vice-presidente sênior e diretora de receitas da AP.

As ações dos veículos midiáticos vêm no momento em que a discussão sobre a necessidade da remuneração do jornalismo por empresas de tecnologia ganha destaque no contexto internacional, incentivadas por leis já aprovadas como a do Canadá e da Austrália. No Brasil, a remuneração do jornalismo está prevista no Projeto de Lei 2370/2019. Em todos os casos, o foco são as plataformas digitais de redes sociais (como Meta, Youtube, etc.), sem considerar o recente surgimento das IAs generativas.

Um chatbot pra chamar de seu

Enquanto alguns veículos buscam negociar diretamente com a OpenAI, outros estão correndo para lançar suas próprias versões de chatbot inteligente. No Brasil, nesta semana, o Estadão anunciou o lançamento da Leia, uma IA para tirar dúvidas dos leitores a partir dos conteúdos publicados pelo próprio jornal. De acordo com a empresa, o treinamento da tecnologia com informações produzidas pelos jornalistas da casa reduz as chances de erros e respostas falsas, as chamadas “alucinações de IA”.

O Núcleo também já possui desde agosto a sua própria IA, chamada de NuclitoGPT, desenvolvida para facilitar a busca por informações resumidas e verificadas sobre plataformas digitais e redes sociais. O Nuclito é construído em cima da API do modelo GPT-4 da Open IA.

Compartilhe:

Share on whatsapp
Share on twitter
Share on facebook
Share on email
Share on linkedin
Share on telegram
Share on google
Language »
Fonte
Contraste