{"id":33706,"date":"2025-02-07T11:18:01","date_gmt":"2025-02-07T14:18:01","guid":{"rendered":"https:\/\/tiproject.online\/index.php\/2025\/02\/07\/meta-baixou-mais-de-81-tb-de-livros-piratas-via-torrent-para-treinar-ia\/"},"modified":"2025-02-07T11:18:01","modified_gmt":"2025-02-07T14:18:01","slug":"meta-baixou-mais-de-81-tb-de-livros-piratas-via-torrent-para-treinar-ia","status":"publish","type":"post","link":"https:\/\/tiproject.online\/index.php\/2025\/02\/07\/meta-baixou-mais-de-81-tb-de-livros-piratas-via-torrent-para-treinar-ia\/","title":{"rendered":"Meta baixou mais de 81 TB de livros piratas via torrent para treinar IA"},"content":{"rendered":"<p><\/p>\n<div>\n<p>A <a href=\"https:\/\/www.tecmundo.com.br\/meta\">Meta<\/a>, empresa dona de servi\u00e7os como Facebook, Instagram e WhatsApp, <strong>baixou uma alta quantidade de livros ilegalmente e usou essas obras para treinar a intelig\u00eancia artificial (IA)<\/strong> da empresa. Documentos apresentados em um processo encarado pela empresa nos Estados Unidos, incluindo emails trocados pela equipe, confirmam a acusa\u00e7\u00e3o.<\/p>\n<p>O caso foi revelado <a href=\"https:\/\/www.tecmundo.com.br\/software\/266172-openai-meta-processo-comediante-violacao-direito-autoral.htm\">durante uma a\u00e7\u00e3o judicial encarada pela Meta<\/a> e movida por v\u00e1rios artistas e escritores. Eles alegam que a marca fez o download de c\u00f3pias de obras por fontes il\u00edcitas e, tamb\u00e9m sem qualquer compensa\u00e7\u00e3o, alimentaram o modelo de linguagem da empresa \u2014 que pode gerar conte\u00fados e responder perguntas de usu\u00e1rios usando esse conte\u00fado. H\u00e1 <a href=\"https:\/\/www.tecmundo.com.br\/software\/290383-meta-acusada-usar-milhares-livros-pirateados-treinamento-de-ia.htm\">um segundo processo similar tamb\u00e9m em andamento<\/a> nos Estados Unidos.<\/p>\n<p>A Meta at\u00e9 j\u00e1 havia admitido que baixou bases de dados inteiras de fontes piratas, como o LibGen. Por\u00e9m, as novas mensagens publicadas d\u00e3o mais detalhes do que aconteceu: <strong>al\u00e9m dos 80,6 TB dessa primeira fonte<\/strong>, a companhia <strong>fez o download de mais 35,7 TB de livros da plataforma<\/strong> em uma tentativa posterior e de <strong>ao menos 81,7 TB de dados do Anna&#8221;s Archive<\/strong>, outro servi\u00e7o que disponibiliza obras sem direitos autorais.<\/p>\n<figure class=\"image\"><img  title=\"\" decoding=\"async\" src=\"https:\/\/tm.ibxk.com.br\/2025\/02\/07\/07092109257020.jpg\"  alt=\"07092109257020 Meta baixou mais de 81 TB de livros piratas via torrent para treinar IA\"  srcset=\"https:\/\/tm.ibxk.com.br\/2025\/02\/07\/07092109413024.jpg 245w,https:\/\/tm.ibxk.com.br\/2025\/02\/07\/07092109273022.jpg 500w,https:\/\/tm.ibxk.com.br\/2025\/02\/07\/07092109257021.jpg 750w,https:\/\/tm.ibxk.com.br\/2025\/02\/07\/07092109335023.jpg 1000w,\" sizes=\"100vw\"\/><figcaption>A Meta AI possivelmente se beneficiou de livros baixados ilegalmente. (Imagem: Reprodu\u00e7\u00e3o\/Meta AI)<\/figcaption><\/figure>\n<p>A situa\u00e7\u00e3o da Meta pode piorar devido ao m\u00e9todo utilizado: <strong>a obten\u00e7\u00e3o via torrent significa que<\/strong> <strong>a companhia ajudou a alimentar o download pirata de livros por outros usu\u00e1rios<\/strong>, j\u00e1 que ela serviu como fornecedora de <i>seeds <\/i>para a comunidade. At\u00e9 o momento, a companhia n\u00e3o forneceu os detalhes solicitados pela acusa\u00e7\u00e3o sobre os downloads realizados.<\/p>\n<h2>Funcion\u00e1rios e at\u00e9 Zuckerberg sabiam da ilegalidade<\/h2>\n<p>As mensagens trocadas pela equipe da Meta confirmam que todos estavam conscientes de que o download via torrent de livros de bases de dados como a do LibGen era uma atividade ilegal, que poderia comprometer contratos comerciais ou complicar a empresa no futuro.<\/p>\n<p>&#8220;<strong>Baixar torrent de um laptop corporativo n\u00e3o parece certo<\/strong>&#8220;, disse um dos pesquisadores da Meta, Nikolay Bashlykov, em uma das mensagens \u2014 com o texto acompanhado de um emoji de risada. Em outro recado, um funcion\u00e1rio sugere que &#8220;<strong>o modelo da OpenAI \u00e9 provavelmente treinado<\/strong>&#8221; em bases parecidas, enquanto outro diz que<strong> usar uma VPN para mascarar a conex\u00e3o durante o download seria uma alternativa vi\u00e1vel<\/strong>.<\/p>\n<p><span><iframe title=\"A hist\u00f3ria do Torrent \u2013 Hist\u00f3ria da Tecnologia\" width=\"960\" height=\"540\" src=\"https:\/\/www.youtube.com\/embed\/pQaVDmbQU_U?feature=oembed\" frameborder=\"0\" allow=\"accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share\" referrerpolicy=\"strict-origin-when-cross-origin\" allowfullscreen><\/iframe><\/span><\/p>\n<p>Esse debate indica que <strong>a companhia tentou ao m\u00e1ximo esconder as atividades, usando servidores de fora da empresa<\/strong> para evitar que os dados fossem ligados \u00e0 dona do Facebook. Ela <strong>teria at\u00e9 modifica\u00e7\u00e3o as configura\u00e7\u00f5es do cliente de torrent para enviar o m\u00ednimo poss\u00edvel de <\/strong><i><strong>seeds<\/strong> <\/i>para outros usu\u00e1rios.<\/p>\n<p>O nome do CEO e cofundador Mark Zuckerberg tamb\u00e9m \u00e9 citado. Em uma mensagem, um colaborador informa que a &#8220;<strong>decis\u00e3o de usar<\/strong>&#8221; o LibGen como fonte aconteceu &#8220;<strong>ap\u00f3s a situa\u00e7\u00e3o escalar para o MZ<\/strong>&#8220;, indicando que ele aprovou ou ao menos foi informado do processo \u2014 contrariando depoimentos anteriores que negavam o envolvimento do executivo.<\/p>\n<h2>O que diz a Meta<\/h2>\n<p>A Meta ainda n\u00e3o se pronunciou sobre a publica\u00e7\u00e3o das novas provas. Anteriormente, a companhia sugeriu que o treinamento da IA a partir de bases de dados e livros inteiras era uma quest\u00e3o de <a href=\"https:\/\/www.tecmundo.com.br\/internet\/221269-fair-use-o-uso-aceitavel-obra-intelectual.htm\">&#8220;fair use&#8221; ou de boa f\u00e9<\/a> \u2014 o uso aceit\u00e1vel de uma obra intelectual para determinados fins sem a exig\u00eancia de autoriza\u00e7\u00e3o ou pagamento ao propriet\u00e1rio.<\/p>\n<p>Com as evid\u00eancias em m\u00e3os, os advogados de acusa\u00e7\u00e3o agora querem chamar novamente certas testemunhas, principalmente porque as respostas iniciais agora s\u00e3o consideradas contradit\u00f3rias. Eles acreditam que a adi\u00e7\u00e3o do argumento de que a empresa tentou esconder o download e pode ter colaborado na disponibilidade dos arquivos via torrent pode agravar o caso.<\/p>\n<p>O antigo advogado da empresa no caso, Mark Lemley, pediu demiss\u00e3o <a href=\"https:\/\/www.tecmundo.com.br\/redes-sociais\/401631-advogado-da-meta-demite-empresa-por-inclinacao-ao-neonazismo.htm\">ap\u00f3s as mudan\u00e7as da empresa para agradar o presidente Donald Trump<\/a>.<\/p>\n<\/div>\n<p><a href=\"https:\/\/www.tecmundo.com.br\/mercado\/402337-meta-baixou-mais-de-81-tb-de-livros-piratas-via-torrent-para-treinar-ia.htm\">Link da Materia direta da fonte <\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>A Meta, empresa dona de servi\u00e7os como Facebook, Instagram e WhatsApp, baixou uma alta quantidade de livros ilegalmente e usou essas obras para treinar a intelig\u00eancia artificial (IA) da empresa. Documentos apresentados em um processo encarado pela empresa nos Estados Unidos, incluindo emails trocados pela equipe, confirmam a acusa\u00e7\u00e3o. O caso foi revelado durante uma a\u00e7\u00e3o judicial encarada pela Meta e movida por v\u00e1rios artistas e escritores. Eles alegam que a marca fez o download de c\u00f3pias de obras por fontes il\u00edcitas e, tamb\u00e9m sem qualquer compensa\u00e7\u00e3o, alimentaram o modelo de linguagem da empresa \u2014 que pode gerar conte\u00fados e responder perguntas de usu\u00e1rios usando esse conte\u00fado. H\u00e1 um segundo processo similar tamb\u00e9m em andamento nos Estados Unidos. A Meta at\u00e9 j\u00e1 havia admitido que baixou bases de dados inteiras de fontes piratas, como o LibGen. Por\u00e9m, as novas mensagens publicadas d\u00e3o mais detalhes do que aconteceu: al\u00e9m dos 80,6 TB dessa primeira fonte, a companhia fez o download de mais 35,7 TB de livros da plataforma em uma tentativa posterior e de ao menos 81,7 TB de dados do Anna&#8221;s Archive, outro servi\u00e7o que disponibiliza obras sem direitos autorais. A Meta AI possivelmente se beneficiou de livros baixados ilegalmente. (Imagem: Reprodu\u00e7\u00e3o\/Meta AI) A situa\u00e7\u00e3o da Meta pode piorar devido ao m\u00e9todo utilizado: a obten\u00e7\u00e3o via torrent significa que a companhia ajudou a alimentar o download pirata de livros por outros usu\u00e1rios, j\u00e1 que ela serviu como fornecedora de seeds para a comunidade. At\u00e9 o momento, a companhia n\u00e3o forneceu os detalhes solicitados pela acusa\u00e7\u00e3o sobre os downloads realizados. Funcion\u00e1rios e at\u00e9 Zuckerberg sabiam da ilegalidade As mensagens trocadas pela equipe da Meta confirmam que todos estavam conscientes de que o download via torrent de livros de bases de dados como a do LibGen era uma atividade ilegal, que poderia comprometer contratos comerciais ou complicar a empresa no futuro. &#8220;Baixar torrent de um laptop corporativo n\u00e3o parece certo&#8220;, disse um dos pesquisadores da Meta, Nikolay Bashlykov, em uma das mensagens \u2014 com o texto acompanhado de um emoji de risada. Em outro recado, um funcion\u00e1rio sugere que &#8220;o modelo da OpenAI \u00e9 provavelmente treinado&#8221; em bases parecidas, enquanto outro diz que usar uma VPN para mascarar a conex\u00e3o durante o download seria uma alternativa vi\u00e1vel. Esse debate indica que a companhia tentou ao m\u00e1ximo esconder as atividades, usando servidores de fora da empresa para evitar que os dados fossem ligados \u00e0 dona do Facebook. Ela teria at\u00e9 modifica\u00e7\u00e3o as configura\u00e7\u00f5es do cliente de torrent para enviar o m\u00ednimo poss\u00edvel de seeds para outros usu\u00e1rios. O nome do CEO e cofundador Mark Zuckerberg tamb\u00e9m \u00e9 citado. Em uma mensagem, um colaborador informa que a &#8220;decis\u00e3o de usar&#8221; o LibGen como fonte aconteceu &#8220;ap\u00f3s a situa\u00e7\u00e3o escalar para o MZ&#8220;, indicando que ele aprovou ou ao menos foi informado do processo \u2014 contrariando depoimentos anteriores que negavam o envolvimento do executivo. O que diz a Meta A Meta ainda n\u00e3o se pronunciou sobre a publica\u00e7\u00e3o das novas provas. Anteriormente, a companhia sugeriu que o treinamento da IA a partir de bases de dados e livros inteiras era uma quest\u00e3o de &#8220;fair use&#8221; ou de boa f\u00e9 \u2014 o uso aceit\u00e1vel de uma obra intelectual para determinados fins sem a exig\u00eancia de autoriza\u00e7\u00e3o ou pagamento ao propriet\u00e1rio. Com as evid\u00eancias em m\u00e3os, os advogados de acusa\u00e7\u00e3o agora querem chamar novamente certas testemunhas, principalmente porque as respostas iniciais agora s\u00e3o consideradas contradit\u00f3rias. Eles acreditam que a adi\u00e7\u00e3o do argumento de que a empresa tentou esconder o download e pode ter colaborado na disponibilidade dos arquivos via torrent pode agravar o caso. O antigo advogado da empresa no caso, Mark Lemley, pediu demiss\u00e3o ap\u00f3s as mudan\u00e7as da empresa para agradar o presidente Donald Trump. Link da Materia direta da fonte<\/p>\n","protected":false},"author":1,"featured_media":33707,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"om_disable_all_campaigns":false,"_uf_show_specific_survey":0,"_uf_disable_surveys":false,"footnotes":""},"categories":[37],"tags":[],"class_list":["post-33706","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-tecnologia"],"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/tiproject.online\/index.php\/wp-json\/wp\/v2\/posts\/33706","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/tiproject.online\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/tiproject.online\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/tiproject.online\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/tiproject.online\/index.php\/wp-json\/wp\/v2\/comments?post=33706"}],"version-history":[{"count":0,"href":"https:\/\/tiproject.online\/index.php\/wp-json\/wp\/v2\/posts\/33706\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/tiproject.online\/index.php\/wp-json\/wp\/v2\/media\/33707"}],"wp:attachment":[{"href":"https:\/\/tiproject.online\/index.php\/wp-json\/wp\/v2\/media?parent=33706"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/tiproject.online\/index.php\/wp-json\/wp\/v2\/categories?post=33706"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/tiproject.online\/index.php\/wp-json\/wp\/v2\/tags?post=33706"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}