{"id":39161,"date":"2025-03-18T05:37:08","date_gmt":"2025-03-18T08:37:08","guid":{"rendered":"https:\/\/tiproject.online\/index.php\/2025\/03\/18\/o-que-e-o-teste-impossivel-da-ia\/"},"modified":"2025-03-18T05:37:08","modified_gmt":"2025-03-18T08:37:08","slug":"o-que-e-o-teste-impossivel-da-ia","status":"publish","type":"post","link":"https:\/\/tiproject.online\/index.php\/2025\/03\/18\/o-que-e-o-teste-impossivel-da-ia\/","title":{"rendered":"o que \u00e9 o teste &#8216;imposs\u00edvel&#8217; da IA?"},"content":{"rendered":"<p><\/p>\n<div data-v-232111b4=\"\" data-v-0413e3c7=\"\"><!----><\/p>\n<p class=\"bullet mt-0\" data-v-232111b4=\"\"><cite>Perguntas muito dif\u00edceis, muito sofisticadas mesmo. Se a IA passar nisso aqui, quer dizer que n\u00e3o temos mais conhecimentos para testar essa intelig\u00eancia artificial, do ponto de vista de conte\u00fado<\/cite><br \/><strong>Diogo Cortiz<\/strong><\/p>\n<h2 class=\"bullet\" data-v-232111b4=\"\"><strong>Benchmark de respeito<\/strong><\/h2>\n<p><!----><\/p>\n<p class=\"bullet\" data-v-232111b4=\"\">Para avaliar a capacidade de um determinado modelo de IA, pesquisadores usam benchmarks. Eles s\u00e3o avalia\u00e7\u00f5es para mensurar o n\u00edvel de profici\u00eancia de uma ferramenta em um conjunto de habilidades. Por exemplo, se uma IA \u00e9 boa em traduzir de um idioma para outro, programar c\u00f3digos, fazer c\u00e1lculos ou reconhecer e elaborar imagens.<\/p>\n<p class=\"bullet\" data-v-232111b4=\"\">Esses testes possuem algo como uma &#8220;nota de corte&#8221;, que \u00e9 a pontua\u00e7\u00e3o mais alta feita por um ser humano. Quando uma IA passa essa marca, os observadores dizem que ela superou a capacidade humana em determinada \u00e1rea.<\/p>\n<p class=\"bullet\" data-v-232111b4=\"\"><cite>Muitas vezes a gente coloca que a IA \u00e9 melhor que o humano para fazer determinada tarefa. A gente assume isso. Mas, na verdade, o que a gente quer dizer \u00e9 que o modelo \u00e9 melhor que o humano para fazer essa tarefa dentro dessa avalia\u00e7\u00e3o espec\u00edfica<\/cite><br \/><strong>Diogo Cortiz<\/strong><\/p>\n<p><!----><\/p>\n<p class=\"bullet\" data-v-232111b4=\"\">Elaborada pelo Center for AI Safety e pela Scale AI, a &#8220;\u00daltima Prova da Humanidade&#8221; \u00e9 um desses benckmarks.<\/p>\n<p><!----><!----><\/div>\n<p><script>!function(f,b,e,v,n,t,s) {if(f.fbq)return;n=f.fbq=function() {n.callMethod? n.callMethod.apply(n,arguments):n.queue.push(arguments)}; if(!f._fbq)f._fbq=n;n.push=n;n.loaded=!0;n.version='2.0'; n.queue=[];t=b.createElement(e);t.async=!0; t.src=v;s=b.getElementsByTagName(e)[0]; s.parentNode.insertBefore(t,s)}(window, document,'script', 'https:\/\/connect.facebook.net\/en_US\/fbevents.js'); fbq('init', '1425099884432564'); fbq('track', 'PageView', { content_name: '&#39;\u00daltima Prova da Humanidade&#39;: por que teste &#39;imposs\u00edvel&#39; foi criado para IA', content_ids: [80093,13703,81965,80092,77838,79221,79222,22364,35978,13474,16729,81430], is_closed: false, });<\/script><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Perguntas muito dif\u00edceis, muito sofisticadas mesmo. Se a IA passar nisso aqui, quer dizer que n\u00e3o temos mais conhecimentos para testar essa intelig\u00eancia artificial, do ponto de vista de conte\u00fadoDiogo Cortiz Benchmark de respeito Para avaliar a capacidade de um determinado modelo de IA, pesquisadores usam benchmarks. Eles s\u00e3o avalia\u00e7\u00f5es para mensurar o n\u00edvel de profici\u00eancia de uma ferramenta em um conjunto de habilidades. Por exemplo, se uma IA \u00e9 boa em traduzir de um idioma para outro, programar c\u00f3digos, fazer c\u00e1lculos ou reconhecer e elaborar imagens. Esses testes possuem algo como uma &#8220;nota de corte&#8221;, que \u00e9 a pontua\u00e7\u00e3o mais alta feita por um ser humano. Quando uma IA passa essa marca, os observadores dizem que ela superou a capacidade humana em determinada \u00e1rea. Muitas vezes a gente coloca que a IA \u00e9 melhor que o humano para fazer determinada tarefa. A gente assume isso. Mas, na verdade, o que a gente quer dizer \u00e9 que o modelo \u00e9 melhor que o humano para fazer essa tarefa dentro dessa avalia\u00e7\u00e3o espec\u00edficaDiogo Cortiz Elaborada pelo Center for AI Safety e pela Scale AI, a &#8220;\u00daltima Prova da Humanidade&#8221; \u00e9 um desses benckmarks.<\/p>\n","protected":false},"author":1,"featured_media":39162,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"om_disable_all_campaigns":false,"_uf_show_specific_survey":0,"_uf_disable_surveys":false,"footnotes":""},"categories":[37],"tags":[],"class_list":["post-39161","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-tecnologia"],"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/tiproject.online\/index.php\/wp-json\/wp\/v2\/posts\/39161","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/tiproject.online\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/tiproject.online\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/tiproject.online\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/tiproject.online\/index.php\/wp-json\/wp\/v2\/comments?post=39161"}],"version-history":[{"count":0,"href":"https:\/\/tiproject.online\/index.php\/wp-json\/wp\/v2\/posts\/39161\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/tiproject.online\/index.php\/wp-json\/wp\/v2\/media\/39162"}],"wp:attachment":[{"href":"https:\/\/tiproject.online\/index.php\/wp-json\/wp\/v2\/media?parent=39161"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/tiproject.online\/index.php\/wp-json\/wp\/v2\/categories?post=39161"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/tiproject.online\/index.php\/wp-json\/wp\/v2\/tags?post=39161"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}