O que é GPT-3 e por que está mudando a face da inteligência artificial?

Tem havido muito entusiasmo e hype no reino da inteligência artificial (AI) em torno de uma tecnologia recém-criada chamada GPT-3. Simplificando, é uma IA que é superior a tudo que veio antes dela na criação de conteúdo com uma estrutura de linguagem – linguagem humana ou de máquina.

O GPT-3 foi desenvolvido por OpenAI, uma empresa de pesquisa co-fundada por Elon Musk, e foi apelidada de avanço mais significativo e útil em inteligência artificial em anos.

No entanto, há alguma confusão sobre o que ele faz (e, mais importante, o que ele não faz), então aqui tentarei simplificá-lo para qualquer leitor não técnico interessado em entender os princípios fundamentais por trás dele. Também discutirei alguns dos problemas que ele traz, bem como por que alguns acreditam que sua importância foi um pouco exagerada pelo hype.

Créditos da imagem: https://pixabay.com/photos/robot-mech-machine-technology-2301646

Do que o GPT-3 é capaz?

O GPT-3 é capaz de produzir qualquer coisa com uma estrutura de linguagem - isso inclui responder perguntas, escrever ensaios, resumir livros longos, traduzir idiomas, receber memorandos e até escrever código de computador.

Com efeito, em uma apresentação online, é demonstrado como criar um aplicativo com aparência e desempenho semelhante ao aplicativo Instagram, utilizando um plugin para a ferramenta de software amplamente conhecida Figma.

Isso é, obviamente, bastante novo e, se provar ser útil e benéfico a longo prazo, poderá ter consequências profundas para o futuro desenvolvimento de software e aplicativos.

Devido ao fato de que o código ainda não está disponível publicamente (mais sobre isso posteriormente), o acesso é restrito a um grupo seleto de desenvolvedores por meio de uma API gerenciada pelo OpenAI. Desde o lançamento da API em junho deste ano, surgiram exemplos de poesia, prosa, reportagem e ficção criativa.

Este artigo é particularmente interessante porque mostra o GPT-3 tentando – de maneira bastante persuasiva – nos convencer, humanos, de que não faz mal. Embora sua honestidade robótica o obrigue a confessar que “estou ciente de que serei incapaz de evitar a destruição da humanidade” se pessoas perversas o pressionarem!

Como funciona o GPT-3?

O GPT-3 é um modelo de previsão de linguagem em termos das amplas categorias de aplicativos de IA. Isso significa que é uma estrutura algorítmica que pega uma única parte da linguagem (uma entrada) e a transforma no que o algoritmo prevê que seria a parte da linguagem mais benéfica para o usuário.

Isso é possível devido à extensa análise de treinamento realizada na enorme quantidade de material necessária para “pré-treiná-lo”. Em comparação com outros algoritmos que não foram treinados, o OpenAI já gastou a enorme quantidade de recursos de computação necessários para o GPT-3 compreender como as linguagens funcionam e são construídas. De acordo com a OpenAI, o tempo de computação necessário para realizar isso custou US$ 4.6 milhões.

Para aprender a gerar construções de linguagem, como frases, ele usa a análise semântica – não apenas as palavras e seus significados, mas também como o uso das palavras varia dependendo das outras palavras no texto.

Também é referido como aprendizado não supervisionado porque os dados de treinamento não incluem nenhuma informação sobre o que constitui uma resposta “correta” ou “errada”, como o aprendizado supervisionado. Todas as informações necessárias para calcular a probabilidade de que a saída satisfaça os requisitos do usuário são adquiridas diretamente dos textos de treinamento.

Isso é feito analisando o uso de palavras e frases, desmontando-as e tentando reconstruí-las.

Por exemplo, os algoritmos podem encontrar a frase “a casa tem uma porta vermelha” durante o treinamento. Em seguida, é dada a frase novamente com a omissão de uma palavra – por exemplo, “a casa tem um X vermelho”.

Em seguida, examina o texto em seus dados de treinamento – centenas de bilhões de palavras organizadas em linguagem significativa – e escolhe qual palavra deve ser usada para reproduzir a frase original.

Para começar, é quase certo errar – talvez milhões de vezes. No entanto, ele acabará por encontrar a palavra correta. Ao comparar o resultado com os dados de entrada originais, ele determina se a saída está correta e um “peso” é atribuído à etapa do algoritmo que produziu a resposta correta. Isso significa que ele “aprende” ao longo do tempo quais estratégias têm maior probabilidade de produzir a resposta adequada no futuro.

A magnitude desse processo dinâmico de “ponderação” é o que distingue o GPT-3 como a maior rede neural artificial do mundo. Como foi observado, o que ele alcança não é novo em alguns aspectos, pois os modelos transformadores de previsão de linguagem existem há muitos anos. No entanto, o sistema armazena e emprega dinamicamente 175 bilhões de pesos para processar cada consulta — dez vezes mais do que seu concorrente mais próximo, construído pela Nvidia.

Duas IAs falam sobre se tornar humano. (GPT-3)

Quais são algumas das dificuldades associadas ao GPT-3?

A capacidade do GPT-3 de gerar linguagem foi elogiada como a melhor já vista em inteligência artificial; no entanto, há alguns pontos críticos a serem considerados.

Sam Altman, CEO da OpenAI, afirmou: “O Hype do GPT-3 é excessivo”. A IA alterará fundamentalmente o mundo, mas o GPT-3 é apenas um vislumbre.”

Para começar, é uma ferramenta extremamente cara para usar no momento, devido à enorme quantidade de poder de computação necessária para realizar seu trabalho. Isso significa que a despesa de implementação seria proibitivamente cara para empresas menores.

Além disso, é um sistema fechado ou caixa-preta. Como o OpenAI não divulgou todos os fatos de como seus algoritmos funcionam, qualquer pessoa que dependa dele para responder a consultas ou construir produtos valiosos não teria certeza de como eles foram criados.

Em terceiro lugar, a saída do sistema ainda não é ideal. Embora seja capaz de produzir mensagens breves e softwares simples, sua saída torna-se menos útil (na verdade, é descrita como “sem sentido”) quando solicitada para criar algo mais longo ou mais sofisticado.

Essas são, sem dúvida, preocupações que serão resolvidas com o tempo – à medida que o custo do poder de computação continua caindo, a padronização em torno de plataformas abertas de IA é construída e os algoritmos são ajustados com volumes de dados maiores.

No geral, é razoável concluir que o GPT-3 gera descobertas que estão anos-luz à frente de qualquer coisa observada anteriormente. Qualquer um que tenha visto os resultados da linguagem de IA entende como eles podem ser variáveis, e a saída do GPT-3 parece inquestionavelmente estar um passo à frente.

Quando o vemos devidamente colocado nas mãos do público e acessível a todos, seu desempenho deve melhorar ainda mais.

Leia também: 

Jitendra Vaswani
Este autor é verificado em BloggersIdeas.com

Jitendra Vaswani é um profissional de marketing digital e renomado palestrante internacional que adotou o estilo de vida nômade digital enquanto viaja pelo mundo. Ele fundou dois sites de sucesso, BloggersIdeas.com & Agência de marketing digital DigiExe das quais suas histórias de sucesso se expandiram para a autoria de "Inside A Hustler's Brain: In Pursuit of Financial Freedom" (20,000 cópias vendidas em todo o mundo) e contribuindo para o "Autor de best-seller internacional de Growth Hacking Book 2". Jitendra projetou workshops para mais de 10000 profissionais em marketing digital em todos os continentes; com intenções ancoradas em criar uma diferença impactante, ajudando as pessoas a construir o negócio dos seus sonhos online. Jitendra Vaswani é um investidor poderoso com um portfólio impressionante que inclui Estação de imagens. Para saber mais sobre seus investimentos, encontre-o em Linkedin, Twitter, & Facebook.

Divulgação de afiliados: Com total transparência - alguns dos links em nosso site são links de afiliados, se você os usar para fazer uma compra, ganharemos uma comissão sem nenhum custo adicional para você (absolutamente nenhum!).

Deixe um comentário