ChatGPT Finalmente Revelou o GPT-4
A Próxima Geração do Modelo de Linguage AI anuncia Novo GPT-4
Após meses de rumores e especulações, a OpenAI anunciou o GPT-4: o mais recente em sua linha de modelos de linguagem AI que alimentam aplicativos como o ChatGPT e o novo Bing.
A empresa afirma que o modelo é “mais criativo e colaborativo do que nunca” e “pode resolver problemas difíceis com maior precisão”. Ele pode analisar a entrada de texto e imagem, embora só possa responder por meio de texto. A OpenAI também adverte que os sistemas retêm muitos dos mesmos problemas dos modelos de linguagem anteriores, incluindo a tendência de inventar informações (ou “alucinar”) e a capacidade de gerar textos violentos e nocivos.
A OpenAI diz que já fez parceria com várias empresas para integrar o GPT-4 em seus produtos, incluindo Duolingo, Stripe e Khan Academy. O novo modelo está disponível para o público em geral por meio do ChatGPT Plus, a assinatura mensal do ChatGPT de $ 20 da OpenAI, e está capacitando o chatbot Bing da Microsoft. Ele também estará acessível como uma API para os desenvolvedores criarem. (Há uma lista de espera aqui, que a OpenAI diz que começará a admitir usuários hoje.)
Em uma postagem de blog de pesquisa, a OpenAI disse que a distinção entre o GPT-4 e seu antecessor GPT-3.5 é “sutil” em conversas casuais (GPT-3.5 é o modelo que alimenta o ChatGPT). O CEO da OpenAI, Sam Altman, twittou que o GPT-4 “ainda é falho, ainda é limitado”, mas também “ainda parece mais impressionante no primeiro uso do que depois de passar mais tempo com ele”.
A empresa diz que as melhorias do GPT-4 são evidentes no desempenho do sistema em vários testes e benchmarks, incluindo os exames Uniform Bar Exam, LSAT, SAT Math e SAT Evidence-Based Reading & Writing. Nos exames mencionados, o GPT-4 pontuou no percentil 88 e acima, podendo consultar aqui a lista completa dos exames e as pontuações do sistema.
As especulações sobre o GPT-4 e suas capacidades foram abundantes no ano passado, com muitos sugerindo que seria um grande salto em relação aos sistemas anteriores. No entanto, a julgar pelo anúncio da OpenAI, a melhoria é mais iterativa, como a empresa alertou anteriormente.
“As pessoas estão implorando para ficarem desapontadas e ficarão”, disse Altman em uma entrevista sobre o GPT-4 em janeiro. “O hype é como… Não temos um AGI real e isso é o que se espera de nós.”
O boato foi ainda mais energizado na semana passada, depois que um executivo da Microsoft deixou escapar que o sistema seria lançado esta semana em uma entrevista à imprensa alemã. O executivo também sugeriu que o sistema seria multimodal — ou seja, capaz de gerar não apenas texto, mas outras mídias. Muitos pesquisadores de IA acreditam que os sistemas multimodais que integram texto, áudio e vídeo oferecem o melhor caminho para a construção de sistemas de IA mais capazes.
O GPT-4 é de fato multimodal, mas em menos meios do que alguns previram. OpenAI diz que o sistema pode aceitar entradas de texto e imagem e emitir saídas de texto. A empresa diz que a capacidade do modelo de analisar texto e imagem simultaneamente permite interpretar entradas mais complexas. Nas amostras abaixo, você pode ver o sistema explicando memes e imagens incomuns:
Tem sido uma longa jornada para chegar ao GPT-4, com OpenAI – e modelos de linguagem AI em geral – ganhando força lentamente ao longo de vários anos antes de se tornar popular nos últimos meses.
O artigo de pesquisa original que descreve o GPT foi publicado em 2018, com o GPT-2 anunciado em 2019 e o GPT-3 em 2020. Esses modelos são treinados em enormes conjuntos de dados de texto, muitos deles extraídos da Internet, que são extraídos em busca de padrões estatísticos. Esses padrões são então usados para prever qual palavra segue a outra. É um mecanismo relativamente simples de descrever, mas o resultado final são sistemas flexíveis que podem gerar, resumir e reformular a escrita, bem como executar outras tarefas baseadas em texto, como tradução ou geração de código.
A OpenAI originalmente atrasou o lançamento de seus modelos GPT por medo de que fossem usados para fins maliciosos, como geração de spam e desinformação. Mas no final de 2022, a empresa lançou o ChatGPT — um chatbot de conversação baseado no GPT-3.5 que qualquer pessoa pode acessar. O lançamento do ChatGPT desencadeou um frenesi no mundo da tecnologia, com a Microsoft logo seguindo-o com seu próprio chatbot AI Bing (parte do mecanismo de busca Bing) e o Google lutando para alcançá-lo.
Como previsto, a maior disponibilidade desses modelos de linguagem de IA criou problemas e desafios. O sistema educacional ainda está se adaptando à existência de software que escreve respeitáveis redações universitárias; sites online como Stack Overflow e a revista de ficção científica Clarkesworld tiveram que encerrar as inscrições devido a um influxo de conteúdo gerado por IA; e os primeiros usos de ferramentas de redação de IA no jornalismo foram difíceis, na melhor das hipóteses. Mas, alguns especialistas argumentam que os efeitos nocivos ainda foram menores do que o previsto.
Em seu anúncio do GPT-4, a OpenAI enfatizou que o sistema passou por seis meses de treinamento de segurança e que, em testes internos, era “82% menos propenso a responder a solicitações de conteúdo não permitido e 40% mais propenso a produzir informações factuais”. respostas do que GPT-3.5.”
No entanto, isso não significa que o sistema não comete erros ou produz conteúdo nocivo. Por exemplo, a Microsoft revelou que seu chatbot do Bing sempre foi alimentado por GPT-4, e muitos usuários foram capazes de quebrar as barreiras do Bing de várias maneiras criativas, fazendo com que o bot oferecesse conselhos perigosos, ameaçasse usuários e inventasse informações. . O GPT-4 também ainda carece de conhecimento sobre eventos “que ocorreram após a grande maioria de seus dados serem cortados” em setembro de 2021.