- Chamada de função aprimorada
- Modo JSON
- Saída reproduzível
- Visualização
- 3x mais econômico
Durante a conferência de desenvolvedores em nuvem da Microsoft, o CEO da empresa, Satya Nadella, mencionou o lançamento de modelos atualizados de IA generativa que chegarão a Serviços Abertos do Azure chegando em breve.
A partir desta semana, os clientes do Azure OpenAI Service agora podem aproveitar as vantagens das versões mais avançadas dos modelos pré-gerativos da OpenAI com GTP-4 e GPT-3.5 Turbo 1106.
A Microsoft lançou os novos modelos para mercados existentes anteriores, ao mesmo tempo que abriu seus canais para três novas regiões que incluem Leste da Noruega, Sul da Índia e Oeste dos EUA. Os serviços Azure OpenAI estão agora disponíveis em um total de quatorze regiões globais.
Os novos modelos, em especial o GTP4 Turbo, trazem consigo conhecimento dos acontecimentos mundiais até abril de 2023, bem como o 128L janelas de contexto para permitir que os desenvolvedores criem entradas de dados personalizadas que agora podem aproveitar a geração aumentada de recuperação (RAG).
Quanto aos preços dos tokens para os novos modelos, o preço do GTP-4 Turbo é de US$ 0,01/1.000 tokens para entrada e US$ 0,03/1.000 tokens para saída. Com base nos modelos de entrada e saída, o GPT-4 turbo para Azure OpenAI Services é “3x mais econômico para tokens de entrada e 2x mais econômicos para tokens de saída” quando comparado aos modelos GPT-4 regulares usados agora.
Além das melhorias de preço, também há recursos aprimorados, como chamadas de funções com GPT-4 Turbo, permitindo múltiplas chamadas de funções e ferramentas em paralelo para tornar os aplicativos mais eficientes. GPT-4 também introduz o modo JSON para saída JSON formatada corretamente. A produção reproduzível também é possível e traz resultados probabilísticos.
Quanto ao GPT-3.5 Turbo 1106, ele traz muitos dos mesmos recursos atualizados do GPT-4 Turbo, mas também se tornará o modelo Turbo padrão com janela de contexto de 16K e novo preço de entrada/saída de token.
Conforme mencionado anteriormente, ambos os novos modelos GPT estão disponíveis em versão prévia para a maioria dos clientes, com a Microsoft prometendo torná-los mais amplamente acessíveis com Provisioned Throughput.