- Förbättrad funktionsuppringning
- JSON-läge
- Reproducerbar utgång
- Förhandsvisning
- 3 gånger mer kostnadseffektivt
Under Microsofts molnutvecklarkonferens nämnde företagets vd Satya Nadella lanseringen av uppdaterade generativa AI-modeller som kommer till Azure Open Services kommer snart.
Från och med den här veckan kan Azure OpenAI Service-kunder nu dra nytta av de mest avancerade versionerna av OpenAI: s förgenerativa modeller med GTP-4 och GPT-3.5 Turbo 1106.
Microsoft lanserade de nya modellerna till tidigare befintliga marknader samtidigt som de öppnade sina kanaler för tre nya regioner som inkluderar Öst-Norge, Södra Indien och Västra USA. Azure OpenAI Services är nu tillgängliga i totalt fjorton globala regioner.
De nya modellerna, särskilt GTP4 Turbo, för med sig kunskap om världshändelser fram till april 2023 samt 128L sammanhangsfönster för att tillåta utvecklare att skapa anpassade dataingångar som nu kan dra nytta av Retrieval Augmented Generation (TRASA).
När det gäller tokenpriserna för de nya modellerna är GTP-4 Turbo-prissättningen $0,01/1000 tokens för input och $0,03/1000 tokens för output. Baserat på in- och utgångsmodellerna är GPT-4 turbo för Azure OpenAI Services "3 gånger mer kostnadseffektiv för input tokens och 2x mer kostnadseffektiva för output tokens” jämfört med de vanliga GPT-4-modellerna som används nu.
Utöver prisförbättringarna finns det också förbättrade funktioner som funktionsanrop med GPT-4 Turbo som möjliggör flera funktions- och verktygsanrop parallellt för att göra applikationer mer effektiva. GPT-4 introducerar också JSON Mode till korrekt formaterad JSON-utgång. Reproducerbar produktion är också möjlig och ger sannolika resultat.
När det gäller GPT-3.5 Turbo 1106, ger den många av samma uppdaterade funktioner som GPT-4 Turbo men kommer också att bli standardturbomodellen med 16K kontextfönster och nya token input/output-priser.
Som tidigare nämnts är båda nya GPT-modellerna tillgängliga i förhandsvisning för de flesta kunder med Microsoft som lovar att göra det mer allmänt tillgängligt med Provisioned Throughput.