Início
Preços do Azure
Preços do Serviço OpenAI Azure

Preços do Serviço OpenAI Azure

Visão geral de preços do Serviço OpenAI do Azure

Unlock the power of Azure OpenAI Service's generative AI models with flexible Standard (On-Demand) and Provisioned Throughput Units (PTUs). The Standard model lets you pay only for tokens processed, while PTUs ensure consistent throughput and minimal latency variance for scalable solutions. Pricing includes costs per 1,000 tokens, and PTU rates provide a predictable cost structure. Language models are also now available in the Batch API that returns completions within 24 hours for a 50% discount on Global Standard Pricing. Azure OpenAI Service offers advanced capabilities like GPT-4o, fine-tuning for customization, DALL-E for image generation, and Whisper for speech-to-text. For personalized guidance on optimizing AI deployments, contact a sales specialist.

Explorar as opções de preços

Aplique filtros para personalizar as opções de preço conforme as suas necessidades.

Os preços são apenas estimativas e não pretendem ser cotações de preços reais. O preço real pode variar dependendo do tipo de contrato celebrado com a Microsoft, data de compra e taxa de câmbio. Os preços são calculados com base em dólares americanos e convertidos usando as taxas spot de fechamento de Londres capturadas nos dois dias úteis anteriores ao último dia útil do final do mês anterior. Se os dois dias úteis anteriores ao final do mês caírem em um feriado bancário nos principais mercados, o dia de definição da taxa geralmente é o dia imediatamente anterior aos dois dias úteis. Esta taxa se aplica a todas as transações durante o próximo mês. Entre na calculadora de preços do Azure para ver os preços com base em seu programa/oferta atual com a Microsoft. Entre em contato com um especialista de vendas do Azure para obter mais informações sobre preços ou para solicitar uma cotação. Veja as perguntas frequentes sobre os preços do Azure.

Região:

Moeda:

Instituições governamentais dos EUA podem comprar serviços do Azure Governamental de um provedor de soluções de licenciamento sem assumir nenhum compromisso financeiro inicial ou, então, podem adquiri-los diretamente por meio de uma assinatura online paga conforme o uso.

Saiba mais

Importante: o preço em reais (R$) é apenas uma referência. Esta é uma transação internacional e, como tal, seu preço final está sujeito a taxas de câmbio e à inclusão de IOF. Não será emitida uma NFe.

Saiba mais

Detalhes dos preços:

Modelos de linguagem

Modelos	Contexto	Entrada (por 1.000 tokens)	Saída (por 1.000 tokens)	Preço por PTU por hora	Incremento de Dimensionamento Mínimo	Reserva Mensal por PTU	Reserva Anual por PTU
gpt-4o-2024-08-06 Global Deployment	128K	$-	$-	N/A	N/A	N/A	N/A
gpt-4o-2024-08-06 Regional API	128K	$-	$-	N/A	N/A	N/A	N/A
Implantação Global do GPT-4o	128K	$-	$-	N/A	N/A	N/A	N/A
API Regional do GPT-4o	128K	$-	$-	$-	50 PTUs	$-	$-
Implantação global do GPT-4o-mini	128K	$-	$-	N/A	N/A	N/A	N/A
API regional do GPT-4o-mini	128K	$-	$-	$-	25 PTUs	$-	$-
GPT-3.5-Turbo-0125	16K	$-	$-	$-	100 PTUs	$-	$-
GPT-3.5-Turbo-Instruct	4K	$-	$-	N/A	N/A	N/A	N/A
GPT-4-Turbo	128K	$-	$-	$-	100 PTUs	$-	$-
GPT-4-Turbo-Visão	128K	$-	$-	N/A	N/A	N/A	N/A
GPT-4	8K	$-	$-	$-	50 PTUs	$-	$-
GPT-4	32K	$-	$-	$-	200 PTUs	$-	$-

Esta tabela fornece uma comparação detalhada dos preços Padrão (Sob Demanda) versus PTU (Provisionado) para vários modelos de linguagem. A coluna 'Context' especifica o número máximo de tokens que cada modelo pode manipular por resposta. Os detalhes de preços para tokens de entrada e saída são listados, refletindo o custo por 1.000 tokens. O modelo de preços PTU inclui uma taxa por hora e um incremento de dimensionamento mínimo, representando o número mínimo de PTUs necessárias para cada modelo. As colunas "Reserva Mensal por PTU" e "Reserva Anual por PTU" indicam os custos de reserva por PTU. Essa comparação ajuda os usuários a entender as implicações de custo do uso de cada modelo nas opções de cobrança Padrão (Sob Demanda) e Provisionado (PTU), permitindo decisões informadas com base em suas necessidades de uso específicas.

Language models are also now available in the Batch API that returns completions within 24 hours for a 50% discount on Global Standard Pricing.

Modelos de linguagem herdados

Modelos	Contexto	Entrada (por 1.000 tokens)	Saída (por 1.000 tokens)
GPT-3.5-Turbo-0301	4K	$-	$-
GPT-3.5-Turbo-0613	4K	$-	$-
GPT-3.5-Turbo-0613	16K	$-	$-
GPT-3.5-Turbo-1106	16K	$-	$-

API de Assistentes

A API de Assistentes e suas ferramentas facilitam para os desenvolvedores a criação de assistentes de IA em seus aplicativos.

Os tokens usados pela API dos Assistentes são cobrados de acordo com as taxas por token de entrada/saída do modelo de linguagem escolhido usado com cada Assistente. Além disso, cobramos os seguintes preços pelo uso da ferramenta:

Ferramenta	Entrada
Pesquisa de Arquivos^*	$-/GB de armazenamento de vetores por dia (1 GB livre)
Interpretador de código^**	$-/sessão

^*GB refere-se a gigabytes binários, em que 1 GB é 2^30 bytes.

^**Se o seu assistente chamar o Interpretador de Código simultaneamente em dois threads diferentes, isso criaria duas sessões do Interpretador de Código (2 * $-). Cada sessão fica ativa por padrão por uma hora, o que significa que você só pagaria esse valor uma vez se o seu usuário continuasse dando instruções ao Code Interpreter no mesmo thread por até uma hora.

O custo de inferência (entrada e saída) varia de acordo com o modelo GPT usado com cada Assistente. Se o seu assistente chamar o Intérprete de código simultaneamente em dois threads diferentes, isso criaria duas sessões do Intérprete de código (2 * $-). Cada sessão fica ativa por padrão por uma hora, o que significa que o preço é de até uma hora de instruções ao Intérprete de código no mesmo thread.

Modelos base

Modelos	Uso por 1.000 tokens
Babbage-002	$-
Davinci-002	$-

Modelos de ajuste fino

Modelos	Treinamento por 1.000 tokens	Hospedagem por hora	Uso de Entrada por 1.000 tokens	Uso de Saída por 1.000 tokens
Babbage-002	$-	$-	$-	$-
Davinci-002	$-	$-	$-	$-
GPT-3.5-Turbo (4K)	$-	$-	$-	$-
GPT-3.5-Turbo (16K)	$-	$-	$-	$-
GPT-4 (8K)	$-	$-	$-	$-
GPT-4o	$-	$-	$-	$-
GPT-4o-mini	$-	$-	$-	$-

Modelos de imagem

Modelos	Qualidade	Resolução	Preço (por 100 imagens)
Dall-E-3	Standard	1024 * 1024	$-
	Standard	1024 * 1792, 1792 * 1024	$-
Dall-E-3	HD	1024 * 1024	$-
	HD	1024 * 1792, 1792 * 1024	$-
Dall-E-2	Standard	1024 * 1024	$-

Inserindo modelos

Modelos	Por 1.000 tokens
Ada	$-
text-embedding-3-large	$-
text-embedding-3-small	$-

Modelos de Fala

Modelos	Preço
Modelos	Whisper	$-/hora
TTS (Conversão de Texto em Fala)	$-/1M caracteres
TTS HD	$-/1M caracteres

Opções de compra e preços do Azure

Conecte-se diretamente conosco

Obtenha uma explicação detalhada sobre os preços do Azure. Entenda os preços da sua solução de nuvem, aprenda sobre a otimização de custos e solicite uma proposta personalizada.

Converse com um especialista de vendas

Confira maneiras de comprar

Compre os serviços do Azure por meio do site do Azure, de um representante da Microsoft ou de um parceiro do Azure.

Explore suas opções

Recursos adicionais

Perguntas frequentes

Perguntas frequentes sobre os preços do Azure

O Serviço OpenAI do Azure oferece preços com base em Pagamento Conforme o Uso ou nas PTUS (Unidades de Produtividade Provisionadas) O Pagamento Conforme o Uso permite que você pague pelos recursos consumidos, tornando-o flexível para cargas de trabalho variáveis. As PTUs oferecem um modelo de preços previsível no qual você reserva e implanta uma quantidade específica de capacidade de processamento de modelo. Esse modelo é ideal para cargas de trabalho com padrões de uso consistentes ou previsíveis, fornecendo estabilidade e controle de custos.
Produtos Azure por Região | Microsoft Azure
SLA dos Serviços de IA do Azure | Microsoft Azure
Para saber mais sobre as PTUs e os preços de IA aberta do Azure, leia a documentação da PTU ou entre em contato com nosso especialista em vendas

Converse com um especialista em vendas para saber mais sobre os preços do Azure. Entenda os preços da sua solução de nuvem.

Solicitar uma cotação de preços

Obtenha serviços de nuvem gratuitos e um crédito de $200 para explorar o Azure por 30 dias.

Testar o Azure gratuitamente

Adicionado à estimativa. Pressione ‘v’ para exibir na calculadora