Modelos Azure OpenAI Service
O Azure OpenAI Service tem a tecnologia diversificada de um conjunto de modelos com diferentes capacidades e níveis de preços. A disponibilidade do modelo varia de acordo com a região e a nuvem. Para obter a disponibilidade do modelo do Azure Government, consulte Azure Government OpenAI Service.
Modelos | Description |
---|---|
GPT-4o & GPT-4o mini & GPT-4 Turbo | Os modelos mais recentes e capazes do Azure OpenAI com versões multimodais, que podem aceitar texto e imagens como entrada. |
GPT-4 | Um conjunto de modelos que melhoram o GPT-3.5 e podem compreender e gerar linguagem natural e código. |
GPT-3,5 | Um conjunto de modelos que melhoram o GPT-3 e podem compreender e gerar linguagem natural e código. |
Incorporações | Um conjunto de modelos que podem converter texto em forma vetorial numérica para facilitar a semelhança de texto. |
DALL-E | Uma série de modelos que podem gerar imagens originais a partir de linguagem natural. |
Sussurro | Uma série de modelos em pré-visualização que podem transcrever e traduzir fala em texto. |
Conversão de texto em fala (Pré-visualização) | Uma série de modelos em pré-visualização que podem sintetizar texto em voz. |
Parque infantil de acesso antecipado (pré-visualização)
Em 6 de agosto de 2024, a OpenAI anunciou a versão mais recente de sua versão 2024-08-06
principal do modelo GPT-4o. GPT-4o 2024-08-06
tem todas as capacidades da versão anterior, bem como:
- Uma capacidade melhorada para suportar resultados estruturados complexos.
- Os tokens de saída máxima foram aumentados de 4.096 para 16.384.
Os clientes do Azure podem testar o GPT-4o 2024-08-06
hoje no novo playground de acesso antecipado do AI Studio (visualização).
Ao contrário do playground de acesso antecipado anterior, o playground de acesso antecipado do AI Studio (visualização) não exige que você tenha um recurso em uma região específica.
Nota
Os prompts e as conclusões feitas por meio do playground de acesso antecipado (visualização) podem ser processados em qualquer região do Azure OpenAI e atualmente estão sujeitos a uma solicitação de 10 por minuto por limite de assinatura do Azure. Este limite poderá ser alterado no futuro.
O monitoramento de abuso do Serviço OpenAI do Azure está habilitado para todos os usuários de playground de acesso antecipado, mesmo se aprovado para modificação; Os filtros de conteúdo padrão estão habilitados e não podem ser modificados.
Para testar o GPT-4o 2024-08-06
, entre no playground de acesso antecipado da IA do Azure (visualização) usando este link.
GPT-4o e GPT-4 Turbo
O GPT-4o integra texto e imagens em um único modelo, permitindo lidar com vários tipos de dados simultaneamente. Esta abordagem multimodal aumenta a precisão e a capacidade de resposta nas interações homem-computador. O GPT-4o combina com o GPT-4 Turbo em tarefas de texto e codificação em inglês, oferecendo desempenho superior em idiomas diferentes do inglês e tarefas de visão, estabelecendo novos padrões para os recursos de IA.
Como faço para acessar os modelos GPT-4o e GPT-4o mini?
GPT-4o e GPT-4o mini estão disponíveis para implantação de modelos padrão e global.
Você precisa criar ou usar um recurso existente em uma região padrão ou padrão global suportada onde o modelo está disponível.
Quando seu recurso é criado, você pode implantar os modelos GPT-4o. Se você estiver executando uma implantação programática, os nomes dos modelos são:
gpt-4o
, Versão2024-05-13
gpt-4o-mini
Versão2024-07-18
GPT-4 Turbo
GPT-4 Turbo é um grande modelo multimodal (aceitando entradas de texto ou imagem e gerando texto) que pode resolver problemas difíceis com maior precisão do que qualquer um dos modelos anteriores da OpenAI. Como o GPT-3.5 Turbo e os modelos GPT-4 mais antigos, o GPT-4 Turbo é otimizado para bate-papo e funciona bem para tarefas de conclusão tradicionais.
A última versão GA do GPT-4 Turbo é:
gpt-4
Versão:turbo-2024-04-09
Este é o substituto para os seguintes modelos de pré-visualização:
gpt-4
Versão:1106-Preview
gpt-4
Versão:0125-Preview
gpt-4
Versão:vision-preview
Diferenças entre OpenAI e Azure OpenAI GPT-4 Turbo GA Models
- A versão OpenAI do mais recente
0409
modelo turbo suporta o modo JSON e a função chamando para todas as solicitações de inferência. - A versão mais recente
turbo-2024-04-09
do Azure OpenAI atualmente não oferece suporte ao uso do modo JSON e da chamada de função ao fazer solicitações de inferência com entrada de imagem (visão). As solicitações de entrada baseadas em texto (solicitações semimage_url
e imagens embutidas) suportam o modo JSON e a chamada de função.
Diferenças do gpt-4 vision-preview
- A integração de aprimoramentos de Visão específicos da IA do Azure com o GPT-4 Turbo com Visão não é suportada para
gpt-4
a Versão:turbo-2024-04-09
. Isso inclui Reconhecimento Ótico de Caracteres (OCR), aterramento de objetos, prompts de vídeo e processamento aprimorado de seus dados com imagens.
Disponibilidade gerenciada provisionada GPT-4 Turbo
gpt-4
Versão:turbo-2024-04-09
está disponível para implantações padrão e provisionadas. Atualmente, a versão provisionada deste modelo não suporta solicitações de inferência de imagem/visão. As implantações provisionadas desse modelo só aceitam entrada de texto. As implantações de modelo padrão aceitam solicitações de inferência de texto e imagem/visão.
Disponibilidade da região
Para obter informações sobre a disponibilidade regional do modelo, consulte a matriz do modelo para implantações padrão e provisionadas.
Implantando o GPT-4 Turbo com o Vision GA
Para implantar o modelo GA a partir da interface do usuário do Studio, selecione GPT-4
e escolha a turbo-2024-04-09
versão no menu suspenso. A cota padrão para o gpt-4-turbo-2024-04-09
modelo será a mesma cota atual para GPT-4-Turbo. Consulte os limites das quotas regionais.
GPT-4
O GPT-4 é o antecessor do GPT-4 Turbo. Ambos os modelos GPT-4 e GPT-4 Turbo têm um nome de modelo base de gpt-4
. Você pode distinguir entre os modelos GPT-4 e Turbo examinando a versão do modelo.
gpt-4
Versão0314
gpt-4
Versão0613
gpt-4-32k
Versão0613
Você pode ver o comprimento do contexto do token suportado por cada modelo na tabela de resumo do modelo.
Modelos GPT-4 e GPT-4 Turbo
- Esses modelos só podem ser usados com a API de conclusão de bate-papo.
Consulte as versões do modelo para saber como o Serviço OpenAI do Azure lida com atualizações de versão do modelo e trabalhar com modelos para saber como exibir e configurar as configurações da versão do modelo de suas implantações GPT-4.
Model ID | Description | Solicitação máxima (tokens) | Dados de formação (até) |
---|---|---|---|
gpt-4o-mini (2024-07-18) GPT-4o mini | |
O mais recente modelo GA pequeno - Modelo rápido, barato e capaz, ideal para substituir os modelos da série GPT-3.5 Turbo. - Texto, processamento de imagem - Modo JSON - Chamada de função paralela |
Entrada: 128.000 Potência: 16.384 |
Outubro de 2023 |
gpt-4o (2024-05-13) GPT-4o (Omni) |
O mais recente modelo GA grande - Texto, processamento de imagem - Modo JSON - Chamada de função paralela - Maior precisão e capacidade de resposta - Paridade com texto em inglês e tarefas de codificação em comparação com GPT-4 Turbo com Visão - Desempenho superior em línguas diferentes do inglês e em tarefas de visão |
Entrada: 128.000 Saída: 4.096 |
Outubro de 2023 |
gpt-4 (turbo-2024-04-09) GPT-4 Turbo com Visão |
Novo modelo GA - Substituição de todos os modelos anteriores de pré-visualização GPT-4 ( vision-preview , 1106-Preview , 0125-Preview ). - Atualmente, a disponibilidade do recurso é diferente, dependendo do método de entrada e do tipo de implantação. |
Entrada: 128.000 Saída: 4.096 |
Dez 2023 |
gpt-4 (0125-Pré-visualização)*GPT-4 Turbo Pré-visualização |
Modelo de pré-visualização -Substitui o 1106-Preview - Melhor desempenho de geração de código - Reduz os casos em que o modelo não conclui uma tarefa - Modo JSON - Chamada de função paralela - Produção reprodutível (pré-visualização) |
Entrada: 128.000 Saída: 4.096 |
Dez 2023 |
gpt-4 (visão-pré-visualização)GPT-4 Turbo com Vision Preview |
Modelo de pré-visualização - Aceita entrada de texto e imagem. - Suporta melhorias - Modo JSON - Chamada de função paralela - Produção reprodutível (pré-visualização) |
Entrada: 128.000 Saída: 4.096 |
Abr 2023 |
gpt-4 (1106-Pré-visualização)GPT-4 Turbo Pré-visualização |
Modelo de pré-visualização - Modo JSON - Chamada de função paralela - Produção reprodutível (pré-visualização) |
Entrada: 128.000 Saída: 4.096 |
Abr 2023 |
gpt-4-32k (0613) |
Modelo GA mais antigo - Chamada de função básica com ferramentas |
32,768 | Setembro 2021 |
gpt-4 (0613) |
Modelo GA mais antigo - Chamada de função básica com ferramentas |
8,192 | Setembro 2021 |
gpt-4-32k (0314) |
Modelo GA mais antigo - Informações sobre aposentadoria |
32,768 | Setembro 2021 |
gpt-4 (0314) |
Modelo GA mais antigo - Informações sobre aposentadoria |
8,192 | Setembro 2021 |
Atenção
Não recomendamos o uso de modelos de visualização em produção. Atualizaremos todas as implantações de modelos de visualização para futuras versões de visualização ou para a versão estável/GA mais recente. Os modelos designados visualização não seguem o ciclo de vida padrão do modelo OpenAI do Azure.
- GPT-4 versão 0125-preview é uma versão atualizada do GPT-4 Turbo preview lançado anteriormente como versão 1106-preview.
- GPT-4 versão 0125-preview conclui tarefas como a geração de código mais completamente em comparação com gpt-4-1106-preview. Devido a isso, dependendo da tarefa, os clientes podem achar que GPT-4-0125-preview gera mais saída em comparação com o gpt-4-1106-preview. Recomendamos que os clientes comparem as saídas do novo modelo. O GPT-4-0125-preview também resolve bugs no gpt-4-1106-preview com manipulação UTF-8 para idiomas diferentes do inglês.
- A versão
turbo-2024-04-09
GPT-4 é a versão mais recente do GA e substitui0125-Preview
,1106-preview
evision-preview
.
Importante
gpt-4
as versões 1106-Preview, 0125-Preview, e vision-preview serão atualizadas com uma versão estável dogpt-4
no futuro. As implantações dasgpt-4
versões 1106-Preview, 0125-Preview, e vision-preview definidas como "Auto-update to default" e "Upgrade when expired" começarão a ser atualizadas após o lançamento da versão estável. Para cada implantação, uma atualização da versão do modelo ocorre sem interrupção no serviço para chamadas de API. As atualizações são preparadas por região e espera-se que o processo completo de atualização leve 2 semanas. As implantações das versões 1106-Preview, 0125-Preview, e vision-preview definidas como "Sem atualização automática" não serão atualizadas e deixarão degpt-4
operar quando a versão de visualização for atualizada na região. Consulte Desativações e descontinuações do modelo OpenAI do Azure para obter mais informações sobre o momento da atualização.
GPT-3,5
Os modelos GPT-3.5 podem compreender e gerar linguagem natural ou código. O modelo mais capaz e econômico da família GPT-3.5 é o GPT-3.5 Turbo, que foi otimizado para bate-papo e funciona bem para tarefas de conclusão tradicionais também. O GPT-3.5 Turbo está disponível para uso com a API de Conclusão de Chat. O GPT-3.5 Turbo Instruct tem recursos semelhantes ao text-davinci-003
uso da API de Conclusão em vez da API de Conclusão de Chat. Recomendamos o uso do GPT-3.5 Turbo e GPT-3.5 Turbo Instruct sobre os modelos legados GPT-3.5 e GPT-3.
Model ID | Description | Solicitação máxima (tokens) | Dados de formação (até) |
---|---|---|---|
gpt-35-turbo (0125) NOVO |
Modelo GA mais recente - Modo JSON - Chamada de função paralela - Produção reprodutível (pré-visualização) - Maior precisão na resposta nos formatos solicitados. - Correção de um bug que causou um problema de codificação de texto para chamadas de função de idioma diferente do inglês. |
Entrada: 16.385 Saída: 4.096 |
Setembro 2021 |
gpt-35-turbo (1106) |
Modelo GA mais antigo - Modo JSON - Chamada de função paralela - Produção reprodutível (pré-visualização) |
Entrada: 16.385 Saída: 4.096 |
Setembro 2021 |
gpt-35-turbo-instruct (0914) |
Somente ponto final de conclusão - Substituição de modelos de acabamentos legados |
4,097 | Setembro 2021 |
gpt-35-turbo-16k (0613) |
Modelo GA mais antigo - Chamada de função básica com ferramentas |
16,384 | Setembro 2021 |
gpt-35-turbo (0613) |
Modelo GA mais antigo - Chamada de função básica com ferramentas |
4,096 | Setembro 2021 |
gpt-35-turbo 1 (0301) |
Modelo GA mais antigo - Informações sobre aposentadoria |
4,096 | Setembro 2021 |
Para saber mais sobre como interagir com o GPT-3.5 Turbo e a API de Conclusão de Chat, confira nosso tutorial detalhado.
1 Este modelo aceitará solicitações > de 4.096 tokens. Não é recomendado exceder o limite de 4.096 tokens de entrada, pois a versão mais recente do modelo está limitada a 4.096 tokens. Se você encontrar problemas ao exceder 4.096 tokens de entrada com este modelo, essa configuração não é oficialmente suportada.
Incorporações
text-embedding-3-large
é o modelo de incorporação mais recente e mais capaz. Não é possível atualizar entre modelos incorporados. A fim de passar de usar text-embedding-ada-002
para text-embedding-3-large
você precisaria gerar novas incorporações.
text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002
Em testes, a OpenAI relata que os modelos de incorporação de terceira geração, grandes e pequenos, oferecem melhor desempenho médio de recuperação em vários idiomas com o benchmark MIRACL enquanto ainda mantêm o desempenho para tarefas em inglês com o benchmark MTEB.
Benchmark de avaliação | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
---|---|---|---|
Média MIRACL | 31.4 | 44.0 | 54.9 |
Média MTEB | 61,0 | 62.3 | 64.6 |
Os modelos de incorporação de terceira geração suportam a redução do tamanho da incorporação através de um novo dimensions
parâmetro. Normalmente, incorporações maiores são mais caras do ponto de vista de computação, memória e armazenamento. Ser capaz de ajustar o número de dimensões permite mais controle sobre o custo geral e desempenho. O dimensions
parâmetro não é suportado em todas as versões da biblioteca OpenAI 1.x Python, para aproveitar este parâmetro recomendamos atualizar para a versão mais recente: pip install openai --upgrade
.
O teste de benchmark MTEB da OpenAI descobriu que, mesmo quando as dimensões do modelo de terceira geração são reduzidas para menos de text-embeddings-ada-002
1.536 dimensões, o desempenho permanece ligeiramente melhor.
DALL-E
Os modelos DALL-E geram imagens a partir de prompts de texto fornecidos pelo usuário. O DALL-E 3 está geralmente disponível para uso com as APIs REST. DALL-E 2 e DALL-E 3 com SDKs de cliente estão em visualização.
Sussurro
Os modelos Whisper podem ser usados para conversão de fala em texto.
Você também pode usar o modelo Whisper por meio da API de transcrição em lote do Azure AI Speech. Confira O que é o modelo Whisper?, para saber mais sobre quando usar o Azure AI Speech versus o Azure OpenAI Service.
Conversão de texto em fala (Pré-visualização)
Os modelos de texto para fala do OpenAI, atualmente em visualização, podem ser usados para sintetizar texto para fala.
Você também pode usar o texto OpenAI para falar vozes por meio do Azure AI Speech. Para saber mais, consulte Texto do OpenAI para vozes de fala por meio do Serviço OpenAI do Azure ou do Guia de Fala do Azure AI.
Tabela de resumo do modelo e disponibilidade da região
Nota
Este artigo aborda principalmente a disponibilidade de modelo/região que se aplica a todos os clientes do Azure OpenAI com tipos de implantação do Standard. Alguns clientes selecionados têm acesso a combinações de modelo/região que não estão listadas na tabela unificada abaixo. Para obter mais informações sobre implantações provisionadas, consulte nossas Diretrizes provisionadas.
Disponibilidade do modelo de implantação padrão
Região | GPT-4, 0613 | gpt-4, 1106-Pré-visualização | gpt-4, 0125-Pré-visualização | GPT-4, visão-visualização | GPT-4, turbo-2024-04-09 | GPT-4O, 2024-05-13 | GPT-4O-Mini, 2024-07-18 | GPT-4-32K, 0613 | GPT-35-TURBO, 0301 | GPT-35-TURBO, 0613 | GPT-35-Turbo, 1106 | GPT-35-Turbo, 0125 | GPT-35-TURBO-16K, 0613 | GPT-35-turbo-instrução, 0914 | incorporação de texto-ada-002, 1 | incorporação de texto-ada-002, 2 | incorporação de texto-3-pequeno, 1 | incorporação de texto-3-grande, 1 | DALL-E-2, 2,0 | DALL-E-3, 3,0 | Babbage-002, 1 | Davinci-002, 1 | TTS, 001 | TTS-HD, 001 | sussurro, 001 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | ✅ | ✅ | - | ✅ | - | - | - | ✅ | - | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | ✅ | - | - | - | - | - |
brazilsouth | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | - |
canadaeast | ✅ | ✅ | - | - | - | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
eastus | - | - | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - |
eastus2 | - | ✅ | - | - | ✅ | ✅ | - | - | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ |
francecentral | ✅ | ✅ | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - |
japaneast | - | - | - | ✅ | - | - | - | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - |
northcentralus | - | - | ✅ | - | ✅ | ✅ | - | - | - | ✅ | - | ✅ | ✅ | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ |
norwayeast | - | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | ✅ |
southafricanorth | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | - |
E.U.A Centro-Sul | - | - | ✅ | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | - | - | - | - | - | - | - | - | - |
southindia | - | ✅ | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | - | ✅ | - | - | - | - | - | - | ✅ |
suécia central | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
norte da suíça | ✅ | - | - | ✅ | - | - | - | ✅ | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - | - |
uksouth | - | ✅ | ✅ | - | - | - | - | - | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - |
westeurope | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | ✅ |
westus | - | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | - |
westus3 | - | ✅ | - | - | ✅ | ✅ | - | - | - | - | - | - | - | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - |
Esta tabela não inclui a implantação do modelo padrão global, a disponibilidade regional para GPT-4o nem o ajuste fino das informações de disponibilidade regional. Consulte a seção dedicada de implantação de padrão global e a seção de ajuste fino para obter essas informações.
Cota de modelo de implantação padrão e padrão global
País/Região | GPT-4 | GPT-4-32K | GPT-4-Turbo | GPT-4-Turbo-V | GPT-4O | GPT-4O-Mini | GPT-35-Turbo | GPT-35-Turbo-Instruir | gpt-4o - GlobalStandard | gpt-4o-mini - GlobalStandard | GPT-4-Turbo - GlobalStandard | GPT-4o - Lote Global | GPT-4o-mini - Lote Global | GPT-4 - Lote Global | GPT-4-Turbo - Lote Global | gpt-35-turbo - Lote Global | Incorporação de texto-Ada-002 | incorporação de texto-3-pequeno | incorporação de texto-3-grande | GPT-4o - ajuste fino | GPT-4o-mini - ajuste fino | GPT-4 - ajuste fino | Babbage-002 | Babbage-002 - ajuste fino | Davinci-002 | Davinci-002 - ajuste fino | GPT-35-Turbo - ajuste fino | GPT-35-Turbo-1106 - ajuste fino | GPT-35-Turbo-0125 - ajuste fino |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | 40 K | 80 K | 80 K | 30 K | - | - | 300 K | - | 30 milh | - | 2 milh | - | - | - | - | - | 350 K | - | - | - | - | - | - | - | - | - | - | - | - |
brazilsouth | - | - | - | - | - | - | - | - | 30 milh | - | 2 milh | - | - | - | - | - | 350 K | - | - | - | - | - | - | - | - | - | - | - | - |
canadaeast | 40 K | 80 K | 80 K | - | - | - | 300 K | - | 30 milh | - | 2 milh | - | - | - | - | - | 350 K | 350 K | 350 K | - | - | - | - | - | - | - | - | - | - |
eastus | - | - | 80 K | - | 1 milh | 2 milh | 240 K | 240 K | 30 milh | 50 milh | 2 milh | 5 B | 5 B | 150 milh | 300 milh | 10 B | 240 K | 350 K | 350 K | - | - | - | - | - | - | - | - | - | - |
eastus2 | - | - | 80 K | - | 1 milh | - | 300 K | - | 30 milh | - | 2 milh | - | - | - | - | - | 350 K | 350 K | 350 K | - | - | - | - | - | - | - | 250 K | 250 K | 250 K |
francecentral | 20 mil | 60 K | 80 K | - | - | - | 240 K | - | 30 milh | - | 2 milh | - | - | - | - | - | 240 K | - | 350 K | - | - | - | - | - | - | - | - | - | - |
germanywestcentral | - | - | - | - | - | - | - | - | 30 milh | - | 2 milh | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
japaneast | - | - | - | 30 K | - | - | 300 K | - | 30 milh | - | 2 milh | - | - | - | - | - | 350 K | - | 350 K | - | - | - | - | - | - | - | - | - | - |
koreacentral | - | - | - | - | - | - | - | - | 30 milh | - | 2 milh | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
northcentralus | - | - | 80 K | - | 1 milh | - | 300 K | - | 30 milh | - | 2 milh | - | - | - | - | - | 350 K | - | - | 100 mil | 100 mil | 100 mil | 240 K | 250 K | 240 K | 250 K | 250 K | 250 K | 250 K |
norwayeast | - | - | 150 K | - | - | - | - | - | 30 milh | - | 2 milh | - | - | - | - | - | 350 K | - | 350 K | - | - | - | - | - | - | - | - | - | - |
PolóniaCentral | - | - | - | - | - | - | - | - | 30 milh | - | 2 milh | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
southafricanorth | - | - | - | - | - | - | - | - | 30 milh | - | 2 milh | - | - | - | - | - | 350 K | - | - | - | - | - | - | - | - | - | - | - | - |
E.U.A Centro-Sul | - | - | 80 K | - | 1 milh | - | 240 K | - | 30 milh | - | 2 milh | - | - | - | - | - | 240 K | - | - | - | - | - | - | - | - | - | - | - | - |
southindia | - | - | 150 K | - | - | - | 300 K | - | 30 milh | - | 2 milh | - | - | - | - | - | 350 K | - | 350 K | - | - | - | - | - | - | - | - | - | - |
suécia central | 40 K | 80 K | 150 K | 30 K | 1 milh | 2 milh | 300 K | 240 K | 30 milh | 50 milh | 2 milh | 5 B | 5 B | 150 milh | 300 milh | 10 B | 350 K | - | 350 K | 100 mil | 100 mil | 100 mil | 240 K | 250 K | 240 K | 250 K | 250 K | 250 K | 250 K |
norte da suíça | 40 K | 80 K | - | 30 K | - | - | 300 K | - | 30 milh | - | 2 milh | - | - | - | - | - | 350 K | - | - | - | - | - | - | - | - | - | - | - | - |
Suíça Oeste | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 250 K | - | 250 K | 250 K | 250 K | 250 K |
uksouth | - | - | 80 K | - | - | - | 240 K | - | 30 milh | - | 2 milh | - | - | - | - | - | 350 K | - | 350 K | - | - | - | - | - | - | - | - | - | - |
westeurope | - | - | - | - | - | - | 240 K | - | 30 milh | - | 2 milh | - | - | - | - | - | 240 K | - | - | - | - | - | - | - | - | - | - | - | - |
westus | - | - | 80 K | 30 K | 1 milh | - | 300 K | - | 30 milh | - | 2 milh | 5 B | 5 B | 150 milh | 300 milh | 10 B | 350 K | - | - | - | - | - | - | - | - | - | - | - | - |
westus3 | - | - | 80 K | - | 1 milh | - | - | - | 30 milh | - | 2 milh | - | - | - | - | - | 350 K | - | 350 K | - | - | - | - | - | - | - | - | - | - |
Disponibilidade do modelo de implantação provisionada
Região | GPT-4, 0613 | gpt-4, 1106-Pré-visualização | gpt-4, 0125-Pré-visualização | GPT-4, turbo-2024-04-09 | GPT-4O, 2024-05-13 | GPT-4O-Mini, 2024-07-18 | GPT-4-32K, 0613 | GPT-35-Turbo, 1106 | GPT-35-Turbo, 0125 |
---|---|---|---|---|---|---|---|---|---|
australiaeast | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
brazilsouth | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | ✅ | - |
canadacentral | ✅ | - | - | - | - | - | ✅ | - | ✅ |
canadaeast | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | - |
eastus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
francecentral | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | ✅ |
germanywestcentral | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | - |
japaneast | - | ✅ | ✅ | ✅ | ✅ | - | - | - | ✅ |
koreacentral | ✅ | - | - | ✅ | ✅ | - | ✅ | ✅ | - |
northcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
norwayeast | ✅ | - | ✅ | - | - | - | ✅ | - | - |
PolóniaCentral | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ |
southafricanorth | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | - |
E.U.A Centro-Sul | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
southindia | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | ✅ | ✅ |
suécia central | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
norte da suíça | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
Suíça Oeste | - | - | - | - | - | - | - | - | ✅ |
uksouth | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
westus | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
Nota
A versão provisionada de gpt-4
Version: turbo-2024-04-09
está atualmente limitada apenas ao texto.
Como faço para obter acesso ao provisionado?
Você precisa falar com sua equipe de vendas/conta da Microsoft para adquirir a taxa de transferência provisionada. Se você não tiver uma equipe de vendas/contas, infelizmente neste momento, não poderá comprar a taxa de transferência provisionada.
Para obter mais informações sobre implantações provisionadas, consulte nossas Diretrizes provisionadas.
Disponibilidade do modelo padrão global
gpt-4o
Versão: 2024-05-13
Regiões suportadas:
- australiaeast
- brazilsouth
- canadaeast
- eastus
- eastus2
- francecentral
- germanywestcentral
- japaneast
- koreacentral
- northcentralus
- norwayeast
- PolóniaCentral
- southafricanorth
- E.U.A Centro-Sul
- southindia
- suécia central
- norte da suíça
- uksouth
- westeurope
- westus
- westus3
gpt-4o-mini
Versão: 2024-07-18
Regiões suportadas:
- eastus
Disponibilidade global do modelo de lote
Suporte a regiões e modelos
Os seguintes modelos suportam lote global:
Modelo | Versão | Formato de entrada |
---|---|---|
gpt-4o-mini |
2024-07-18 | texto + imagem |
gpt-4o |
2024-05-13 | texto + imagem |
gpt-4 |
turbo-2024-04-09 | texto |
gpt-4 |
0613 | texto |
gpt-35-turbo |
0125 | texto |
gpt-35-turbo |
1106 | texto |
gpt-35-turbo |
0613 | texto |
Atualmente, o lote global é suportado nas seguintes regiões:
- E.U.A. Leste
- E.U.A. Oeste
- Suécia Central
Disponibilidade dos modelos GPT-4 e GPT-4 Turbo
Regiões de nuvem pública
Região | GPT-4, 0613 | gpt-4, 1106-Pré-visualização | gpt-4, 0125-Pré-visualização | GPT-4, visão-visualização | GPT-4, turbo-2024-04-09 | GPT-4O, 2024-05-13 | GPT-4O-Mini, 2024-07-18 | GPT-4-32K, 0613 |
---|---|---|---|---|---|---|---|---|
australiaeast | ✅ | ✅ | - | ✅ | - | - | - | ✅ |
canadaeast | ✅ | ✅ | - | - | - | - | - | ✅ |
eastus | - | - | ✅ | - | ✅ | ✅ | ✅ | - |
eastus2 | - | ✅ | - | - | ✅ | ✅ | - | - |
francecentral | ✅ | ✅ | - | - | - | - | - | ✅ |
japaneast | - | - | - | ✅ | - | - | - | - |
northcentralus | - | - | ✅ | - | ✅ | ✅ | - | - |
norwayeast | - | ✅ | - | - | - | - | - | - |
E.U.A Centro-Sul | - | - | ✅ | - | ✅ | ✅ | - | - |
southindia | - | ✅ | - | - | - | - | - | - |
suécia central | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ |
norte da suíça | ✅ | - | - | ✅ | - | - | - | ✅ |
uksouth | - | ✅ | ✅ | - | - | - | - | - |
westus | - | ✅ | - | ✅ | ✅ | ✅ | - | - |
westus3 | - | ✅ | - | - | ✅ | ✅ | - | - |
Selecionar acesso do cliente
Além das regiões acima que estão disponíveis para todos os clientes do Azure OpenAI, alguns clientes pré-existentes selecionados receberam acesso a versões do GPT-4 em regiões adicionais:
Modelo | País/Região |
---|---|
gpt-4 (0314) gpt-4-32k (0314) |
Leste dos EUA França Central Centro-Sul dos EUA Sul do Reino Unido |
gpt-4 (0613) gpt-4-32k (0613) |
Leste dos EUA Leste dos EUA 2 Leste do Japão Sul do Reino Unido |
Modelos GPT-3.5
Importante
O modelo NEW gpt-35-turbo (0125)
tem várias melhorias, incluindo maior precisão na resposta nos formatos solicitados e uma correção para um bug que causou um problema de codificação de texto para chamadas de função de idioma diferente do inglês.
O GPT-3.5 Turbo é utilizado com a API de Conclusão de Chat. GPT-3.5 Turbo versão 0301 também pode ser usado com a API de conclusão, embora isso não seja recomendado. As versões GPT-3.5 Turbo 0613 e 1106 suportam apenas a API de conclusão de chat.
GPT-3.5 Turbo versão 0301 é a primeira versão do modelo lançado. A versão 0613 é a segunda versão do modelo e adiciona suporte a chamadas de função.
Consulte as versões do modelo para saber como o Serviço OpenAI do Azure lida com atualizações de versão do modelo e trabalhar com modelos para saber como exibir e configurar as configurações da versão do modelo de suas implantações GPT-3.5 Turbo.
Disponibilidade do modelo GPT-3.5-Turbo
Regiões de nuvem pública
Região | GPT-35-TURBO, 0301 | GPT-35-TURBO, 0613 | GPT-35-Turbo, 1106 | GPT-35-Turbo, 0125 | GPT-35-TURBO-16K, 0613 | GPT-35-turbo-instrução, 0914 |
---|---|---|---|---|---|---|
australiaeast | - | ✅ | ✅ | - | ✅ | - |
canadaeast | - | ✅ | ✅ | ✅ | ✅ | - |
eastus | ✅ | ✅ | - | - | ✅ | ✅ |
eastus2 | - | ✅ | - | - | ✅ | - |
francecentral | ✅ | ✅ | ✅ | - | ✅ | - |
japaneast | - | ✅ | - | - | ✅ | - |
northcentralus | - | ✅ | - | ✅ | ✅ | - |
E.U.A Centro-Sul | ✅ | - | - | ✅ | - | - |
southindia | - | - | ✅ | - | - | - |
suécia central | - | ✅ | ✅ | - | ✅ | ✅ |
norte da suíça | - | ✅ | - | - | ✅ | - |
uksouth | ✅ | ✅ | ✅ | - | ✅ | - |
westeurope | ✅ | - | - | - | - | - |
westus | - | - | ✅ | - | - | - |
Incorporação de modelos
Esses modelos só podem ser usados com solicitações de API de incorporação.
Nota
text-embedding-3-large
é o modelo de incorporação mais recente e mais capaz. Não é possível atualizar entre modelos de incorporação. Para migrar do uso text-embedding-ada-002
para text-embedding-3-large
você, seria necessário gerar novas incorporações.
Model ID | Solicitação máxima (tokens) | Dimensões de saída | Dados de formação (até) |
---|---|---|---|
text-embedding-ada-002 (versão 2) |
8,191 | 1,536 | Setembro 2021 |
text-embedding-ada-002 (versão 1) |
2,046 | 1,536 | Setembro 2021 |
text-embedding-3-large |
8,191 | 3,072 | Setembro 2021 |
text-embedding-3-small |
8,191 | 1,536 | Setembro 2021 |
Nota
Ao enviar uma matriz de entradas para incorporação, o número máximo de itens de entrada na matriz por chamada para o ponto de extremidade de incorporação é 2048.
Regiões de nuvem pública
Região | incorporação de texto-ada-002, 1 | incorporação de texto-ada-002, 2 | incorporação de texto-3-pequeno, 1 | incorporação de texto-3-grande, 1 |
---|---|---|---|---|
australiaeast | - | ✅ | - | - |
brazilsouth | - | ✅ | - | - |
canadaeast | - | ✅ | ✅ | ✅ |
eastus | ✅ | ✅ | ✅ | ✅ |
eastus2 | - | ✅ | ✅ | ✅ |
francecentral | - | ✅ | - | ✅ |
japaneast | - | ✅ | - | ✅ |
northcentralus | - | ✅ | - | - |
norwayeast | - | ✅ | - | - |
southafricanorth | - | ✅ | - | - |
E.U.A Centro-Sul | ✅ | ✅ | - | - |
southindia | - | ✅ | - | ✅ |
suécia central | - | ✅ | - | ✅ |
norte da suíça | - | ✅ | - | - |
uksouth | - | ✅ | - | ✅ |
westeurope | - | ✅ | - | - |
westus | - | ✅ | - | - |
westus3 | - | ✅ | - | ✅ |
Modelos DALL-E
Model ID | Disponibilidade de recursos | Max Request (caracteres) |
---|---|---|
dalle2 (pré-visualização) | E.U.A. Leste | 1,000 |
DALL-E-3 | Leste dos EUA, Leste da Austrália, Suécia Central | 4,000 |
Modelos de ajuste fino
babbage-002
e davinci-002
não são treinados para seguir instruções. A consulta a esses modelos básicos deve ser feita apenas como um ponto de referência para uma versão ajustada para avaliar o progresso do seu treinamento.
gpt-35-turbo
- O ajuste fino deste modelo é limitado a um subconjunto de regiões e não está disponível em todas as regiões em que o modelo base está disponível.
Model ID | Regiões de ajuste fino | Solicitação máxima (tokens) | Dados de formação (até) |
---|---|---|---|
babbage-002 |
Centro-Norte dos EUA Suécia Central Oeste da Suíça |
16,384 | Setembro 2021 |
davinci-002 |
Centro-Norte dos EUA Suécia Central Oeste da Suíça |
16,384 | Setembro 2021 |
gpt-35-turbo (0613) |
Leste US2 Centro-Norte dos EUA Suécia Central Oeste da Suíça |
4,096 | Setembro 2021 |
gpt-35-turbo (1106) |
Leste US2 Centro-Norte dos EUA Suécia Central Oeste da Suíça |
Entrada: 16.385 Saída: 4.096 |
Setembro 2021 |
gpt-35-turbo (0125) |
Leste US2 Centro-Norte dos EUA Suécia Central Oeste da Suíça |
16,385 | Setembro 2021 |
gpt-4 (0613) 1 |
Centro-Norte dos EUA Suécia Central |
8192 | Setembro 2021 |
gpt-4o-mini 1 (2024-07-18) |
Centro-Norte dos EUA Suécia Central |
Entrada: 128.000 Potência: 16.384 Duração do contexto do exemplo de treinamento: 64.536 |
Outubro de 2023 |
1 mini ajuste fino GPT-4 e GPT-4o está atualmente em pré-visualização pública. Consulte as nossas orientações de avaliação de segurança GPT-4 & GPT-4o mini fine-tuning para obter mais informações.
Modelos de sussurro
Model ID | Disponibilidade do Modelo | Max Request (tamanho do arquivo de áudio) |
---|---|---|
whisper |
Leste dos EUA 2 Centro-Norte dos EUA Leste da Noruega Sul da Índia Suécia Central Europa Ocidental |
25 MB |
Modelos de conversão de texto em fala (Pré-visualização)
Model ID | Disponibilidade do Modelo |
---|---|
tts-1 |
Centro-Norte dos EUA Suécia Central |
tts-1-hd |
Centro-Norte dos EUA Suécia Central |
Assistentes (Pré-visualização)
Para assistentes, precisa de uma combinação de um modelo suportado e uma região suportada. Certas ferramentas e capacidades requerem os modelos mais recentes. Os modelos a seguir estão disponíveis na API de Assistentes, SDK, Azure AI Studio e Azure OpenAI Studio. A tabela a seguir é para pagamento conforme o uso. Para obter informações sobre a disponibilidade da PTU (Unidade de Taxa de Transferência Provisionada), consulte Taxa de transferência provisionada. Os modelos e regiões listados podem ser usados com os Assistentes v1 e v2. Você pode usar modelos padrão globais se eles forem suportados nas regiões listadas abaixo.
País/Região | gpt-35-turbo (0613) |
gpt-35-turbo (1106) |
fine tuned gpt-3.5-turbo-0125 |
gpt-4 (0613) |
gpt-4 (1106) |
gpt-4 (0125) |
gpt-4o (2024-05-13) |
gpt-4o-mini (2024-07-18) |
---|---|---|---|---|---|---|---|---|
Leste da Austrália | ✅ | ✅ | ✅ | ✅ | ||||
E.U.A. Leste | ✅ | ✅ | ✅ | ✅ | ||||
E.U.A. Leste 2 | ✅ | ✅ | ✅ | ✅ | ✅ | |||
França Central | ✅ | ✅ | ✅ | ✅ | ||||
Leste do Japão | ✅ | |||||||
Leste da Noruega | ✅ | |||||||
Suécia Central | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||
Sul do Reino Unido | ✅ | ✅ | ✅ | ✅ | ||||
E.U.A. Oeste | ✅ | ✅ | ✅ | |||||
EUA Oeste 3 | ✅ | ✅ |
Modelo de aposentadoria
Para obter as informações mais recentes sobre modelos de aposentadoria, consulte o guia de aposentadoria modelo.