您现在的位置是:首页 >学无止境 >OpenAI目前所有模型介绍网站首页学无止境

OpenAI目前所有模型介绍

茫茫人海一粒沙 2024-06-05 00:00:03
简介OpenAI目前所有模型介绍

目录

概述

GPT-4 (limted beta)

GPT-3.5

GPT-3

各类模型介绍

DALL·E Beta

Whisper Beta

Embeddings

Moderation

Codex (deprecated)


概述

模型描述
GPT-4

Limited beta

一组在 GPT-3.5 上改进的模型,可以理解并生成自然语言或代码
GPT-3.5一组在 GPT-3 上改进的模型,可以理解并生成自然语言或代码
DALL·E

Beta

可以在给定自然语言提示的情况下生成和编辑图像的模型
Whisper

Beta

一种可以将音频转换为文本的模型
Embeddings一组可以将文本转换为数字形式的模型
Moderation可以检测文本是否敏感或不安全的微调模型
GPT-3一组可以理解和生成自然语言的模型
Codex

Deprecated

一组可以理解和生成代码的模型,包括将自然语言翻译成代码

GPT-4 (limted beta)

GPT-4 是一个大型多模态模型(今天接受文本输入并发出文本输出,将来会出现图像输入),由于其更广泛的常识和高级推理,它可以比我们以前的任何模型更准确地解决难题能力。 与 gpt-3.5-turbo 一样,GPT-4 针对聊天进行了优化,但也适用于使用 Chat Completions API 的传统完成任务。 

最新的模型描述最大的 TOKENS训练数据日期
gpt-4比任何 GPT-3.5 模型都更强大,能够执行更复杂的任务,并针对聊天进行了优化。 将使用我们最新的模型迭代进行更新。8,192 tokensUp to Sep 2021
gpt-4-03142023 年 3 月 14 日的 gpt-4 快照。与 gpt-4 不同,此模型不会收到更新,并且会在新版本发布 3 个月后弃用。8,192 tokensUp to Sep 2021
gpt-4-32k与基本 gpt-4 模式相同的功能,但上下文长度是其 4 倍。 将使用我们最新的模型迭代进行更新。32,768 tokensUp to Sep 2021
gpt-4-32k-03142023 年 3 月 14 日的 gpt-4-32 快照。与 gpt-4-32k 不同,此模型不会收到更新,并将在新版本发布 3 个月后弃用。32,768 tokensUp to Sep 2021

对于许多基本任务,GPT-4 和 GPT-3.5 模型之间的差异并不显着。 然而,在更复杂的推理情况下,GPT-4 比我们之前的任何模型都更有能力。

GPT-3.5

GPT-3.5 模型可以理解并生成自然语言或代码。 我们在 GPT-3.5 系列中功能最强大且最具成本效益的模型是 gpt-3.5-turbo,它已针对聊天进行了优化,但也适用于传统的完成任务。

最新的模型描述最大的 TOKENS训练数据日期
gpt-3.5-turbo功能最强大的 GPT-3.5 模型并针对聊天进行了优化,成本仅为 text-davinci-003 的 1/10。 将使用我们最新的模型迭代进行更新。4,096 tokensUp to Sep 2021
gpt-3.5-turbo-03012023 年 3 月 1 日的 gpt-3.5-turbo 快照。与 gpt-3.5-turbo 不同,此模型不会收到更新,并将在新版本发布 3 个月后弃用。4,096 tokensUp to Sep 2021
text-davinci-003

可以以比居里、巴贝奇或 ada 模型更好的质量、更长的输出和一致的指令遵循来完成任何语言任务。 还支持在文本中插入补全。

4,097 tokensUp to Jun 2021
text-davinci-002与 text-davinci-003 类似的功能,但使用监督微调而不是强化学习进行训练4,097 tokensUp to Jun 2021
code-davinci-002针对代码完成任务进行了优化8,001 tokensUp to Jun 2021

我们建议使用 gpt-3.5-turbo 而不是其他 GPT-3.5 模型,因为它的成本更低。

GPT-3
 

GPT-3 模型可以理解和生成自然语言。 这些模型被更强大的 GPT-3.5 代模型所取代。 然而,最初的 GPT-3 基础模型(davinci、curie、ada 和 babbage)是目前唯一可用于微调的模型。

最新的模型描述最大的 TOKENS训练数据日期
text-curie-001非常有能力,比Davinci更快,成本更低。2,049 tokensUp to Oct 2019
text-babbage-001能够执行简单的任务,速度非常快,成本更低。2,049 tokensUp to Oct 2019
text-ada-001能够执行非常简单的任务,通常是 GPT-3 系列中最快的型号,而且成本最低。2,049 tokensUp to Oct 2019
davinci功能最强大的 GPT-3 模型。 可以完成其他模型可以完成的任何任务,而且通常质量更高。2,049 tokensUp to Oct 2019
curie非常有能力,但比Davinci更快,成本更低。2,049 tokensUp to Oct 2019
babbage能够执行简单的任务,速度非常快,成本更低。2,049 tokensUp to Oct 2019
ada能够执行非常简单的任务,通常是 GPT-3 系列中最快的型号,而且成本最低。2,049 tokensUp to Oct 2019

各类模型介绍

DALL·E Beta

DALL·E 是一个人工智能系统,可以根据自然语言的描述创建逼真的图像和艺术作品。 目前支持在提示的情况下创建具有特定大小的新图像、编辑现有图像或创建用户提供的图像的变体的能力。

通过Open API 提供的当前 DALL·E 模型是 DALL·E 的第 2 次迭代,具有比原始模型更逼真、更准确且分辨率高 4 倍的图像。 您可以通过我们的实验室界面或 API 进行试用。

Whisper Beta

Whisper 是一种通用的语音识别模型。 它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。 Whisper v2-large 模型目前可通过我们的 API 使用 whisper-1 模型名称获得。

目前,Whisper 的开源版本与通过我们的 API 提供的版本之间没有区别。 然而,通过Open API,我们提供了一个优化的推理过程,这使得通过我们的 API 运行 Whisper 比通过其他方式运行要快得多。 

Embeddings

嵌入是文本的数字表示,可用于衡量两段文本之间的相关性。 我们的第二代嵌入模型 text-embedding-ada-002 旨在以一小部分成本取代之前的 16 种第一代嵌入模型。 嵌入可用于搜索、聚类、推荐、异常检测和分类任务。

Moderation

审核模型旨在检查内容是否符合 OpenAI 的使用政策。 这些模型提供了查找以下类别内容的分类功能:仇恨、仇恨/威胁、自残、性、性/未成年人、暴力和暴力/图片。

审核模型接受任意大小的输入,该输入会自动分解以修复模型特定的上下文窗口。

MODELDESCRIPTION
text-moderation-latest最有能力的审核模型。 精度会略高于稳定模型
text-moderation-stable

Codex (deprecated)


Codex 模型现已弃用。 他们是我们 GPT-3 模型的后代,可以理解和生成代码 他们的训练数据包含自然语言和来自 GitHub 的数十亿行公共代码。 了解更多。

他们最擅长 Python,精通 JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript、SQL,甚至 Shell 等十几种语言。

以下 Codex 模型现已弃用:

最新的模型描述最大的 TOKENS训练数据日期
code-davinci-002

功能最强大的 Codex 型号。 特别擅长将自然语言翻译成代码。 除了补全代码,还支持在代码中插入补全。

8,001 tokensUp to Jun 2021
code-davinci-001ode-davinci-002的早期版本8,001 tokensUp to Jun 2021
code-cushman-002几乎与 Davinci Codex 一样强大,但速度稍快。 这种速度优势可能使其成为实时应用程序的首选。Up to 2,048 tokens
code-cushman-001code-cushman-002 的早期版本Up to 2,048 tokens

以上所有的内容来自https://platform.openai.com/docs/models

风语者!平时喜欢研究各种技术,目前在从事后端开发工作,热爱生活、热爱工作。