chatgpt 训练需要哪些硬设备开发自己私有chatGPT（五）训练微调openai模型

默认分类2年前 (2023)发布 admin

4,536 0 0

微调

了解如何为应用程序自定义模型。

介绍

通过微调，您可以通过提供以下内容从通过 API 提供的模型中获得更多收益：

比提示设计更高质量的结果能够训练比提示所能容纳的更多示例由于提示时间较短，可以节省token更低的延迟请求

GPT-3 已经对来自开放互联网的大量文本进行了预训练。当给出一个只有几个例子的提示时，它通常可以直观地判断你正在尝试执行什么任务并生成一个合理的完成。这通常被称为“少镜头学习”。

微调通过训练比提示所能容纳的更多的示例来改进少数镜头学习，让您在大量任务上获得更好的结果。对模型进行微调后，无需再在提示中提供示例。这样可以节省成本并实现更低的延迟请求。

概括地说，微调涉及以下步骤：

准备和上传训练数据训练新的微调模型使用微调模型

请访问我们的定价页面，详细了解如何对微调的模型训练和使用计费。

哪些模型可以微调？

微调目前仅适用于以下基本型号： curie ada text–003。

安装

我们建议使用我们的命令行界面（CLI）。要安装它，请运行

pip install --upgrade openai

复制

（以下说明适用于版本0.9.4及更高版本。此外， CLI 需要 3。

通过在 shell 初始化脚本（例如 .、zshrc 等）中添加以下行或在微调命令之前的命令行中运行它来设置环境变量：

准备训练数据

chatgpt 训练需要哪些硬设备开发自己私有chatGPT（五）训练微调openai模型

训练数据是你教 GPT-3去说。

您的数据必须是JSONL文档，其中每行都是对应于训练示例的一对提示完成。您可以使用我们的CLI 数据准备工具轻松地将数据转换为此文件格式。

{"prompt": "", "completion": ""}
{"prompt": "", "completion": ""}
{"prompt": "", "completion": ""}
...

复制

CLI 数据准备工具

我们开发了一个工具来验证、提供建议和重新格式化您的数据：

openai tools fine_tunes.prepare_data -f

复制

此工具接受不同的格式文件，唯一要求它们包含提示和完成列/键。您可以传递CSV、TSV、XLSX、JSON或JSONL文件，它会在指导您完成建议的更改过程后，将输出保存到 JSONL 文件中，以便进行微调。

创建微调模型

以下假设你已按照上述说明准备了训练数据。

使用 CLI 启动微调作业：

openai api fine_tunes.create -t  -m

复制

是基础模型的名称（ada, , curie, ）。您可以使用后缀参数自定义你的微调模型的名称。

运行上述命令会执行以下几项操作：

使用文件API 上传文件（或使用已上传的文件）创建微调作业流式传输事件，直到作业完成（这通常需要几分钟，但如果队列中有许多作业或数据集很大，则可能需要数小时）

每个微调作业都从基础模型开始，默认是curie。模型的选择会影响模型的性能和运行微调模型的成本。

开始微调作业后，可能需要一些时间才能完成。你的作业可能排在我们系统上的其他作业后面，训练我们的模型可能需要几分钟或几小时，具体取决于模型和数据集大小。如果事件流因任何原因中断，您可以通过运行以下命令来恢复它：

chatgpt 训练需要哪些硬设备开发自己私有chatGPT（五）训练微调openai模型

openai api fine_tunes.follow -i

复制

作业完成后，它会显示微调模型的名称。

除了创建微调作业之外，您还可以列出现有作业、检索作业状态或取消作业。

# List all created fine-tunes
openai api fine_tunes.list
# Retrieve the state of a fine-tune. The resulting object includes
# job status (which can be one of pending, running, succeeded, or failed)
# and other information
openai api fine_tunes.get -i 
# Cancel a job
openai api fine_tunes.cancel -i

复制

使用微调模型

CLI：

openai api completions.create -m  -p

复制

curl

curl https://api.openai.com/v1/completions 
  -H "Authorization: Bearer $OPENAI_API_KEY" 
  -H "Content-Type: application/json" 
  -d '{"prompt": YOUR_PROMPT, "model": FINE_TUNED_MODEL}'

复制

import openai
openai.Completion.create(
    model=FINE_TUNED_MODEL,
    prompt=YOUR_PROMPT)

复制

Node.js

const response = await openai.createCompletion({
  model: FINE_TUNED_MODEL
  prompt: YOUR_PROMPT,
});

复制

# 默认分类 # 作业 # 复制 # 微调 # 模型 # 示例

文章版权归作者所有，未经允许请勿转载。

如何用chatgpt生成大量文本 “火爆”的ChatGPT尚没有“自主心智”

admin

549 0

ai路径文字工具怎么用让AI来画《海贼王》；苹果限制员工使用ChatGPT；李彦宏：不担心大模型会让工

admin

3,539 0

chatgpt财经应用场景【财经分析】打造细分领域数据优势释放行业版ChatGPT生产力

admin

1,056 0

ai百晓生软件好用吗? 百晓生 AI – 聊天绘‪画‬

admin

2,544 0

用chatgpt怎么没有对话框 Google 百度正式官宣 ChatGPT 竞品！能否颠覆搜索引擎已经没那么重要

admin

4,036 0

用chatgpt编写股票模型筛选程序多个chatgpt模型

admin

2,051 0

暂无评论

暂无评论...

chatgpt 训练需要哪些硬设备开发自己私有chatGPT（五）训练微调openai模型

chatgpt是不是微软投资的一个月烧钱2.76亿！ChatGPT催升AI淘金热：投资者疯狂砸钱，但有风险

chatgpt 用于小型互动会议策划经销商会议策划方案（模板）

相关文章

暂无评论

chatgpt 训练需要哪些硬设备 开发自己私有chatGPT（五）训练微调openai模型

chatgpt是不是微软投资的 一个月烧钱2.76亿！ChatGPT催升AI淘金热：投资者疯狂砸钱，但有风险

chatgpt 用于小型互动会议策划 经销商会议策划方案（模板）

相关文章

暂无评论

chatgpt 训练需要哪些硬设备开发自己私有chatGPT（五）训练微调openai模型

chatgpt是不是微软投资的一个月烧钱2.76亿！ChatGPT催升AI淘金热：投资者疯狂砸钱，但有风险

chatgpt 用于小型互动会议策划经销商会议策划方案（模板）