GPT-3.5 Turbo推出微调功能，可以打造专属ChatGPT啦！ -6parkbbs.com

GPT-3.5 Turbo推出微调功能，可以打造专属ChatGPT啦！ 6park.com

6park.com

8月23日凌晨，OpenAI在官网宣布，推出GPT-3.5 Turbo微调功能并更新API，使企业、开发人员可以使用自己的数据，结合业务用例构建专属ChatGPT。GPT-4的微调功能将于今年秋天推出。 6park.com

6park.com

OpenAI表示，从早期测试数据来看，GPT-3.5 Turbo 的微调版本在某些特定任务上，其性能可以匹配甚至超越GPT-4 的基本功能。（详细说明文档：https://platform.openai.com/docs/guides/fine-tuning） 6park.com

6park.com

微调功能是目前企业应用大语言模型的主要方法，例如，法律领域的Spellbook、律商联讯、Litera、Casetext等，他们通过自己积累的海量法律数据在GPT-4模型上进行微调、预训练构建法律领域的专属ChatGPT，使其回答的内容更加聚焦、安全、准确。 6park.com

6park.com

自GPT-3.5 Turbo发布以来，开发人员和企业希望能够开发自定义大模型，为用户创造独特、差异化的产品体验。现在，OpenAI终于开放了此功能，使得人人都能打造独一无二的专属ChatGPT。 6park.com

6park.com

什么是微调 6park.com

大语言模型的微调（Fine-tuning）是一种在预训练模型的基础上，对特定任务进行深度训练的方法。 6park.com

6park.com

微调的基本思想是，先在大规模文本数据上预训练一个大型的语言模型，例如，GPT-3.5，然后，使用特定任务的数据集（如法律、医疗），进一步对模型进行训练，以适应特定的任务。在这个过程中，模型的参数会进行微小的调整，使其在特定业务场景上的性能更好。 6park.com

6park.com

例如，如果我们有一个预训练的GPT3.5模型，想让它在法律业务上的表现更好、更专业，可以用海量法律数据集对模型进行微调。 6park.com

6park.com

经过微调，模型学习到如何更好地解读、生成和预测法律问题。 6park.com

6park.com

微调用例 6park.com

根据OpenAI的官方微调说明文档，列出了以下常见用例： 6park.com

6park.com

设置风格、基调、格式等； 6park.com

提高输出的可靠性； 6park.com

纠正未能遵循复杂提示的问题； 6park.com

以特定方式处理多个边缘内容； 6park.com

改进可操纵性； 6park.com

执行难以在提示中阐明的新技能或任务。 6park.com

例如，改进可操纵性，微调功能允许企业使模型更好地遵循指令，使输出简洁或始终以特定语言进行响应。例如，开发人员可以使用微调来确保模型，在提示使用德语时始终以德语进行响应。 6park.com

6park.com

除了提高性能之外，微调使企业能够缩短提示时间同时保证性能。GPT-3.5-Turbo微调还可以处理4k tokens，是OpenAI之前微调模型的两倍。 6park.com

6park.com

早期测试人员通过对模型本身的指令进行微调，将提示大小减少了高达 90%，从而加快了每个API调用的速度并降低了成本。 6park.com

6park.com

如何进行微调 6park.com

1，准备数据，创建一组多样化的演示对话，类似于要求模型在实际输出中的对话。数据集中的每个示例都应该与OpenAI的聊天完成 API 格式相同的对话，特别是消息列表，其中每条消息都有角色、内容和可选名称。 6park.com

6park.com

2，上传文件 6park.com

6park.com

3，创建微调作业，使用 OpenAI SDK开始进行大规模数据训练、微调。训练模型可能需要几分钟或几小时，具体取决于模型和数据集大小。模型训练完成后，创建微调作业的用户将收到一封确认电子邮件。 6park.com

6park.com

除了创建微调作业外，开发者还可以列出现有作业、检索作业状态或取消作业。 6park.com

6park.com

4，使用微调模型，微调作业完成后模型可以投入使用了。 6park.com

6park.com

在某些情况下，用户的微调模型可能需要几分钟才能准备好处理请求。如果对模型的请求超时或找不到模型名称，可能是因为模型仍在加载中，可在几分钟后重试。 6park.com

6park.com

微调定价 6park.com

微调分为初始训练成本和使用成本两大部分。 6park.com

6park.com

训练：0.008 美元/1K tokens。 6park.com

6park.com

使用输入：0.012 美元/1K tokens。 6park.com

6park.com

使用输出：0.016 美元/1K tokens。 6park.com

6park.com

例如，一个GPT-3.5 Turbo包含 100,000 个okens的训练文件并训练3个epoch的微调作业的预期成本为2.40美元。 6park.com

所有跟帖: ( 主贴楼主有权删除不文明回复，拉黑不受欢迎的用户 )

打开微信，扫一扫[Scan QR Code]
进入内容页点击屏幕右上分享按钮

楼主本栏目热帖推荐：

6G通信能力是5G十倍以上？ 02/27/24
华为发布5.5G智能核心网解决方案 02/27/24
微软再放大招，ChatGPT出现现象级应用，A股算法+算力公司最受益 12/26/23
GPT-5、开源、更强的ChatGPT！OpenAI公布2024年计划 12/26/23
37℃不再是人体标准体温？体温是高好，还是低好？ 12/26/23
科学家发现新逆生长分子，2个月让细胞明显改善，或成抗衰爆款 12/26/23
在中国的苹果手机被阉割了哪些部分? 12/10/23
新一代通用处理器龙芯3A6000在京发布 11/28/23
华为终于下定决心，彻底删除“美国代码” 11/27/23
阿里达摩院量子实验室裁撤背后：科技创新的无奈与坚韧 11/26/23
字节舞动第二季度营收飙升 11/14/23
美媒担忧“中国突破美制裁” 09/04/23

>>>>查看更多楼主社区动态...