首页站长资讯微软Azure OpenAI支持数据微调啦！可打造专属ChatGPT

微软Azure OpenAI支持数据微调啦！可打造专属ChatGPT

站长网2023-10-19 09:00:160阅

10月17日，微软在官网宣布，现在可以在Azure OpenAI公共预览版中对GPT-3.5-Turbo、Babbage-002和Davinci-002模型进行数据微调。

使得开发人员通过自己的数据集，便能打造独一无二的ChatGPT。例如，通过海量医疗数据进行微调，构建专注医疗领域的ChatGPT助手，可询问与医疗相关的病历、专业术语、治疗方案等内容。

目前，全球各行业积累了几年甚至几十年的巨量优质数据，如何高效利用、查询这些数据成为一大难题。

通过自有数据微调打造的AI助手可有效解决这一痛点，同时提升内容的准确性、安全性，是组织实现降本增效的利器。

详细微调教程:https://learn.microsoft.com/en-us/azure/ai-services/openai/tutorials/fine-tune?tabs=command-line

微软Azure服务:https://azure.microsoft.com/en-us/products/ai-services/openai-service/

什么是数据微调

大模型数据微调（Fine-tuning）是一种迁移学习方法，用于深度学习和机器学习。通常数据微调是基于一个预训练好的模型(例如，GPT-3.5-Turbo)作为基石，然后在特定的任务数据集(例如，法律、医疗、营销)上进行额外的训练，使模型能生成特定业务领域的内容。

例如，你想训练一个模型来回答法律相关的问题，首先在大量的通用文本数据上进行预训练，然后在医学问答数据集上进行微调。

简单来说，微调功能就是让ChatGPT，完全按照你的数据来生成内容。

需要注意的是，即便你有高质量的数据集，但选择的微调模型性能很差，生成的内容也不会很理想。

而微软提供基于OpenAI的GPT-3.5-Turbo，是一个经过全球数百万开发者验证的高性能成熟模型。

Azure OpenAI新功能

Babbage-002和Davinci-002是微软最新推出的GPT-3基础模型，可生成文本、代码等，没有接受过遵循指令的训练。但在微调、托管服务费用方面更便宜。

Babbage-002取代了已弃用的Ada和Babbage 模型， Davinci-002则取代了Curie和 Davinci。

GPT-3.5-Turbo是OpenAI性能最成熟模型之一，支持多轮深度对话、创建微调数据集、训练和部署等一站式开发服务。

Azure OpenAI微调功能演示

上传数据:微软在Azure OpenAI内置了数据过滤功能，当检测到用户上传的数据集包含非法、歧视等有害信息时，会自动删除这些内容。以下是上传数据集代码示例。

预训练:使用指定模型、训练和验证数据，并设置相应的参数。开发者可将Azure OpenAI Studio用于简单的GUI，或者使用微软的REST API或OpenAI Python SDK。

开始启动微调功能。

完成微调后，将返回评估指标，例如，训练和验证损失等参数。

目前，微软提供数据微调托管服务，用户无需担心任何算力资源问题，只需要选择时间即可。

收费标准:Babbage-002为34美元/小时;Davinci-002为68美元/小时;GPT-3.5-Turbo为102美元/小时。

3）Azure OpenAI 服务中的推理托管:当用户完成微调后，就可以使用模型生成专属内容了。

如果你没有足够的算力资源平台来支撑模型的日常输出，微软同样提供了托管服务。

收费标准:Babbage-002托管每小时1.7美元，Davinci-002每小时1.7美元，GPT-35-Turbo，每小时7美元。

微软AzureOpenAI支持数据微调啦可打造专属ChatGPT

0000

评论列表

共(0)条

相关推荐

站长资讯
搞笑达人“李炮儿”勇闯《中国好声音》，涨粉千万还差点出道？
搞笑短视频达人接受粉丝提出的挑战，参加《中国好声音》，竟一路过关斩将到全国总决赛，还涨粉近千万?这不是段子，这是李炮儿的真实经历。近日，李炮儿参加《中国好声音》的系列视频火爆出圈，如今其全网粉丝数已经近2000万，仅抖音就达到了1400万。从拍摄第一个参加《中国好声音》的视频至今，仅抖音就涨粉900多万。
站长网2023-07-16 18:49:28
0002
中文海报设计，赛道一夜颠覆
豆包升级上新，网友们再次玩疯!更新的是豆包文生图功能，官方直接用一张豆包AI生成的海报给划了重点:没错，豆包可以在图片中生成更准确的文字了，尤其是中文。做海报，效果可以是酱婶的:给自己的旅游VLOG整点某音某书封面，风格也是直接拿捏。甚至还能直接拿来设计文旅周边了…另外，超长复杂提示词也能准确get:（上下滑动查看提示词）
站长网站长资讯2025-04-07 09:12:21
0000
站长资讯
店群再见！小红书清退无货源电商
今天标题中提到了“店群”和“无货源”两个新词，对于博主们来说可能稍微有点陌生，但对于一些做电商的朋友，那是熟到家了。“无货源”你可能没听过，但是一件代发，可能就不陌生了，举个简单的例子更容易理解，你在小红书上开个店，自己没货还不想囤货咋办呢?
站长网2023-08-31 09:12:42
0000
在变化中寻找解法数据安全为数字经济发展保驾护航
来源：人民网原创稿数据是数字经济的核心生产要素，而保护数据安全，是数字经济发展的重点之一。数据的主体是谁？如何从国家、企业层面保护数据安全？如何促进数据有序跨境流动？围绕数据安全这一话题，多位专家学者在博鳌亚洲论坛上展开讨论。
站长网站长资讯2023-05-24 13:06:40
0000
站长资讯
雷军：小米SU7量产第10000辆整车正式下线
今日，小米创始人雷军宣布，小米SU7量产的第10000辆整车正式下线。据悉，2024年3月28日，小米集团举办了XIAOMISU7上市发布会，并于同年4月3日正式开始交付这款车型。
站长网2024-04-29 16:59:15
0000