微软Azure OpenAI支持数据微调啦!可打造专属ChatGPT
10月17日,微软在官网宣布,现在可以在Azure OpenAI公共预览版中对GPT-3.5-Turbo、Babbage-002和Davinci-002模型进行数据微调。
使得开发人员通过自己的数据集,便能打造独一无二的ChatGPT。例如,通过海量医疗数据进行微调,构建专注医疗领域的ChatGPT助手,可询问与医疗相关的病历、专业术语、治疗方案等内容。
目前,全球各行业积累了几年甚至几十年的巨量优质数据,如何高效利用、查询这些数据成为一大难题。
通过自有数据微调打造的AI助手可有效解决这一痛点,同时提升内容的准确性、安全性,是组织实现降本增效的利器。
详细微调教程:https://learn.microsoft.com/en-us/azure/ai-services/openai/tutorials/fine-tune?tabs=command-line
微软Azure服务:https://azure.microsoft.com/en-us/products/ai-services/openai-service/

什么是数据微调
大模型数据微调(Fine-tuning)是一种迁移学习方法,用于深度学习和机器学习。通常数据微调是基于一个预训练好的模型(例如,GPT-3.5-Turbo)作为基石,然后在特定的任务数据集(例如,法律、医疗、营销)上进行额外的训练,使模型能生成特定业务领域的内容。
例如,你想训练一个模型来回答法律相关的问题,首先在大量的通用文本数据上进行预训练,然后在医学问答数据集上进行微调。
简单来说,微调功能就是让ChatGPT,完全按照你的数据来生成内容。

需要注意的是,即便你有高质量的数据集,但选择的微调模型性能很差,生成的内容也不会很理想。
而微软提供基于OpenAI的GPT-3.5-Turbo,是一个经过全球数百万开发者验证的高性能成熟模型。
Azure OpenAI新功能
Babbage-002和Davinci-002是微软最新推出的GPT-3基础模型,可生成文本、代码等,没有接受过遵循指令的训练。但在微调、托管服务费用方面更便宜。
Babbage-002取代了已弃用的Ada和Babbage 模型, Davinci-002则取代了Curie和 Davinci。

GPT-3.5-Turbo是OpenAI性能最成熟模型之一,支持多轮深度对话、创建微调数据集、训练和部署等一站式开发服务。
Azure OpenAI微调功能演示
上传数据:微软在Azure OpenAI内置了数据过滤功能,当检测到用户上传的数据集包含非法、歧视等有害信息时,会自动删除这些内容。以下是上传数据集代码示例。

预训练:使用指定模型、训练和验证数据,并设置相应的参数。开发者可将Azure OpenAI Studio用于简单的GUI,或者使用微软的REST API或OpenAI Python SDK。

开始启动微调功能。

完成微调后,将返回评估指标,例如,训练和验证损失等参数。

目前,微软提供数据微调托管服务,用户无需担心任何算力资源问题,只需要选择时间即可。
收费标准:Babbage-002为34美元/小时;Davinci-002为68美元/小时;GPT-3.5-Turbo为102美元/小时。
3)Azure OpenAI 服务中的推理托管:当用户完成微调后,就可以使用模型生成专属内容了。

如果你没有足够的算力资源平台来支撑模型的日常输出,微软同样提供了托管服务。
收费标准:Babbage-002托管每小时1.7美元,Davinci-002每小时1.7美元,GPT-35-Turbo,每小时7美元。

世界排名第三!任正非:国内现有30多个操作系统基于鸿蒙开源构建
快科技9月22日消息,任正非在与南开大学新闻与传播学院院长、科技日报原总编辑刘亚东的谈话中提到,国内现在有30多个操作系统都是基于鸿蒙开源构建的,涵盖了行业终端、手机平板、家庭终端,加起来大概已经有6亿用户,世界排名第三。鸿蒙刚升级到4.0,升级以后,外面也会跟着升级。有个开源社区,不是华为一家在做,我们做的是底座和内核。我们是做黑土地”,上面的玉米”、大豆”还是高粱”,都是合作伙伴来种植的。0000你享受免费安全 就要接受广告!周鸿祎:用户抱怨360广告弹窗多 我们有极速版
快科技6月15日消息,近日,周鸿祎公开表示,用户会抱怨360的广告弹窗,我们提供了360安全卫士的极速版。用户会抱怨360的广告弹窗,我们提供了360安全卫士的极速版,就彻底没有广告。”周鸿祎说道。在这之前,周鸿祎回应了360广告多的问题,大家享受免费安全服务,就要接受互联网广告模式。在周鸿祎看来,360最早就是干安全的,如果他们最后真变成一个卖安全产品的公司,可能也做不到今天的规模。0000问界新M7 Max焕新版即日开订!余承东:29.8万起 5月31日发布
快科技5月17日消息,今日,华为余承东发文称,问界新M7新版本的预订通道已开启,预售价29.8万起,将于5月31日发布。同时,昨天发起的投票结果显示,大家对问界新M7新版外观内饰”的升级呼声最高。提前预告一下,问界新M7Max焕新版带来重磅升级的内外饰设计,而且还新增了星际蓝配色;拥有更强大的智驾能力、更舒适的驾乘体验,以及更丰富的舒享配置。站长网2024-05-17 10:49:460000零一万物API开放平台出场!通用Chat多模态通通开放,还有200K超长上下文版本
3月,国内外模型公司动作频频。国产大模型独角兽“五小虎”之一零一万物也有诸多新动作。这不,前脚刚发布高性能向量数据库,零一万物又立马正式发布了自己的API开放平台,共为开发者提供三个版本的模型:Yi-34B-Chat-0205:支持通用聊天、问答、对话、写作、翻译等功能。Yi-34B-Chat-200K:200K上下文,多文档阅读理解、超长知识库构建小能手。站长网2024-03-16 13:45:210001办公员工普遍认为生成式AI对老板更有益而非雇员工
**划重点:**1.🧐办公室员工普遍认为生成式人工智能对雇主更有利,而不是雇员。2.💻36%的IT从业者对生成式人工智能工具在未来五年内夺走他们的工作表示担忧,比办公室员工高出17个百分点。3.🚀企业领导者认为人工智能在组织中的主要好处是自动化琐碎任务(62%)和提高员工生产力(60%)。站长网2023-12-05 14:31:500000