Cohere全面推出微调套件：聊天、重新排序、多标签分类一应俱全

站长网2023-11-22 11:35:303阅

**划重点:**

1. 🚀 Cohere发布全新微调能力，包括聊天微调、重新排序微调和多标签分类微调，助力企业个性化AI应用。

2. 💻 新微调仪表板支持用户轻松管理和运行微调项目，提供测试场地、实时进度监控和价格计算器。

3. 📈 微调加强模型性能，提高60%的生成解决方案准确性和40%的聊天解决方案改进，实现30分钟内微调模型训练和1分钟内上线。

Cohere宣布推出全新的全面微调套件，其中包括聊天微调、重新排序微调和多标签分类微调等三项新功能，以及现有的生成微调解决方案，旨在满足企业在微调各种AI应用时的需求。

通过这些新功能，企业可以定制Cohere的生成和表示模型，以在文本生成、摘要、聊天、分类和企业搜索等目标用例上提供更好的性能。

微调套件引入了全新的微调仪表板，使企业能够轻松管理和运行微调项目。用户可以在几分钟内启动项目，利用测试场地验证微调模型，并通过价格计算器做出关于微调成本的明智决策。新的模型管理界面提供了对正在进行的微调作业进度和状态的实时洞察，确保用户全面了解其模型开发流水线和自定义评估指标，使Cohere客户能够有效管理、监控和优化其微调模型。

Cohere满足企业定制模型、提高在特定领域的性能需求的要求，通过监督微调在各种用例中实现了更精准的性能。通过微调控制和高达六个超参数的调整，客户可以最大程度地优化微调模型的性能。文章通过一个财务服务提供商的用例进行了说明，展示了通过微调Command Light模型，可以为财务数据的问题提供更准确、更自然的回答，相较于使用原始模型，准确性提升了60%。

微调不仅提高了模型的质量和准确性，还加速了模型的生产过程。开发人员现在可以在短短30分钟内训练微调模型，这得益于微调框架的改进和高效的TPU分配过程。完成训练后，企业可以在不到一分钟的时间内将微调模型部署到生产环境中，使开发人员能够轻松管理和自信地扩展其AI应用。

在AI应用的成本效益方面，Cohere致力于提供满足各种企业用例需求的价格选择。为了实现更低的价格点上访问强大的语言模型，Cohere建议微调较小的生成模型，例如Command Light，以优化特定任务的性能，同时成本效益较高。例如，使用包含100万token的数据集进行两个周期的Command Light微调的预期成本为2美元。早期评估显示，相较于直接使用原始模型，微调Command Light可以在更低的延迟和成本下实现类似甚至更好的性能。

Cohere表示他们将以与基础模型相同的推理成本提供微调模型，使客户能够以相同的价格获得提升精度的微调模型。Cohere客户现在可以访问微调仪表板，根据生成、聊天、分类和重新排序解决方案进行定制。开发人员可以按照指南学习有关它们如何工作的更多信息。

Cohere全面推出微调套件聊天 重新排序多标签分类一应俱全

0003

评论列表

共(0)条

相关推荐

站长资讯
苹果或正开发可折叠iPad 预计最快将在明年推出
最新消息透露，苹果正考虑率先推出可折叠的iPad产品。这也与之前分析师郭明錤的预测相符，他预计苹果将在明年推出折叠iPad。据爆料，这款折叠iPad将采用碳纤维材质的支撑架，这种材质既轻便又耐用，有助于保持整个折叠屏幕的稳固和平整。除了碳纤维支撑架外，苹果还申请了一项名为“具有柔性显示屏覆盖层的电子设备”的专利，这项专利介绍了一种可自愈的材料，可减轻折痕或划痕。
站长网2023-10-19 08:40:37
0000
站长资讯
Evisort成功开发法律合同领域的大型语言模型(LLM)
Evisort成功开发了专门用于法律协议的大型语言模型（LLM），并将其作为其新的多方位生成AI引擎的关键组成部分。该LLM将使Evisort能够提供比通用的第三方LLMs更准确和响应更灵活的AI创新，从而帮助组织更好地管理合同。图源备注：图片由AI生成，图片授权服务商Midjourney
站长网2023-10-11 16:25:26
0000
站长资讯
国产大模型：今天起，我们100万tokens只需1元！
昨天刚刚在顶会ICLR作为特邀演讲（InvitedTalk）中“国内唯一”的大模型玩家智谱AI，今天又放出了一个好消息:现在我家的大模型开放平台，1元=1000000tokens!具体而言，这次价格调整的对象，是智谱AI的GLM-3-Turbo:之前:0.005元/千tokens现在:0.001元/千tokens
站长网2024-05-13 09:20:28
0000
站长资讯
HumanGaussian开源：基于Gaussian Splatting的高质量3D人体生成新框架
要点:结构感知的SDS引入人体结构先验，同时优化外观和几何形状。通过退火的负文本引导，确保真实结果，避免过度饱和和消除浮动伪影。HumanGaussian框架能够生成多样、逼真的高质量3D人体模型，展现真实外观和细粒度的细节。
站长网2023-12-11 09:59:09
0000
站长资讯
全新视频全景分割技术MaXTron
MaXTron是一种专为视频分割而设计的先进的元架构，通过无缝集成片内和片间跟踪模块，提升了分割结果的时间一致性。其统一的元架构简化了分割过程，使其成为计算机视觉领域研究人员和从业者的有效工具。项目地址:https://github.com/tacju/maxtron该架构引入了两个关键组件:一个用于视频片段内跟踪的模块和一个用于视频片段间跟踪的模块，丰富了现有的片段级别分割器。主要功能:
站长网2023-12-06 10:46:58
0000