Refuel AI 推出专为数据标注和清洗设计的开源语言模型 RefuelLLM-2
Refuel AI 最近宣布推出两个新版本的大型语言模型(LLM),RefuelLLM-2和 RefuelLLM-2-small,这两个模型专为数据标注、清洗和丰富任务而设计,旨在提高处理大规模数据集的效率。

RefuelLLM-2的主要特点包括:
自动化数据标注:能够自动识别和标记数据中的关键信息,如分类数据和解析特定属性。
数据清洗:自动检测并修正数据中的错误或不一致性,例如拼写错误和格式问题。
数据丰富:根据现有数据自动补充缺失信息或提供额外上下文,增加数据的价值和可用性。
高准确率:在约30项数据标注任务的基准测试中,RefuelLLM-2以83.82%的准确率优于所有其他最先进的大型语言模型,包括 GPT-4-Turbo 和 Claude-3-Opus。
两款模型的比较:
RefuelLLM-2:基于 Mixtral-8x7B 模型,支持高达32K的最大输入上下文长度,适合处理长文本输入。
RefuelLLM-2-small:基于 Llama3-8B 模型,提供一个成本更低、运行更快的选项,同时保持高性能,支持高达8K的输入上下文长度。
训练细节:
两款模型都在超过2750个数据集上进行训练,涵盖分类、阅读理解、结构化属性提取和实体解析等任务。
训练方法:包括两个阶段,第一阶段专注于指令调整训练,第二阶段则加入更长上下文的输入,以提高模型在复杂数据处理任务中的表现。
性能提升:
两阶段训练方法使得 RefuelLLM-2在基本数据处理任务中表现出色,并能有效处理长上下文输入。
质量评估:
在长上下文数据集和非公开数据集的评估中,RefuelLLM-2和 RefuelLLM-2-small 均展现出良好的性能和泛化能力。
在置信度分数质量方面,RefuelLLM-2和 RefuelLLM-2-small 显示出比其他模型更好的置信度分数校准。
Refuel AI 的这一创新为数据标注和清洗领域带来了新的解决方案,有助于自动化和优化大规模数据处理流程。
playground:https://labs.refuel.ai/playground
模型下载:https://huggingface.co/refuelai/Llama-3-Refueled
苹果或将于9月13日举行秋季发布会 iPhone15或可9月中旬预定
据彭博社的马克·格尔曼在最新一期的时事通讯中报道,苹果公司的年度iPhone活动预计将于今年9月12日星期二或9月13日星期三举行。按照苹果公司的惯例,新款iPhone的预订将在几天后的9月15日星期五开始,而发售日期则在一周后的9月22日。站长网2023-08-07 10:08:470000曾年入过亿的劣迹网红,悄悄“复活”
“为什么有人喜欢看我的直播?很简单,因为我能做,在任何别的直播平台,他们不可能给你做,也没有这个能力去做的内容。”2017年6月,“帝师”孙自烜在一次专访中如此说道。站长网2023-12-07 18:22:350000OpenAI放王炸,Sora无限使用!3大新功能,2024最大惊喜!
今天凌晨2点,OpenAI开启了第三天技术直播,正式发布了期待已久的产品——SoraTurbo。与早期版本相比,Turbo的生成效率更快,能通过文本直接生成最多20秒1080P视频,这是目前全球生成时长最高的视频模型之一,同时支持文本图片/视频,生成特定视频内容,使得模型的生成效果更加可控。0000微软计划在澳大利亚投资 32 亿美元以扩展其人工智能和云计算能力
站长之家(ChinaZ.com)10月24日消息:微软公司日前宣布,将在接下来的两年内投资50亿澳元(约合32亿美元)在澳大利亚扩展其人工智能(AI)和云计算能力。此举是该公司一项包括技能培训和网络安全在内的广泛努力的一部分。站长网2023-10-24 23:37:390000京东:截止24日零点 双11价保服务已为消费者节省1.02亿元
京东11.11期间,京东对价保服务进行重磅升级,超8亿商品享全程价保,即消费者在10月23日晚8点至11月13日24点购买的价保服务覆盖商品,均可享受30天及以上的价保,点击“一键价保”立享差价退回。据京东公布数据,自10月23日晚8点开启至24日零点,价保服务已经为消费者节省1.02亿元。站长网2023-10-25 19:18:020002