Abacus AI 推出开放式上下文大语言模型Long Context
站长网2023-08-04 15:59:110阅
Abacus.AI LLM Context Expansion 是一款能够扩展语境长度的工具,可以帮助用户扩展模型的语境长度,提高模型对长文本的处理能力。该工具基于 Abacus.AI 的 LLM(Language Model for Long-form Content)架构,提供了一系列代码和工具,用于增加模型对长文本的理解能力。通过预训练和微调,该工具可以使模型在处理超过2048个单词的文本时仍然能够保持高效和准确。
项目地址:https://github.com/abacusai/Long-Context
要点:
1、Abacus AI 的研究人员通过多次实验,发现将 LLMs 的上下文长度能力扩展到更长的上下文是可行的。
2、研究人员使用不同的方法对 RedPajama 数据集进行了 fine-tune,并发现线性缩放方法在模型上下文长度上效果良好,而截断和随机化方法在检索任务上效果较差。
3、通过评估模型在不同数据集上的表现,研究人员发现将上下文长度进行缩放可以显著提高模型的性能,进而改进模型的困惑度,并更好地捕捉文档的主题。
4、Abacus.AI LLM Context Expansion 提供了评估脚本和基准任务,用于评估模型在信息检索方面的能力,并提供了重要的实验结果和复现指南,以帮助用户进一步改进和构建自己的模型。
5、Abacus.AI提供预训练模型权重,对于表现最好的模型(线性插值 指令微调,在缩放因子为4和16时),该工具提供了预训练模型的权重,方便用户直接使用或进行自己的测试。
0000
评论列表
共(0)条相关推荐
苹果再遭集体诉讼: iCloud被指“非法垄断”
快科技3月3日消息,据媒体报道,苹果公司因限制iPhone和iPad用户只能使用iCloud存储特定文件,涉嫌违反反垄断法在美国被提起集体诉讼。美国加利福尼亚州北区地方法院公示的集体诉讼申诉书显示,原告认为苹果公司基于iOS的云存储政策涉嫌非法垄断”原告认为iPhone、iPad等用户只能使用iCloud来备份包括应用程序数据和设备设置等内容,这一做法涉嫌非法垄断”0000Google的E3 TTS 通过扩散模型提供高质量音频合成方法
要点:1、E3TTS是一种简化高效的端到端扩散式文本到语音模型,通过扩散模型生成高保真的语音波形。2、E3TTS模型由预训练的BERT模型和扩散UNet模型组成,以提取文本信息并迭代地生成最终的语音波形。3、E3TTS不仅能生成高保真音频,还支持零样本任务,如语音编辑和基于提示的生成。站长网2023-11-07 14:14:270000vivo S19 系列 5 月 30 日发布:搭载索尼IMX 921大底主摄
vivo官方宣布,vivoS19系列将于5月30日19:00正式与大家见面。这款全新的手机系列不仅继承了vivo一贯的优雅与高性能,更在拍照功能上实现了重大突破。站长网2024-05-23 20:46:100000不用排队2小时 导航去餐厅吃饭 高德地图能帮你提前取号排队了
快科技7月1日消息,好不容易约上了三五好友,找到一间满意的餐厅,结果到店取号一看,前方排队40桌,预计等待时间2小时。为了避免这样的糟糕经历,高德地图上线了餐厅排队的功能。你只需打开高德地图APP,搜索想去的餐厅,进入详情页面,就能查看当前的排队预定情况。站长网2024-07-01 18:15:430002开封“王婆”换人后节目热度不减:现场人山人海 景区启动限流
4月4日消息,开封万岁山大宋武侠城《王婆说媒》节目火爆全网,每天都有众多游客前去打卡。日前,万岁山武侠城”公众号发布公告,称王婆扮演者之一赵梅因健康原因自2024年4月3日起请假一个月。在此期间,由李莉等其他扮演者为游客演出《王婆说媒》,并加场相关才艺演出。王婆”换人是否影响景区人气?据媒体报道,景区一名工作人员表示,今日依旧游客量较大,节目人气不减。站长网2024-04-08 12:47:380000