融资1亿美元的类ChatGPT模型开源啦!可商用,8个模型
上周二,「AIGC开放社区」为大家介绍了融资1亿美元的生成式AI平台Writer。该企业能在短短3年时间获得1.26亿美元总融资成为ChatGPT的主要竞争对手之一,与其精湛的技术密不可分,同时充分证明其模型有成功的应用案例并获得资本、用户的认可。
目前,Writer在huggingface上开源了其使用的大语言模型Palmyra,有8个型号分别是small、base、20b-chat、Instruct-20b、med-20b等,可商用、支持数据微调。
开源地址:https://huggingface.co/Writer
在线免费体验地址:https://app.writer.com/organization/
Palmyra的技术亮点包括:参数小功能强,对于没有算力资源的中小企业、个人开发者很有帮助;接受过商业写作、营销数据训练,主要面向企业用户;企业级数据安全,内置多重安全护栏;
除了生成文本之外,还能提取视频、PDF、音频的内容摘要;支持数据微调,企业可打造独属于自己的“ChatGPT”助手等。
下面「AIGC开放社区」为大家介绍Palmyra的几个特色型号
InstructPalmyra-20b
这是一款基于Palmyra-20b基础模型构建的指令调优模型,支持高级自然语言处理和量身定制需求。
InstructPalmyra-20b模型在大约70,000条指令-回应记录的广泛数据集上,进行了精细的训练。这些记录由Writer专业的语言建模和微调技术团队生成。
InstructPalmyra-20b拥有出色的处理复杂指令并生成准确、符合上下文的回应能力。这使其成为开发虚拟助手、客户支持、内容生成等广泛应用的理想模型。
此外,模型的全面训练使其能够在不同的条件和上下文下适应并表现良好,进一步扩大了其潜在的场景应用案例。
Palmyra-med-20b
Palmyra-Med是Writer专为满足医疗保健行业需求而构建的模型,并基于医疗数据进行了指令微调。
Palmyra-Med在领先的生物医学问答PubMedQA的测试中获得了最高分,准确率高达81.1%,优于GPT-4和经过医学训练的人类测试者。
可提供翻译专业医疗术语、提取医疗笔记摘要、分析海量医疗数据、自动生成医疗见解等功能。
Palmyra Large20B
Palmyra-Large是Writer构建的因果解码器模型,该模型在由Palmyra-Index-Data增强,并在高质量语料库中的8000亿数据上进行了训练。
Palmyra Large在模型预训练过程中使用了因果语言建模(CLM)目标。与 GPT-3类似,因此,其利用自监督因果语言建模的目标进行了预训练。
该模型运行效率非常快,资源消耗却很少,适用于医疗、营销、市场、IT、设计、人力资源等业务场景,打造量身定制的AI助手。
性能评测
Palmyra在斯坦福HELM上获得了最高分,超过Falcon40B 、LLaMA-30B等知名开源模型。HELM是斯坦福大学基础模型研究中心的一项基准测试平台知名度非常高。
Palmyra在多项重要测试中排名第一,在大规模多任务语言理解(MMLU)上得分为60.9% ,在BoolQ上得分为89.6%,在NaturalQuestions上得分为79.0%。
Palmyra在另外两项关键测试中排名第二,上下文问答得分为49.7% ,TruthfulQA得分为61.6%,整体性能非常强悍。
总之,Palmyra非常值得那些希望将大语言模型实现商业化的开发者们,研究其模型架构和功能借鉴其成功经验。
本文素材来源Writer官网,如有侵权请联系删除
END
雷军向武大捐赠13亿元 创全国高校单笔个人现金捐赠纪录
据武汉大学官方消息,今天,是武大百卅校庆之日,雷军校友个人向武汉大学捐赠13亿元人民币现金,刷新了武大建校以来单笔最大捐赠额,也是全国高校收到的最大一笔校友个人现金捐赠。此次捐赠主要聚焦三个方向:支持数理化文史哲六大基础学科研究,支持计算机领域科技创新,支持大学生培养。雷军是武大1987级计算机系校友,也是小米集团的创始人和董事长兼首席执行官。站长网2023-11-29 11:02:170000AI绘图模型训练到推理,一个网页就能搞定
不会写代码,也能训练AI绘画模型了!只要借助这个框架,从训练到推理都能一站式搞定,还能一次管理多个模型。阿里巴巴团队推出并开源了这款万能图片生成工作台SCEPTERStudio。有了它,不用代码,直接在Web界面当中就能完成模型的训练与微调,并管理相关数据。团队还推出了内置三种模型的DEMO,可以在线体验SCEPTER的推理功能。那么SCEPTER具体都能干啥,下面就来一睹为快!站长网2024-02-18 09:22:070001OpenAI新模型用的嵌入技术被网友扒出来了
前几天,OpenAI来了一波重磅更新,一口气宣布了5个新模型,其中就包括两个新的文本嵌入模型。我们知道,嵌入是表示自然语言或代码等内容中概念的数字序列。嵌入使得机器学习模型和其他算法更容易理解内容之间的关联,也更容易执行聚类或检索等任务。站长网2024-01-29 18:17:560000Opera One 全新版本正式发布:原生 AI 集成、新的模块化设计
Opera浏览器的全新版本OperaOne今天正式发布,其在竞争对手中最引人注目的特色是原生人工智能集成。图片来自Opera开发人员表示,OperaOne引入了Aria,它是「第一个真正的原生浏览器人工智能」。用户可以通过命令行或浏览器侧边栏调用Aria,并利用OpenAI的GPT技术优化网页搜索。根据新闻稿:站长网2023-06-21 15:26:070001BOSS直聘崩了上热搜 官方回应:目前已恢复
今日9点30分左右,#boss直聘崩了#登上微博热搜,有网友表示,boss直聘PC平台的相关页面无法加载。就在刚刚,针对上述情况,BOSS直聘官方回应称,今日上午部分用户使用BOSS直聘PC端时,部分功能出现异常,经过紧急抢修,目前已恢复,很抱歉给大家带来不便。站长网2023-05-24 11:18:520000