登陆注册

8B

  • 中文聊天模型Llama3-8B-Chinese-Chat发布 减少中英混答的问题

    Llama3-8B-Chinese-Chat是一个基于Meta-Llama-3-8B-Instruct模型,通过ORPO(无参照整体优选优化)方法进行微调的中文聊天模型。该模型在处理中文问题时,相较于原始模型,减少了使用英文回答和混合中英文回答的情况,同时减少了表情符号的使用,使得回答更加正式和专业。
    站长网2024-04-23 15:15:07
    0002
  • 阿里云开源通义千问Qwen-72B、Qwen-1.8B、音频大模型Qwen-Audio

    阿里云开源通义千问720亿参数模型Qwen-72B、18亿参数模型Qwen-1.8B及音频大模型Qwen-Audio。据悉,阿里云本次开源的模型中除预训练模型外,还同步推出了对应的对话模型,面向72B、1.8B对话模型提供了4bit/8bit量化版模型,便于开发者们推理训练。
    站长网2023-12-01 09:08:04
    0001
  • Transformer一作公司Adept发布多模态大模型Fuyu-8B 80亿参数,100毫秒极速响应

    要点:1.Transformer一作AshishVaswani所在的AI公司Adept发布了Fuyu-8B,一个多模态大模型,拥有80亿参数,能够理解各种图像类型,包括照片、图表、PDF和界面UI。2.Fuyu-8B采用了一种纯解码器Transformer架构,不使用图像编码器,支持任意图像分辨率,表现在多项任务中优于其他大型模型。
    站长网2023-10-19 15:01:42
    0000
  • Adept AI开源8亿参数语言模型Persimmon-8B

    要点:1、开源了Persimmon-8B,这是目前参数量少于10亿的最强大的完全免许可语言模型2、该模型具有16K的上下文长度,超过了LLaMA2的4倍和GPT-3的8倍3、提供了灵活快速的推理代码,在一块A100GPU上可以每秒生成56个token
    站长网2023-09-13 09:55:13
    0000