深度求索开源多模态大模型DeepSeek-VL系列
站长网2024-03-13 09:45:021阅
3月11日,DeepSeek-AI开源了全新多模态大模型DeepSeek-VL系列,分为1.3b 和7b 两种规模,共有4个版本。它具有融合语言和视觉能力,可以在不损失语言理解能力的情况下处理多模态任务,识别高分辨率图像中的细小物体。这个模型结合了视觉和语言信息,通过预训练微调的方法,在种领域中展现出很好的性能。
在数据构建阶段,DeepSeek VL 模型使用了多种不同领域的数据集,包括公开数据集如 ShareGPT4V、LAION-GPTV、LVIS-Instruct4V 等,以及纯文本数据集如 DeepSeek-LLM。
模型训练过程分为三个关键阶段:视觉 - 语言适配器训练、联合视觉 - 语言预训练和监督微调,以确保模型在不同任务和领域中的准确性和鲁棒性。
据悉,深度求索(DeepSeek),成立于2023年,专注于研究世界领先的通用人工智能底层模型与技术,挑战人工智能前沿性难题。
包括:
deepseek-vl-1.3b-chat:
https://modelscope.cn/models/deepseek-ai/deepseek-vl-1.3b-chat
deepseek-vl-7b-chat:
https://modelscope.cn/models/deepseek-ai/deepseek-vl-7b-chat
deepseek-vl-7b-base:
https://modelscope.cn/models/deepseek-ai/deepseek-vl-7b-base
deepseek-vl-1.3b-base:
https://modelscope.cn/models/deepseek-ai/deepseek-vl-1.3b-base
0001
评论列表
共(0)条相关推荐
微软和西门子将在工业工作流程中部署生成式AI
西门子正在与微软合作,使用生成式人工智能工具来改进其工业工作流程中。微软的生成人工智能工具库包括人工智能聊天和代码生成,将用来加速和简化西门子的设计、工程、制造和运营流程。两家公司计划使用人工智能来加强西门子团队之间的沟通,加快代码编写速度,以帮助工程师更快地完成工作。这有望提高西门子员工的效率和生产力。站长网2023-04-14 15:17:440000马斯克:推特很快将提供黑暗模式 可能会成为默认模式
马斯克对亮色模式和暗色模式的争论发表了自己的看法。今天凌晨,马斯克发推说“这个平台很快只会有‘暗色模式’。它在各方面都更好。”这立刻引起了很多用户可能预料到的各种反应。许多人要求推特保留一个亮色模式的选项,即使它将暗色模式作为X新设计标识的默认设置。站长网2023-07-28 10:50:390000这个五一档,韩寒赢麻了
如果不是这个五一档,大概很多人已经想不起韩寒了。他在大众脑海中的形象,被定格在2022年春节档《四海》的见面会“四海歌会”上。那时,他穿着毛衣,把头发剪成圆寸,戴着黑框眼镜,站在舞台最左侧,卖力地和曾经合作过的演员们合唱,为即将在春节档上映的《四海》宣传。站长网2023-05-07 09:25:440002AI工程师薪酬远超其他同行!入门级平均超170万元
快科技5月29日消息,根据Levels.fyi发布的2024年第一季度AI工程师薪酬调查数据,人工智能(AI)工程师的薪酬远超非AI软件工程师。调查结果表明,不同级别的AI工程师薪酬普遍高于非AI工程师。具体来看,入门级AI工程师的平均薪酬为239000美元,约合人民币173万元,比非AI工程师的平均薪酬高出8.57%。站长网2024-05-29 18:18:120000B站UP主开了一家全员AI的炒股公司 结果刚进A股就翻车了
B站UP主“林亦LYi”近期引起了广泛关注,因其创办了一家全员AI的炒股公司,为其团队提供一笔资金用于真实炒股实验。这个AI团队的构成颇具特色,引发了关于其真实水平的猜测。这个炒股团队由多个AI成员组成,包括AI领导、AI谏官、AI巴菲特、AI程序员、代码执行机器人、新闻摘抄员和股价查询员。每个成员都有明确的职责,从领导制定计划到程序员编写代码,再到机器人执行任务,团队协作完成股票交易的全过程。站长网2024-01-16 15:25:560000