深度求索开源DeepSeek LLM 67B大模型无需申请免费商用

站长网2023-11-30 09:53:133阅

深度求索发布了一个67B 的大模型，名为 DeepSeek LLM67B。这个模型完全开源，可以通过访问 chat.deepseek.com 来使用。

DeepSeek LLM67B 在公开评测榜单上表现良好，特别是在推理、数学和编程能力方面。DeepSeek 还开源了7B 和67B 的两种规模的模型，并提供了9个训练中途的模型 checkpoints 的下载。

DeepSeek LLM67B 在数学和指令跟随的测试中表现出色，并在 LeetCode 周赛中遥遥领先。最后，在开放域推理的测试中，DeepSeek LLM67B 展现出了较好的表现。

Hugging Face 首页:https://huggingface.co/deepseek-ai

GitHub 仓库:https://github.com/deepseek-ai/DeepSeek-LLM

深度求索开源DeepSeekLLM67B大模型无需申请免费商用

0003

评论列表

共(0)条

相关推荐

站长资讯
扎克伯格预测：明年将迎来人工智能名人与粉丝互动时代
据报道，Meta首席执行官马克·扎克伯格表示，人工智能名人与粉丝互动可能在明年成为现实。在接受Verge采访时，扎克伯格表示，人们对人工智能版名人有着巨大的需求。举凯莉·詹纳（KylieJenner）为例，扎克伯格强调了粉丝们与名人互动的渴望，但也指出了品牌安全的考虑，暗示这一趋势可能会推迟到明年才成为主流。
站长网2023-09-28 14:30:46
0000
站长资讯
谷歌霸权瓦解？从霸主到备受质疑：二十年塑造网络潮流的谷歌搜索陷入迷局
【新智元导读】二十多年来，谷歌搜索无形地决定了在线内容的潮起潮落。但到了今天，它的文化意义、地位以及影响力首次受到了质疑。谷歌上搜索的第一件事是前斯坦福大学校长GerhardCasper的名字。1998年，谷歌的两位创始人LarryPage和SergeyBrin为计算机科学家JohnHennessy演示了谷歌。他们在AltaVista和Google上搜索了Casper的名字。
站长网2023-09-03 09:08:46
0002
站长资讯
网红撑起劳斯莱斯销量半边天？
1月8日，劳斯莱斯宣布，2023年全球总共交付6032辆汽车，创下历史最高纪录。其中，美国仍然是公司最大市场，其次为大中华区;在欧洲，英国是最大单一市场;并且中东和亚太地区销量都创下纪录。笔者把这则消息发给身边朋友，没想到很多人第一反应是“怎么这么少?”。平时刷短视频、各种社交平台上，动不动就能刷到网红各种“提库里南”的视频和帖子。
站长网2024-01-10 14:20:35
0000
站长资讯
为何地球可以不停的自转46亿年，它的自转动力到底来自哪里呢？
在地球的我们每天都会经历着白昼和黑夜，这是因为地球每时每刻都在自转，并且是绕自转轴自西向东的转动。在地球赤道上的自转的速度大约为465米/秒，自转一圈需要23小时56分，如今根据科学家的研究推测，我们的地球大约诞生于46亿年前，而它从形成的那一刻开始就一直不停的在转动，那么很多人可能有所疑问，地球为什么可以不停是自转长达46亿年之久，它的自转的动力究竟来自哪里呢。
站长网2023-05-24 00:10:37
0000
站长资讯
苹果AI/ML团队开发多模态大模型Ferret 成功突破谷歌人机验证码难题
要点:1.苹果AI/ML团队与哥伦比亚大学研究团队合作开发的多模态大模型“雪貂”（Ferret）能够在图像中准确找到交通信号灯，比GPT-4V表现更出色，提高了大模型在“看说答”任务中的精确度。2.Ferret的关键创新在于将引用（referring）和定位(grounding)两方面的空间理解能力紧密结合，使模型能够同时理解给定区域的语义和找到对应目标。
站长网2023-10-12 14:58:53
0000