深度求索开源DeepSeek LLM 67B大模型 无需申请免费商用
站长网2023-11-30 09:53:133阅
深度求索发布了一个67B 的大模型,名为 DeepSeek LLM67B。这个模型完全开源,可以通过访问 chat.deepseek.com 来使用。

DeepSeek LLM67B 在公开评测榜单上表现良好,特别是在推理、数学和编程能力方面。DeepSeek 还开源了7B 和67B 的两种规模的模型,并提供了9个训练中途的模型 checkpoints 的下载。
DeepSeek LLM67B 在数学和指令跟随的测试中表现出色,并在 LeetCode 周赛中遥遥领先。最后,在开放域推理的测试中,DeepSeek LLM67B 展现出了较好的表现。
Hugging Face 首页:https://huggingface.co/deepseek-ai
GitHub 仓库:https://github.com/deepseek-ai/DeepSeek-LLM
0003
评论列表
共(0)条相关推荐
扎克伯格预测:明年将迎来人工智能名人与粉丝互动时代
据报道,Meta首席执行官马克·扎克伯格表示,人工智能名人与粉丝互动可能在明年成为现实。在接受Verge采访时,扎克伯格表示,人们对人工智能版名人有着巨大的需求。举凯莉·詹纳(KylieJenner)为例,扎克伯格强调了粉丝们与名人互动的渴望,但也指出了品牌安全的考虑,暗示这一趋势可能会推迟到明年才成为主流。站长网2023-09-28 14:30:460000谷歌霸权瓦解?从霸主到备受质疑:二十年塑造网络潮流的谷歌搜索陷入迷局
【新智元导读】二十多年来,谷歌搜索无形地决定了在线内容的潮起潮落。但到了今天,它的文化意义、地位以及影响力首次受到了质疑。谷歌上搜索的第一件事是前斯坦福大学校长GerhardCasper的名字。1998年,谷歌的两位创始人LarryPage和SergeyBrin为计算机科学家JohnHennessy演示了谷歌。他们在AltaVista和Google上搜索了Casper的名字。站长网2023-09-03 09:08:460002网红撑起劳斯莱斯销量半边天?
1月8日,劳斯莱斯宣布,2023年全球总共交付6032辆汽车,创下历史最高纪录。其中,美国仍然是公司最大市场,其次为大中华区;在欧洲,英国是最大单一市场;并且中东和亚太地区销量都创下纪录。笔者把这则消息发给身边朋友,没想到很多人第一反应是“怎么这么少?”。平时刷短视频、各种社交平台上,动不动就能刷到网红各种“提库里南”的视频和帖子。站长网2024-01-10 14:20:350000为何地球可以不停的自转46亿年,它的自转动力到底来自哪里呢?
在地球的我们每天都会经历着白昼和黑夜,这是因为地球每时每刻都在自转,并且是绕自转轴自西向东的转动。在地球赤道上的自转的速度大约为465米/秒,自转一圈需要23小时56分,如今根据科学家的研究推测,我们的地球大约诞生于46亿年前,而它从形成的那一刻开始就一直不停的在转动,那么很多人可能有所疑问,地球为什么可以不停是自转长达46亿年之久,它的自转的动力究竟来自哪里呢。站长网2023-05-24 00:10:370000苹果AI/ML团队开发多模态大模型Ferret 成功突破谷歌人机验证码难题
要点:1.苹果AI/ML团队与哥伦比亚大学研究团队合作开发的多模态大模型“雪貂”(Ferret)能够在图像中准确找到交通信号灯,比GPT-4V表现更出色,提高了大模型在“看说答”任务中的精确度。2.Ferret的关键创新在于将引用(referring)和定位(grounding)两方面的空间理解能力紧密结合,使模型能够同时理解给定区域的语义和找到对应目标。站长网2023-10-12 14:58:530000