股价飙升!商汤大模型挑战GPT4
站长网2024-04-25 20:01:570阅
4月24日,商汤集团在港交所暂停交易前股价上涨31.15%。商汤集团表示,其大模型日日新5.0发布会受到市场极大关注,公司将进一步刊发相关公告。在“2024年商汤技术交流日”上,商汤发布了其最新的大模型——SenseNova5.0,旨在追赶GPT-4,这反映了中国大模型行业的集体目标。

商汤通过遵循大语言模型的尺度定律(Scaling laws),在不到三个月的时间内,从SenseNova4.0超越GPT-3.5到SenseNova5.0全面对标GPT-4Turbo。尺度定律强调了模型性能与模型大小、数据量和计算量之间的幂律关系。商汤利用科学试验和数学公式预测下一代大模型的性能,避免了盲目尝试。
商汤科技董事长兼CEO徐立提出,通过小规模实验可以预测和验证模型架构和数据配方的有效性,并确保这些结论在更大规模上得到保持。SenseNova5.0采用了超过10万亿tokens的中英文预训练数据,并通过逻辑合成数据提升模型的推理、数学和编程能力。
商汤还推出了1.8B参数的SenseChat-Lite,它在主流评测中超过了所有开源2B的同级别模型。此外,商汤发布了针对端侧业务的SDK,以及企业级大模型一体机,支持金融、代码、医疗、政务等行业的数据私有化部署需求。
面向软件开发,商汤发布了小浣熊代码大模型一体机轻量版,它在HumanEval的测试中表现超过了GPT-4,支持多种编程语言和上下文,旨在帮助企业开发人员更高效地编写、理解和维护代码。
商汤在技术交流日上强调了合作伙伴的重要性,并展示了与华为昇腾等公司的合作成果。商汤的AI基础设施SenseCore和AIDC算力基座为其提供了强大的支持。商汤的生成式AI业务在2023年取得了显著增长,占总收入的35%。
0000
评论列表
共(0)条相关推荐
印度 AI 芯片初创公司 Ceremorphic 进军药物研发
划重点:🔹印度初创公司Ceremorphic开设生命科学部门,利用其芯片技术平台加速药物研发过程。🔹Ceremorphic的生命科学部门将使用新技术平台BioCompDiscoverX,其中包括部分基于模拟硅的异构加速器,用于模拟人类细胞和组织,以提高药物研发效率。🔹Ceremorphic的目标是从一开始就找到更好的候选分子,从而更快、更便宜地将新药带到市场。站长网2023-11-20 17:53:300000微软与美国劳工联合会 AFL-CIO 达成中立协议,共同探索人工智能的未来
站长之家(ChinaZ.com)12月12日消息:微软公司和美国劳工联合会(AFL-CIO)于当地时间周一宣布,他们达成了一项协议,这家美国软件巨头将在工会鼓励工人成为成员的努力中保持中立。此外,双方还将共同研究人工智能的未来,这是商业和劳工界在应对该技术影响时,首次就AI和劳动力的未来建立的合作伙伴关系。0000聊天机器人 ChatGPT 更善于模仿同理心 但并不适合作为搜索引擎
据Bloomberg消息,OpenAI开发的聊天机器人ChatGPT不仅仅是一个信息工具,它有特别出色的表达同理心的能力,使它成为情感伙伴而不仅仅是提供事实的工具。站长网2023-05-12 20:31:370002TrendForce:新型 AI 加速芯片助力 HBM3 和 HBM3e 主导 2024 年市场
站长之家(ChinaZ.com)8月2日消息:据市场研究公司TrendForce最新报告指出,2023年HBM(高带宽存储器)市场的主导产品是HBM2e,该产品由英伟达A100/A800、AMDMI200以及大多数云服务提供商的自主开发的加速器芯片所采用。站长网2023-08-02 17:35:020000医疗大模型Med-PaLM M:可灵活地编码和解释生物医学数据
由谷歌旗下多家研究所组成的专家团队近日发布论文,公布了一款名为Med-PaLMM的多模态模型。Med-PaLMM是一个大型多模态生成模型,可以灵活地编码和解释生物医学数据。Med-PaLMM相比于现有模型在多项任务上表现竞争力,甚至有些任务表现更好。论文地址:https://arxiv.org/abs/2307.14334站长网2023-07-31 11:50:460000