股价飙升!商汤大模型挑战GPT4
站长网2024-04-25 20:01:570阅
4月24日,商汤集团在港交所暂停交易前股价上涨31.15%。商汤集团表示,其大模型日日新5.0发布会受到市场极大关注,公司将进一步刊发相关公告。在“2024年商汤技术交流日”上,商汤发布了其最新的大模型——SenseNova5.0,旨在追赶GPT-4,这反映了中国大模型行业的集体目标。
商汤通过遵循大语言模型的尺度定律(Scaling laws),在不到三个月的时间内,从SenseNova4.0超越GPT-3.5到SenseNova5.0全面对标GPT-4Turbo。尺度定律强调了模型性能与模型大小、数据量和计算量之间的幂律关系。商汤利用科学试验和数学公式预测下一代大模型的性能,避免了盲目尝试。
商汤科技董事长兼CEO徐立提出,通过小规模实验可以预测和验证模型架构和数据配方的有效性,并确保这些结论在更大规模上得到保持。SenseNova5.0采用了超过10万亿tokens的中英文预训练数据,并通过逻辑合成数据提升模型的推理、数学和编程能力。
商汤还推出了1.8B参数的SenseChat-Lite,它在主流评测中超过了所有开源2B的同级别模型。此外,商汤发布了针对端侧业务的SDK,以及企业级大模型一体机,支持金融、代码、医疗、政务等行业的数据私有化部署需求。
面向软件开发,商汤发布了小浣熊代码大模型一体机轻量版,它在HumanEval的测试中表现超过了GPT-4,支持多种编程语言和上下文,旨在帮助企业开发人员更高效地编写、理解和维护代码。
商汤在技术交流日上强调了合作伙伴的重要性,并展示了与华为昇腾等公司的合作成果。商汤的AI基础设施SenseCore和AIDC算力基座为其提供了强大的支持。商汤的生成式AI业务在2023年取得了显著增长,占总收入的35%。
0000
评论列表
共(0)条相关推荐
董明珠:给躺平的人合适的岗位 他们可能会逐渐改变
近日,格力电器董事长董明珠在央视对话节目中分享了她对“躺平”员工的看法。她强调,为躺平的员工提供合适的岗位并发挥他们的长处至关重要。在对话中,主持人陈伟鸿提出了一个关于年轻员工躺平现象的问题,询问董明珠会给予这些年轻人怎样的建议。董明珠回应称:“我认为对于躺平的员工,应该为他们提供一个合适的岗位。在这个环境中,他们受到的文化影响可能会使他们逐渐改变。”站长网2024-03-05 11:48:520000调查:63%的人担心使用生成式AI导致侵版问题
本文要点:1.63%的人担心使用生成式人工智能时侵犯版权问题。2.41%的人担心这些工具存在固有偏见。3.83%的人对需要跟上的工具数量感到不知所措,92%的人不相信科技公司能够进行自我监管。随着越来越多的机构在工作中使用生成式人工智能,人们对这些工具的信任程度产生了担忧。站长网2023-08-03 17:52:150000AI加持的神级配音工具TTSMaker 支持50多种语言300种语音风格
TTSMaker是一款免费的文本转语音工具,它不仅提供了强大的语音合成服务,而且支持50多种语言,包括中文、英语、日语、韩语、法语、德语、西班牙语、阿拉伯语等。这款工具采用了先进的AI神经网络推理模型,能够在短时间内将文本转换为自然流畅的语音。站长网2023-11-29 17:01:280002一场直播卖1亿,复购率90%,抖音、支付宝们“抢”生意
“今天是2023年收官之战,也是最后一次年货大扫购,我们为大家带来了近百款爆款酒水,拍到就是赚到。”2月4日晚,淘宝主播“阿卓酒馆”将直播间搬到超市,背后放着一排非常吸睛的茅台,以及各种眼花缭乱的酒品。在中国年文化中,酒是不可缺少的年货之一。春节酒水消费需求大,节前就已经在直播间中爆发。一时间,酒水赛道挤满了“平台掘金者”,抖音、快手、支付宝纷纷下场“抢”生意。站长网2024-02-17 10:03:220000MotionDirector:AI定制视频新方法
要点:1.该研究提出了MotionDirector,一种基于人工智能的方法,用于自定义视频的运动和外观,通过训练模型学习运动和外观,以生成特定运动的视频。2.MotionDirector采用双通道架构,分别学习单一或多个参考视频中的外观和运动,实现外观和运动的解耦,并能够合并不同源视频的外观和运动。站长网2023-10-18 21:22:190000