千亿开胃菜 中国电信开源12B星辰大模型:性能提升30%
站长网2024-04-18 17:15:140阅
快科技4月17日消息,中国电信近期宣布开源其12B参数规模的巨型AI模型TeleChat-12B,此举标志着国内大模型技术发展的又一重要进展。
与1月份发布的7B参数版本相比,TeleChat-12B在内容理解、性能表现和应用场景等方面实现了约30%的整体提升,特别是在多轮对话推理和安全相关领域的能力上,提高超过了40%。
此外,有消息称,中国电信计划在今年内推出参数规模达到千亿级的超大型AI模型。
为了确保模型的高效能,TeleChat-12B将训练数据量从7B版本的1.5TB增加至3TB,显著提高了数据的质量和模型的性能。
TeleChat-12B还利用了电信用户的实际交互数据,对奖励模型和强化学习模型进行了优化,有效提升了模型在问答场景中的表现。
目前,星辰大模型已经被应用于多种实际场景,包括文本创作、编程、网络故障分析和业务经营分析等。以文本创作为例,该模型平均生成的文本长度超过1500字,且有效采纳率高达85.7%。
在对外服务的企事业单位客户中,星辰大模型支持企业经营分析、政务咨询、民生诉求响应等多样化场景,能够涵盖95%的实际业务需求,并且在多轮对话理解中的准确率达到了90%。
除了在传统行业中的应用,星辰大模型也在积极探索更多前沿领域的应用,例如在无人机智能编排和轻量化建设方面取得了新的进展。
0000
评论列表
共(0)条相关推荐
不就是开个淘宝店嘛?店搭子、AI都来了
1前段时间有个非常魔幻的新闻,说三个人想创业,合伙开了个汉堡店,结果日营业额才79块钱。大家仔细感受一下这个数字。如果说一天只有几百块营业额,可以叫做生意不好。但只有79块的话,这已经不是好不好做了,楼下支个摊卖淀粉肠都比这个强了。但仔细看了报道,事情顿时又合理了。这三个人的履历一个比一个离谱,一个之前是做商场销售的,另一个是开饰品店的。还剩下最后一个,你以为能靠点谱了吧?站长网2023-05-01 10:19:340000雷军兑现承诺直播时打开礼物功能:网友疯狂刷屏送礼
快科技5月18日消息,早上8:30,雷军如约再次进行了线上直播,此次他亲自驾驶一台小米SU7Pro,由上海世纪大道附近开往杭州,途中展示了小米城市领航NOA功能,此次也是小米SU7Pro首次公开亮相。值得一提的是,雷军在上次直播时并没有打开礼物功能、也没有进行带货,被当时的网友吐槽”说浪费了泼天的流量”。站长网2024-05-18 10:08:170000面部图像修复突破性AI方法Dual-Pivot Tuning 实现人脸模糊变高清
**划重点:**1.🌐图像修复是一个复杂的挑战,研究人员提出了名为“Dual-PivotTuning”的个性化图像修复方法。2.🤳该方法使用有限的高质量个体图像集,以保持图像对个体身份的高保真性。3.📊实验证明,“Dual-PivotTuning”技术在盲目和少数样本的个性化面部图像修复方面优于其他最先进的方法。站长网2024-01-04 09:59:350000一个UP主,让15年前的游戏再次伟大
6月1日,B站UP主「潜艇伟伟迷」发了一个视频,标题是「感谢大家对植物大战僵尸杂交版的支持!」。截止到今天我们这篇内容发布,5天时间,播放量超过900万,是「潜艇伟伟迷」目前播放量最高的一条视频。目前,「潜艇伟伟迷」在B站有接近250万粉丝,这250万的粉丝当中,根据飞瓜的数据监测,近30天的涨粉数量是167万。站长网2024-06-06 21:01:2300002080 Ti就能跑70B大模型,上交大新框架让LLM推理增速11倍
原本需要一张16万元的80GA100干的活,现在只需要一张不到2万元的24G4090就够了!上海交大IPADS实验室推出的开源推理框架PowerInfer,让大模型推理速度加快了11倍。而且不用量化,就用FP16精度,也能让40B模型在个人电脑上运行;如果加入量化,2080Ti也能流畅运行70B模型。0000