首页站长资讯商汤版ChatGPT「商量」来了！开放API，基于千亿参数大模型，体验实录在此

商汤版ChatGPT「商量」来了！开放API，基于千亿参数大模型，体验实录在此

站长网2023-04-11 10:55:371阅

国产ChatGPT之战，已然是大步迈进白热化阶段。

就在刚刚，商汤正式发布自研类ChatGPT产品，名曰商量（SenseChat）。

单单是这个名字，便值得说道一番。

商量的“商”，不仅体现了它是商汤自家“商字辈儿”的产品;从整体来看，更是具有商讨、交换意见的味道。

毕竟我们在使用类ChatGPT产品过程中，恰巧就是一种人机协同的过程:不应是一味的问与答，而是通过引导等方式让输出结果趋于理想。

在商量的背后，所依托的是商汤自研的千亿参数自然语言处理模型。

而在此模型的背后，则是商汤最新推出的日日新（SenseNova）大模型体系。

也正是因为这种的能力，商汤的发布还不同于此前国产类ChatGPT玩家，它一口气还发布了:

秒画:AI内容创作社区平台。

如影:AI数字人视频生成平台。

琼宇、格物:3D内容生成平台。

更重要的一点是，根据商汤CEO徐立在现场的描述，上述这些AIGC产品所要发力之处，将是诸如医疗、短视频、教育、营销以及开发等产业领域。

但不得不说，这一波科技之战，着实是愈演愈烈了。

“商量”的体验实录

那么商汤的AIGC产品，效果又是如何?

我们在前方现场也体验了一下。

先来看下商量这款产品，是否真的能做到商量。

多轮对话能力展示

既要多轮对话，又要人机共创，那么和它商量着创作一个故事，便是很好例子:

我们来一起创作儿童故事吧。规则是我先说一句，你再说一句，交替进行。直到我说故事编完了就结束。你明白了么?

在我们下达指示之后，“商量”表示了理解，然后就开始了“你一句我一句”人机共创故事的之旅:

人类:小花是一只小猫咪，他很喜欢钓鱼。

商量:小花在河边钓鱼，他钓到了一条大鱼。

人类:大鱼对小花说，请你放我回去吧，我家里还有小鱼在等着我呢。

商量:小花心地善良，他同意了大鱼的请求，把大鱼放回了河里。大鱼感激地游走了，小花也继续享受着的钓鱼的乐趣。

从这个过程中不难看出，“商量”是可以理解用户的语义，了解故事中的角色和关系，并且能够get用户的思路，基于此以多轮对话形式来完成故事的创作。

（要是让小朋友们跟“商量”一起创作故事，怕是能玩上一整天吧。）

不仅如此，在体验过程中，我们还发现“商量”是具备一定共情能力的。

例如当我们处于迷茫之际，可以向它提问:

如何提高自我认识，更好地了解自己?

此时的“商量”仿佛可以抓住问题背后人类内心真正的需求，回答中的“学会爱自己”、“学会自我肯定和鼓励”，显得格外暖心。

当然，多轮对话仅仅是对话机器人能力展示的一隅。

接下来，我们就要拿网友们经常调侃AI的诸多问题，来开启更高难度的挑战了!

只认事实，不认“老婆说的都对”

当然，创作能力是聊天机器人能力的一面，但对于事实的尊重也是非常重要的一点。

对于此前被网友们玩坏的“老婆说的都对”，“商量”又会如何应对?

嗯，老婆在事实面前是真的不好使了。

我们再来一个更天马行空的胡诌:

请告诉我以下陈述是否包含时代错误:在盟军轰炸硫磺岛海滩期间，拉尔夫大声地对着自己的iPhone说话。

“商量”面对这么一句胡诌，直接指出了iPhone与二战的时代背景不符，可见其不仅能理解句子的意思，还能通过尝试判断句子的合理性。

那么对于非常绕的逻辑问题，“商量”是否也能轻松应对?

请听题目:

假设False与True是False，则True与not False是?

讲真，人类都得思忖半天的“绕弯问题”，“商量”不仅能够秒出结果，还能把推理过程一并给出。

超长文本也能hold住

正如我们刚才提到的，“商量”是一个To B的产品，那么它定然需要解决的问题不是“片段性”的。

为此，商汤在现场还演示了基于“商量”背后的大模型，开发了帮助用户进行新知识获取和理解的助手工具，是可以轻松hold住超长文本的那种。

例如把一本《专利法》投喂给它，我们就可以向它咨询很多专业性的问题了:

什么样的东西可以申请专利?

从结果上来看，这个工具并不是直接从《专利法》中copy对应的结果，而是模型理解了问题之后，生成并总结了答案。

基于这样的能力，以后我们在工作上的效率提高程度，可见一斑。

不仅如此，刚才我们投喂的《专利法》是2020年的版本，而今年国家知识产权局就专利申请是提出过新的要求的。

从我们提问“今年规定有没有新的变化”的回答中不难看出，模型确实融合了最新的资讯，并给出了合理的答案。

再如同样是基于大语言模型，商汤面向开发者所打造的AI代码助手，可以提供代码补全、注释生成代码、测试代码生成、代码翻译、代码修正、代码重构、复杂度分析等功能。

据了解，AI代码助手可以同时支持中英文及多种编程语言，并且可以快速适应开发者的个性化编码风格。

从根据商汤内部测试的结果来看，在使用“AI代码助手”后，代码编写效率可以提升62%，Humaneval测试集一次通过率可以达到40.2%。

马斯克中国游记，2秒钟就能搞定

除了对话机器人之外，商汤AI作画产品“秒画”也是本次发布的一大亮点。

话不多说，直接上效果。

我们同样是先来看看被网友们玩儿坏了的一个Prompt:

中国80年代，马斯克在河南的农村，穿着当时年代的中国服装。

嗯，是有那个味道了。

而且更为关键的是，生成512K图片仅需2秒钟!

不仅如此，商汤在现场演示的过程中，还展示了逼真效果版的港风美女。

同样是2秒出图，引得现场观众“哇”声一片:

那么除了这种趣味性的以文生图，“秒画”的作品是否能够达到在产业中的应用水平?

我们继续试验:

明亮的场面，鸟瞰图，中国古代城市，水晶，魔幻，幻想，华丽的光作用，透明度，镜面反射，华丽的光，错综复杂的细节，精细的纹理，超现实，单反摄影，广角镜头，照片，现实，锋利的焦点，超锋利。

不得不说，如此恢宏壮丽的景象，是把想象拉进现实的那种了。

若是想生成与太空探索主题相关的高清大海报，这个也可以有，只需把这句话投喂进去:

一艘闪闪发光的飞船绕着一颗巨大的气态巨行星的月球旋转，在天空中盘旋着云，飞船在月球前气态巨行星前，美丽的科幻艺术，超现实的白日梦。

不难看出，“秒画”是经得住考验的那种AI了。

除了以文生图之外，我们再来看下AI数字人生成平台。

据了解，商汤的“如影”仅需要5分钟真人视频素材，就可以生成出声音及动作自然、口型准确、多语种精通的数字人分身。

再如“琼宇”和“格物”，基于神经辐射场技术（NeRF），可以高效低成本生成大规模三维场景和精细化的物件，为元宇宙、虚实融合应用打开新的想象空间。

由此可见，商汤的AIGC能力已然是做到了全面覆盖，并且水平也是肉眼可见的达到了可以“上岗”的水平。

那么接下来的一个问题是:

怎么炼成的?

背后的日日新大模型，便是炼成“商量”、“秒画”等一众AIGC产品的杀手锏。

日日新，顾名思义，是指模型的迭代速度及处理问题的能力上可以日日更新，不断解锁AGI更多可能。

（取自《礼记·大学》中汤之盘铭曰“苟日新、日日新、又日新”）

从现场展现的能力来看，日日新大模型能够提供的能力，主要集中在了自然语言处理、图片生成、自动化数据标注、自定义模型训练等。

但日日新大模型并非是趁着这一波AIGC大热潮，一蹴而就出现的那种。

其实早在五年前，商汤便已经在大模型领域着手研发。

并且在2019年，商汤便使用上千张GPU进行单任务训练，推出了10亿参数规模的视觉模型，并实现了当时业界最好的算法效果。

后来在2021年到2022年期间，商汤训练并开源了30亿参数的多模态大模型——书生。

就目前来看，商汤已经成功研发了320亿参数量的全球最大的通用视觉模型;并且已经打造了CV、NLP和AIGC相关大模型。

因此，不难看出商汤此次发布的超大模型体系，其实是早有所准备，通过五年来的各项“小作业”，融会贯通并提交了一项“大作业”。

值得一提的是，在此次发布会中，商汤表示“日日新”将提供多种灵活的API接口和服务，包括图片生成，自然语言生成，视觉感知通用任务与标注服务!

……

但有一说一，多模态和决策智能大模型，并非是商汤通往通用人工智能（AGI）的唯一杀手锏。

大模型时代，大算力更为重要

没错，商汤自己的超强算力，正是另一项更为关键的因素。

它便是于2022年1月交付使用，首付56亿元，一举成为亚洲最大的AI超算中心之一的人工智能计算中心（AIDC）。

一年之前，商汤AIDC的总算力便已经是3740Petaflops，如此算力之下，已经可以完整训练万亿参数规模的大模型。

时隔一年，现如今，这个算力数字已然是翻了个小翻，达到了5000Petaflops!

它可以以最大4000卡规模集群进行单任务训练，并可做到七天以上不间断的稳定训练

但了解商汤的朋友都知道，这个AIDC还仅是商汤AI大装置SenseCore的一部分。

除了AIDC这个算力层之外，加之数据层和模型层两大维度，便构成了“三位一体”的AI大装置。

因此，综合来看，商汤在通往AGI道路上的范式，便是“大模型大算力”。

而如此布局的背后，在今天的发布会中，商汤对此的逻辑思考也逐步浮出水面，AGI时代之下，数据、算法和算力三要素有了新的需求:

计算量（GPU数量 x 运行时间 x 并行效率）=模型参数量 x 处理数据量。

怎么理解?

模型参数量要足够多，才能实现AI智慧的涌现，而这也带来了对算力的剧增，需要更高的并行效率，才能有效支持大参数模型训练。

数据方面，高质量自然语言数据逐渐稀缺，而视觉数据相较自然语言在数量、质量、容纳信息等方面有多种优势，能够使得AI更好地理解世界。

由此，就不难理解商汤如此布局的原因了。

……

总而言之，有大数据、有大模型、有大算力，商汤在国产AIGC的亮相，一点也不意外。

是值得期待一波了。

—完—

商汤版ChatGPT商量来了 开放API基于千亿参数大模型体验实录在此

0001

评论列表

共(0)条

相关推荐

站长资讯
风投又一大窟窿：老虎消失1500亿
这次轮到老虎。本周，彭博社援引知情人士报道，老虎环球基金（TigerGlobalManagement）2022年将旗下所有风险投资基金对非上市企业的投资价值减记了约33%，导致其创业公司投资组合的价值减少了230亿美元（约合人民币超1500亿元），酿造了其风投史上糟糕一页。
站长网2023-03-19 10:39:51
0000
站长资讯
专家研究称ChatGPT会影响用户道德判断不要低估它的影响
最近，GhatGPT是备受关注的热门话题。无论是普通人还是商业领袖，都对它表现出了浓厚的兴趣。然而，一些人也一直在反对这项技术。据悉，相关学术研究团队进行了一项实验，结果发现人工智能对话机器人ChatGPT的声明可能会影响人类对道德困境的反应。该研究表明，用户可能低估了ChatGPT对他们道德判断的影响程度。
站长网2023-04-10 21:26:15
0000
站长资讯
单篇文章收入20W，公众号付费阅读还“香”吗？
3月28日，2023微信公开课·微信之约大会上公布，视频号将推出创作分成计划和付费订阅。所谓创作分成计划，就是在原创视频评论区接入广告系统获得收益。这与公众号的流量主功能类似，公众号是在文章的中间或者底部插入平台系统分发的广告，而视频号则是挂载在评论区。付费订阅功能，也就是订阅专区，提供付费订阅服务。创作者可以设立付费内容专区，用户通过缴纳月费成为会员。
站长网2023-04-06 21:31:25
0002
站长资讯
美国警方使用面部识别公司Clearview AI进行近100万次搜索
面部识别公司ClearviewAI透露，美国警方已经使用其技术进行了近一百万次搜索。ClearviewAI的技术允许执法部门上传嫌疑人的面部照片，并在其收集的数十亿张图像的数据库中找到匹配对象。ClearviewAI首席执行官HoanTon-That在接受BBC采访时透露，该公司已经从Facebook等平台上抓取了300亿张图片。而这些图像是未经用户许可拍摄的。
站长网2023-03-29 17:51:28
0000
站长资讯
超级App微信，迎来令人胆寒的恐怖时刻
3月28日晚，春雨浸润下的广州，微信公开课PRO“微信之约”如期而至。微信公开课已经成为业内人士、创业者和互联网从业者关注的焦点，本次公开课中，视频号、微信支付、小程序、企业微信以及搜一搜分别根据产品当下动态与未来规划，对微信生态的融合建设、创作者商业价值、企业数字化转型等议题进行了深度的分享，也为去年的执行效果交付了答卷。
站长网2023-03-29 09:38:03
0000