GPT-4创造力竟全面碾压人类,最新创造力测试GPT4排名前1%
创造力稀释
最新研究发现,GPT-4的创造力全方位持平或碾压人类。
最近,一项有关GPT-4的创造力思维测试火了。
来自蒙大拿大学和UM Western大学的研究团队发现,GPT-4在Torrance创造性思维测试(TTCT)中的得分直接排在了前1%。
不管是流畅性、灵活性,还是原创性,要不和人类势均力敌,要不直接碾压人类。
这项研究在南俄勒冈大学的创意会议上发表(Conference on Creativity)。
包括蒙大拿大学和西澳大学教授在内的一个研究小组发现:
OpenAI的GPT-4在托伦斯创造性思维测试(TTCT)中的得分在前1%,在流畅性、灵活性和原创性等创造性能力方面与人类相匹配或超过了人类。
这些发现在南俄勒冈大学的创意会议上发表。
GPT-4「头脑风暴」
主导这项研究的Guzik博士表示,这项研究对初创企业的建立和小企业的发展会有巨大影响,它将成为推动整体经济活动增长的重要力量。
Guzik进一步阐释,GPT-4所表现出的非凡创造力标志着AI驱动的头脑风暴和解决方案开发的全新阶段。
换句话说,以往初创企业和小企业基本都面临资源限制的典型问题,这限制了他们雇佣大型团队,对市场进行全面研究的能力。
而这一切,将会被AI的创造力扭转。
该研究团队的第一次会面,是在2013年Boise州立大学举办的创新和创造力研讨会上。
当时,Gilde博士和Guzik博士参加了由Byrge举办的主题研讨会。三人发现,他们都对和创造力有关的东西感兴趣。
他们共同认为,AI技术会对商业教育和商业发展有重大辅助作用。随着他们对AI的探索不断加深,更印证了他们的想法。
「尤其是ChatGPT。」
对于他们与GPT-4的最新研究项目,研究人员对评估其与人类创造力相比的创造能力感兴趣。
GPT-4通过ChatGPT使用TTCT的两个变体进行了八次测试,TTCT是研究人员评估创造力的黄金标准。
使用TTCT,研究人员要求GPT-4通过提问、猜测原因、考虑潜在的后果、产生产品改进的想法、设想现有产品的新的替代用途以及想象未来的情景来展示其创造能力。
TTCT的第三方评估机构Scholastic Testing Services将人工智能的反应与人类的反应进行了比较。
在所有八项测试中,GPT-4在流畅性方面的得分都在所有人类反应的前1%,即对每项活动展现出了大量反应的能力。
在灵活性方面,即产生各种想法的能力,以及从一种方法转向另一种方法的能力,有三项测试的得分在前1%,两项在前2%,其余三项在前7%。
而在Guzik博士眼中,评分里最重要的就是原创性了。
在所有八项测试中,GPT-4在原创性方面的得分都在前1%,即:产生不寻常或独特的反应的能力,也就是超出常规的能力。
Guzik博士表示,「这是第一项能够展现AI可以产生与人类创造能力的现有门槛相匹配或超过的原创反应的研究。」
研究小组预测,在未来五年内,创业过程的每一个组成部分,以及一般的商业,都将受到人工智能的影响。
这包括识别独特的机会和重要的问题,产生新颖的解决方案想法,改进产品,产生新的营销策略,以及想象未来的场景和结果等等。
该团队的研究结果,包括进一步研究训练GPT-4以提高其在商业创新和创业等特定领域的创造能力,计划在今年夏天晚些时候发表。
创造力稀释
其实,这并不是第一个研究GPT-4创造力的研究项目。
国外小哥Phil Bennett曾表示,他担心AI的创造力会让人类陷入困境。
创造力是独属于人类的工具,是区分人类和其它生物的关键点。
而AI生成的东西严格来讲并不是「创造」,而是类似一种「反刍」,将喂进去的东西通过不同的方式结合在一起,然后进行输出。

而这也是Bennett所担心的。他担心类似GPT-4、DALL-E等工具会稀释人类的创造力。
换句话说,不会再有真正新的东西被创造出来,产生的东西都是把既有的东西拆分重组。

参考资料
https://nbcmontana.com/news/local/um-um-western-researchers-find-openais-gpt-4-outperforms-humans-in-creativity-tests
修复视频新神器BSCV工具集 为视频修复技术开辟新可能
要点:1.比特流损坏视频(BSCV)数据集,包含超过28,000个视频剪辑,用于真实世界的比特流损坏视频恢复。2.研究人员提出了一个三参数损坏模型,用于模拟视频比特流的损坏,使数据集包含多种复杂、不可预测的错误模式。3.研究人员提出了一种视频恢复框架,包括插件式特征增强模块,用于提取和融合受损和无损区域的局部特征,以改善视频恢复的性能。站长网2023-09-28 11:09:540000360开始“猛扑”AI数字员工
如果仔细观察会发现,大家似乎很少再提“AIGC”,取而代之的是“生成式AI”、“LLaMA2”以及“AI大模型”等新词。这场由“ChatGPT”引发的内容生产力大革命,已经慢慢走出了单一的“对话式场景”,并迅速蔓延到商业应用的各个场景,尤其是“AI数字员工”的出现,更是打响了互联网大厂AI大模型应用第一枪。0000首批Vision Pro退货潮调查:缺乏应用 外形笨重
在2月初,美国市场上架了售价3499美元起步(大约2.5万元人民币)的苹果VisionPro。这款产品一经推出,立即在美国引发了抢购热潮,甚至在国内,由于需求高涨,一些非官方渠道的价格一度被炒至10万元左右。然而,随着时间的推移,现在多个国内平台的代购价格已经降低至3万至4万元。尽管价格有所降低,但是最近的一些调查显示,这款苹果的新产品可能面临一些挑战。站长网2024-02-22 08:16:530000高通展示汽车内类似 ChatGPT 的助手功能 希望在汽车芯片市场获得更大份额
高通以手机芯片和调制解调器而闻名。但在近几年,他们也向GM、现代和沃尔沃等汽车制造商销售一套硬件芯片、传感器和软件包,称为SnapdragonDigitalChassis。现在高通希望利用生成式人工智能的热潮,说服汽车制造商购买更多的芯片,并围绕它们构建新场景,例如智能助手可以帮助驾驶员在城市中导航、预订和完成其他日常计算任务。站长网2023-09-01 11:01:570002断网也能用!贾扬清团队推出端侧模型Chrome插件,arXiv/B站/吃瓜一件搞定
免费不限次/免登录,贾扬清团队的Elmo插件再次升级——第一个支持端侧模型的Chrome插件。这下,Elmo插件“断网”也能用了据了解,Elmo插件调用了Chrome本地模型Gemininano,大小为12MB。这一更新(v0.3.2)目前处于EarlyPreview(早期预览)阶段,Chrome商店正在审核中。站长网2024-07-21 06:32:000000