首页站长资讯让AI互评高考作文，Kimi和GPT-4o“互掐”，通义千问实力演绎“端水大师”

让AI互评高考作文，Kimi和GPT-4o“互掐”，通义千问实力演绎“端水大师”

站长网2024-06-11 17:21:320阅

人类高考，AI比人类还忙。

那位连续用AI押中两年高考作文题的UP主，今年又双叒押中了，而且是6中4。

今年，全国各地还用上了AI智能巡考，该系统可以通过分析考场内的图像和视频数据，实时检测出作弊、抄袭等异常行为，并发出警报提醒监考老师及时采取措。

新课标I卷的作文题更是直接以人工智能的应用为背景，提出了一个开放性的问题。

考虑到让AI写高考作文已不足为奇，这次我们新增了一个互评环节——先让几位参赛选手围绕上述题目写一篇作文，然后它们互相给对方的作文打分。

原以为会变成大型商业互吹现场，实际上却是各怀鬼胎，暗流涌动。

本次AI“写作文论剑”的参赛选手有5位:ChatGPT-4o、Kimi、通义千问、腾讯元宝、文心一言。作文题选的是新课标I卷，让AI讨论与自身有关的主题，也是别有一番用意了。

评分标准则以高考作文阅卷标准为参考，打分区间为1-10分，并需要提供100字以内的评分理由。

下面一起来看看过去一年，AI写作文的水平是否有长进，打分环节是否能做到公正客观、言之有物。

1号选手:ChatGPT-4o

打分环节

Kimi:8分

通义千问:9.5分

腾讯元宝:9分

文心一言:9分

1号选手ChatGPT4o获得了均分8.875的好成绩，其中Kimi阅卷官较为严格，打出的分数最低，让我们一起来看看它的评语:

潜台词:ChatGPT4o，你的观点和批判性思考深度不够啊。

2号选手:Kimi

打分环节

GPT-4o:6分

通义千问:8.5分

腾讯元宝:7.5分

文心一言:7分

本轮惊现全场最低分（没点私人恩怨我是不信的）。上一轮Kimi给GPT-4o的作文评分就是最低的，这轮GPT-4o也是丝毫没有留情，它给出的理由概括来说就是:无趣、公式化。

3号选手:通义千问

打分环节

ChatGPT4o:9分

Kimi:9分

腾讯元宝:9分

文心一言:9.5分

3号选手通义千问获得了国内外友商的肯定。阅卷官们普遍认为，文章结构以“乐章”的形式展开，充满创意和文采，展现了作者出色的思辨能力和文学素养。

文心一言甚至模仿通义千问华丽的文风，给出了一段不输原文的精彩评语:

多少有点鸡汤浓度大比拼的意思。

4号选手:腾讯元宝

打分环节

ChatGPT4o:9分

Kimi:9分

通义千问:10分

文心一言:9分

首篇满分作文出炉。针对4号选手腾讯元宝交出的高考作文，虽然其他阅卷官一致认为，文章在深度挖掘和创新性上还有提升空间，但评委通义千问仍然给出了满分10分的评分，让我们看看它的点评:

5号选手:文心一言

打分环节

ChatGPT4o:7分

Kimi:7.5分

通义千问:9分

腾讯元宝:8.5分

在看到标题“探寻答案之海”时，我的内心os:文心一言，这下我真的要表扬你了。不过，整体评分不算高。GPT-4o更是直言“啰嗦”，车轱辘话来回说。

这4轮点评下来，我们发现，通义评委最为宽容，深谙“端水”和“商业吹捧”之道。上至满分，下至8.5，写得好，它能夸出花来;写得烂，它也能从中打捞出星辰。

低情商:缺乏深度

高情商:点到即止

所以，假如你是阅卷老师，你会给这几位AI选手的作文打几分?

让AI互评高考作文Kimi和GPT4o 互掐 通义千问实力演绎端水大师

0000

评论列表

共(0)条

相关推荐

站长资讯
小米Civi 4 Pro即将发布首发骁龙8s Gen 3
今日，小米Civi产品经理胡馨心在微博上的一则发文，通过微博小尾巴的形式，正式确认了新机型小米Civi4Pro的命名。这款新机型的亮相，标志着小米Civi系列首次采用了后缀为“Pro”的命名方式，预示着它在性能、影像、屏幕以及快充等方面将向旗舰机型看齐。
站长网2024-03-18 16:43:59
0000
站长资讯
令投资人集体出动的「AI陪伴」是伪需求吗？| 对话投资人
翰林会是由一群志同道合的出海投资人发起成立的投资人社群，大家会不定期碰头，讨论一些时下热点话题、交流一些行业观察。本文内容来源于翰林会投资人第一期碰头会的交流讨论，由跨境出海行业头部媒体白鲸出海独家记录、报道。
站长网2024-05-14 18:12:10
0000
站长资讯
猴子无限CEO尹伯昊：借助大模型构建个性化体验，是新时代的财富密码
随着生成式AI与大模型技术的发展，创业机遇大量涌现，但也引发了行业对于“大模型创业是否是巨头游戏”的讨论。对于企业和个人来说，究竟如何借助大模型赚钱?有哪些是我们真正可以抓住的机会?7月14日，猴子无限CEO尹伯昊在「AIGC赋能·重塑内容生态」2023新榜AIGC生态大会上围绕《用每个人的专属大模型打造个性化内容》这一主题，分享了他对大模型时代财富密码的思考与判断。
站长网2023-07-26 18:14:33
00011
站长资讯
月之暗面回应Kimi系统流量异常增高：持续进行扩容
站长之家(ChinaZ.com)3月21日消息:月之暗面发布公告，就近期Kimi系统流量异常飙升事件进行说明。据悉，自3月20日上午九点半起，官方监测到Kimi系统流量持续异常增高，这一增长趋势远超公司原先的预计和规划。因此，自3月20日上午十点起，不少SaaS客户开始陆续遇到“429:engineisoverloaded”的异常问题，对此月之暗面深表歉意。
站长网2024-03-22 09:35:34
0000
站长资讯
实时文生图速度提升5-10倍，清华LCM/LCM-LoRA爆火，浏览超百万、下载超20万
生成式模型进入「实时」时代?文生图、图生图已经不是什么新鲜事。但在使用这些工具的过程中，我们发现它们通常运行缓慢，导致我们要等一段时间才能拿到生成结果。但最近，一种名叫「LCM」的模型改变了这种情况，它甚至能做到实时的连续生图。图源:https://twitter.com/javilopen/status/1724398666889224590
站长网2023-11-15 21:18:16
0001