复旦、人大等发布大五人格+MBTI测试 角色扮演AI特质还原率达82.8%
要点:
复旦大学和中国人民大学联合Chat凉宫春日团队发布的研究强调,评价AI角色扮演的关键在于良好的人设还原度,其特质还原率达到82.8%。
使用大五人格的NEO-FFI问卷和MBTI的16Personalities测试,研究人员通过LLM进行引导式开放式问答,对AI角色进行全面的人格测试,从心理学的角度研究角色扮演AI的行为模式。
研究者提出了一套面谈式人格测试框架,利用开放式问答,通过LLM预测角色扮演AI的人格特质,实验结果显示在大五人格和MBTI测试上达到了82.8%的还原率。
近期,由复旦大学和中国人民大学合作的Chat凉宫春日团队发布了一项关于AI角色扮演的研究。该研究强调了良好的人设还原度对于评价AI角色扮演的重要性,特质还原率高达82.8%。研究使用了大五人格的NEO-FFI问卷和MBTI的16Personalities测试,并通过LLM进行引导式开放式问答,全面测试了AI角色的人格。这一面谈式人格测试框架的提出,为评估角色扮演AI的人格特质提供了新的方法。

项目地址:https://github.com/LC1332/Chat-Haruhi-Suzumiya/tree/main/research/personality
随着大语言模型的发展,基于这些模型的角色扮演聊天机器人在全球范围内引起了广泛关注。相较于传统聊天机器人的繁琐工程,现今的大语言模型能够轻松构建具备不同身份、人格、记忆和语言习惯的角色扮演AI。然而,对于角色扮演AI的分析性研究仍然相当匮乏,尤其是在对它们的评估上。这项研究通过使用心理学的人格相关理论,从大五人格和MBTI等维度对角色扮演AI进行了人格测试,为这一领域的研究提供了新的视角。
研究者提出的面谈式人格测试框架通过开放式问答,使得角色扮演AI的评估更为全面。与传统的Likert Scale相比,这种框架能够更好地激发角色扮演AI的扮演行为,减少对底座LLM训练数据的影响。实验结果显示,现有的角色扮演AI在大五人格和MBTI测试上的还原率达到了82.8%。
研究者指出,这些结果仍受到底座LLM的先验影响,表现为在某些维度上的平均得分与底座模型较为一致。为了研究这一点,研究者比较了不同底座模型对角色扮演AI的影响,发现在某些维度上存在一致性,但在其他维度上并没有明显的相关关系。
综合而言,这项研究为评估AI角色扮演的人格特质提供了新的方法和视角,同时也揭示了在现有技术中存在的一些挑战和限制。未来,随着技术的不断发展,角色扮演AI的人格还原度和表现可能会得到进一步提升。
Redmi K70系列官宣将于11月29日发布
小米官方宣布,RedmiK70系列手机的发布会将于11月29日晚7点举行。目前,小米已经对RedmiK70E一款机型进行了详细预热。这款新机将首发搭载天玑8300-Ultra处理器,配备1.5K柔性直屏,支持1920HzPWM高频调光,1800nit峰值亮度,12bit色深,配有5500mAh电池90W快充。站长网2023-11-23 09:25:140001日本人工智能指导方针草案提出 AI 使用方需共同承担责任
据日本共同社消息,为了确保生成式人工智能(AI)的妥善利用,日本政府正在制定面向企业等的指导方针。根据获悉的草案,不仅是AI开发商和服务提供商,也包括使用AI开展业务的企业和团体将共同承担责任。该指导方针明确了五大业务主体,包括创造AI基础技术的「算法开发者」,提供基于AI服务和软件的「服务实施者」,以及运用AI开展业务的企业等。这些主体需共同承担责任和义务。站长网2023-10-07 15:57:040001曝iPhone 16 Pro Max 屏幕将增至 6.9 英寸 沿用钛合金金属
快科技10月4日消息,自iPhone12ProMax发布后,iPhone超大杯手机的屏幕便一直维持在6.69英寸。据最新消息,明年的iPhone16系列手机的屏幕将迎来改变,其中中不仅仅只有iPhone16Pro的屏幕尺寸会有所增加,iPhone16ProMax也将搭载更大尺寸的屏幕。00002499元起!vivo Pad3正式发布:骁龙8s Gen3配10000mAh超大电池
快科技6月28日消息,今日,vivoPad3正式发布,搭载骁龙8sGen3移动平台,起售价为2499元。在售价方面,vivoPad38GB128GB版本售价为2499元,8GB256GB版本售价为2799元,12GB256GB版本售价为3099元,12GB512GB版本售价为3399元。平板提供了它提供了薄霞紫、春潮蓝和寒星灰三种配色。站长网2024-06-28 22:30:290000阿里云发布通义星尘、通义灵码等产品 推出大模型应用开发平台阿里云百炼
在昨日的2023云栖大会上,阿里云发布了多个重要的产品和技术。首先是通义大模型家族的更新。阿里云发布了千亿级参数规模的大模型通义千问2.0,综合性能超过了GPT-3.5,正在追赶GPT-4。此外,通义千问APP也在各大手机应用市场上线,用户可以直接体验最新模型能力。站长网2023-11-02 08:37:270002