大模型恋爱神器!16种MBTI自由定制,北大ChatLaw团队出品
北大团队新作,让大模型拥有个性!
而且还是自定义那种,16种MBTI都能选。
图源备注:图片由AI生成,图片授权服务商Midjourney
这样一来,即便是同一个大模型,不同性格下的回答都不一样。
比如提问:你周末喜欢干什么?
ENFP的大模型会说:喜欢参加社交活动,结识新朋友。
INFJ的大模型则回答:喜欢独自读过。
这样能干啥呢?北大的童鞋们列出来了一些情景:
在特殊节日,给你的男/女朋友寻找心仪的礼物。
了解你关注的那个Ta在不同情境下的反应。
深入理解大模型的定制化、个性化的方式及可能性。
在做出重大决策时,考虑不同情境下的个性特征。
通过深入了解人性的复杂性,促进个人成长和相互理解。
这项工作由FarReel AI Lab(前身是ChatLaw项目)和北大深研院合作研发,支持给开源模型赋予性格。
目前已开源32个模型和数据集。
具体如何实现?一起来看原理~
已开放32个有个性模型
在此之前,想让大模型具备一定个性,最常用的方法是利用提示工程。
比如Character.ai上不同性格的对话bot,就是用户通过提示工程调教出来的。
不过这种方式带来的效果不完全稳定。
所以北大团队提出了一种方法,他们自主构建了十万条大规模MBTI数据,然后通过多阶段预训练、微调、DPO训练方法为它注入性格。
数据集方面,主要分为两种,行为数据集和自我意识数据集。
行为数据集的目的是为了让大模型可以表现出不同性格的回应,这部分是对Alpaca数据集进行个性化修改实现。
行为数据集中MBTI四个维度的比例如下:
自我意识数据集是为了让大模型能够意识到自己的个性特征。
通过一个两阶段的有监督训练微调过程,最后可以得到对应人格的大模型。
以训练一个INFP大模型为例,在第一阶段的有监督微调中利用行为数据集中“I”、“N”、“F”、“P”四个数据集,在第二阶段的有监督微调中,再使用一个额外的自我意识数据集。
研究团队表示,这种方法成功使Baichuan、Qwen、LLaMA、Mistral等模型完成不同MBTI类型的性格对齐任务。
首先开放的是基于Baichuan-7b-chat的16个中文模型以及基于LLaMA2-7b的16个英文模型。后续还将做更多补充。
最后得到的训练结果如下。
ENFP问答结果
ENTJ问答结果
INFP问答结果
ISTJ问答结果
数据集方面,团队开源了MBTI训练数据集。
数据集涵盖了丰富多样的场景,旨在帮助研究者和开发者训练出能够理解和模拟不同 MBTI 性格的基座模型。这些模型不仅能够提供更加人性化的互动体验,还能够在多种情境下提供精准的心理学洞察。
对于这项工作的思考,研究团队认为人类的思维就像从出生就拥有的一个预训练模型,每个人的参数、训练数据可能不尽相同,这也导致我们的一些抽象思维和能力不同,长大后有人擅长数理逻辑、有人擅长情感演绎。
而之后从小到大的学习、环境、经历的事情都相当于是在对我们的预训练大脑进行微调和人类反馈对齐,这样来看,所谓的MBTI性格基本都是后天环境因素影响下形成的,这也导致每个人都独具特色。
也就是说可以尝试用微调和人类反馈对齐(DPO),去对各种预训练的基座LLM进行分阶段的训练,从而让模型拥有不同的MBTI属性。
团队的目标不仅是使这些模型拥有不同的MBTI属性,还要模拟人类形成不同MBTI性格的过程。
他们相信,这一独特的方法将为我们在人格心理学领域理解和利用大语言模型开辟新的途径。请继续关注更多的发展,因为我们继续探索语言模型和人类个性的令人着迷的交汇点。
GitHub:https://github.com/PKU-YuanGroup/Machine-Mindset
数据集:https://huggingface.co/datasets/FarReelAILab/Machine_Mindset
HuggingFace试用链接:https://huggingface.co/spaces/FarReelAILab/Machine_Mindset
ModelScope试用链接:https://modelscope.cn/studios/FarReelAILab/Machine_Mindset
B站将上线“创作者声明”功能 发布AI生成内容需添加声明
B站发布《关于“主动添加内容标识”的公告》称,将在9月20日,上线“创作者声明”功能。该功能可以帮助UP主在发布稿件时,补充对稿件的作者声明。如果创作者选择的声明与稿件内容不符,社区可能会将错误声明进行编辑或修改。创作者需要添加的标识主要包括以下几类:1.发布原创涉及国内外时事、公共政策、社会事件等相关内容时,需要在稿件简介中标明拍摄时间、地点;站长网2023-09-14 21:40:180000MidJourney创始人透露公司名字的灵感源自庄子的“中道”
MidJourney创始人大卫·霍尔茨在2023世界人工智能大会上分享了他对人工智能发展的观点。他表示,他喜欢阅读科幻文学和中国古典文学,并从中汲取灵感。他将公司的名字MidJourney来源于庄子的庄周梦蝶,寓意着人工智能技术应该走在中间的道路上。站长网2023-07-08 14:06:260001拒绝董明珠3次的主播郑茹心评孟羽童离职:去读书是很好的选择
曾有着小董明珠”、甚至一度被当作接班人”培养的孟羽童,已经离开格力。尽管关于其是否系被开除还众说纷纭,但似乎已经没人再去关心。日前,在与教育网红张雪峰等进行网络连线时,曾与孟羽童一起参加职场节目《初入职场的我们》并在格力实习的郑茹心给出了她对孟羽童离职一事的看法。郑茹心表示,她就是要做出自己想要的选择吧,本身就一直想要读书,所以离职去读书是很好的选择。只是大家不要被网上一些不实的八卦误导。0000iPhone16或涨价 分析师:顶配版售价可能突破2万元
随着苹果公司宣布即将在北京时间9月10日凌晨1时举行特别活动,外界普遍预期将发布新款iPhone16系列。不过,与新品发布相伴而来的还有可能的价格全面上涨。据媒体报道,新款iPhone16系列的售价可能会因为引入苹果AI技术、全球芯片价格上涨以及成本增加等因素而全面提高。站长网2024-08-27 23:03:110000赛博朋克2077超梦成真?The Halo让你可以控制自己的梦境
科学家们研发了一种神奇的硬件设备,名为TheHalo,它是一种非侵入性的神经设备,用于稳定和诱导清明梦。清明梦是一种特殊的梦境,做梦者在其中意识到自己正在做梦,并可以在梦中实现自己想要的任何事情,类似于赛博朋克2077中的超梦。据说,古人的阴神出游也是一种清明梦。官网地址:https://propheticai.co/pages/science站长网2023-11-13 17:20:370000