AI能否通过CFA考试?研究结论:目前还不行
划重点:
- 大规模语言模型(LLM)如ChatGPT和GPT-4在通过CFA考试方面存在挑战。
- 研究结果显示GPT-4表现明显优于ChatGPT,但仍面临挑战,尤其是在更高级别的考试中。
- 针对CFA考试的专门培训和知识获取可能是提高AI在金融领域表现的关键。
近年来,大规模语言模型(LLM)如ChatGPT和GPT-4已经引起了广泛的关注,因为它们在处理自然语言任务上表现出色,引发了人们对它们是否能够通过专业考试,如著名的特许金融分析师(CFA)考试的疑问。
一项由维吉尼亚理工大学、皇后大学和摩根大通研究人员进行的新研究对ChatGPT和GPT-4在模拟CFA一级和二级考试中的表现进行了测试,提供了关于LLMs在处理高级金融推理方面的见解。研究结果表明,这些模型在目前阶段存在一些限制。
CFA考试包括三个级别的考试,涵盖金融分析、投资组合管理、会计和经济等领域的知识。这些考试以严格测试实际金融知识和推理能力而著称,通常需要2-5年的时间才能通过。每个级别的通过率约在40-50%左右。
研究中,研究人员将ChatGPT和GPT-4分别测试在零提示、少提示和思维链提示情况下,以返回多项选择题的结构化答案。他们使用模拟考试题,因为CFA协会对真实考试题有一定的限制。
总的来说,研究发现:
- GPT-4在各种情境下的表现始终优于ChatGPT,说明它是更高级的LLM。
- 两个模型在二级考试中遇到的困难明显大于一级考试。
- 少提示情境明显提高了ChatGPT的准确性,而思维链提示则稍微提高了准确性,同时暴露了知识差距。
- 根据估算的CFA及格分数,只有GPT-4可能在少提示情境下通过考试。
这些结果突显了LLMs在处理CFA考试所需的领域知识和推理方面的当前限制。然而,少提示情境的提升表明它们有能力获取新的金融专业知识。
要在金融领域继续提高LLMs的性能,可能需要有针对性地培训它们,使其掌握金融概念、公式和推理技巧。然而,要通过CFA考试可能还有一段距离要走。
《妈妈咪呀》国际女星一夜被AI端掉饭碗
AI淘汰人类的紧迫感越来越近了!最近,在音乐剧《妈妈咪呀》饰演主角女星,被一封BBC邮件告知:不用来了,AI替代了你。前几天,OpenAI刚宣布进军好莱坞,并放出一波导演艺术家们体验Sora的震撼视频。仅仅几天的时间,已经有国际著名明星,饭碗一夜之间被AI端掉了!她,就是音乐剧《妈妈咪呀》的主演——SaraPoyzer。站长网2024-04-06 14:18:250000爱奇艺二季度净赚3.65亿:VIP会员少了1700多万
8月22日消息,爱奇艺发布截至6月30日二季度未经审计财报,总营收78.02亿元,同比增长17%:归属于爱奇艺的净利润为3.65亿元,上年同期净亏损2.14亿元。该季度日均总订阅会员数为1.112亿,而2022年第二季度为9830万及2023年第一季度为1.289亿。这意味着爱奇艺VIP会员同比增加了1000多万,但环比减少1700多万的情况下,业绩反而在增长了,盈利能力大幅提升。站长网2023-08-22 21:43:040000《洛基》海报疑似出自AI之手 迪士尼再遭质疑滥用人工智能
最近,迪士尼推出的漫威系列《洛基》第二季宣传海报在设计界引发争议。海报背景中的时钟图像疑似使用生成式人工智能制作。插画家KatriaRaden在社交媒体上指出,该时钟图像存在许多“无意义的曲线”,这是AI生成图像的典型特征。站长网2023-10-10 10:36:440000《英雄联盟》所有人聊天功能恢复 网友:史诗级加强
9月14日消息,《英雄联盟》国服今日13.18版本更新后,恢复了所有人聊天功能。游戏玩家除了可以与队友互动外,还可与对手聊天互动。但此前也有过所有人聊天功能短暂开启,目前尚不清楚国服后续是否会再度关闭所有人聊天功能。据了解,《英雄联盟》国服在2021年关闭了游戏内的所有人聊天功能。当时,《英雄联盟》称其对行为系统的主要关注点都与对局有关,如挂机和送人头等行为。站长网2023-09-14 21:52:060000智能手机的电池健康功能,为何会遭到用户“嫌弃”
大家不妨想象一下,假设现在是2003年,而你则是一位十分热衷于数码产品的“弄潮儿”。有一天当你掏出自己的彩屏翻盖手机打算拍几张照片、发一条彩信时,突然发现手机不能开机了,此时在拆下它的电池后,发现电池已经明显膨胀了起来,甚至还能摸到一丝不太正常的“温热感”。站长网2023-06-11 22:41:500000