AI能否通过CFA考试?研究结论:目前还不行
划重点:
- 大规模语言模型(LLM)如ChatGPT和GPT-4在通过CFA考试方面存在挑战。
- 研究结果显示GPT-4表现明显优于ChatGPT,但仍面临挑战,尤其是在更高级别的考试中。
- 针对CFA考试的专门培训和知识获取可能是提高AI在金融领域表现的关键。
近年来,大规模语言模型(LLM)如ChatGPT和GPT-4已经引起了广泛的关注,因为它们在处理自然语言任务上表现出色,引发了人们对它们是否能够通过专业考试,如著名的特许金融分析师(CFA)考试的疑问。
一项由维吉尼亚理工大学、皇后大学和摩根大通研究人员进行的新研究对ChatGPT和GPT-4在模拟CFA一级和二级考试中的表现进行了测试,提供了关于LLMs在处理高级金融推理方面的见解。研究结果表明,这些模型在目前阶段存在一些限制。
CFA考试包括三个级别的考试,涵盖金融分析、投资组合管理、会计和经济等领域的知识。这些考试以严格测试实际金融知识和推理能力而著称,通常需要2-5年的时间才能通过。每个级别的通过率约在40-50%左右。
研究中,研究人员将ChatGPT和GPT-4分别测试在零提示、少提示和思维链提示情况下,以返回多项选择题的结构化答案。他们使用模拟考试题,因为CFA协会对真实考试题有一定的限制。
总的来说,研究发现:
- GPT-4在各种情境下的表现始终优于ChatGPT,说明它是更高级的LLM。
- 两个模型在二级考试中遇到的困难明显大于一级考试。
- 少提示情境明显提高了ChatGPT的准确性,而思维链提示则稍微提高了准确性,同时暴露了知识差距。
- 根据估算的CFA及格分数,只有GPT-4可能在少提示情境下通过考试。
这些结果突显了LLMs在处理CFA考试所需的领域知识和推理方面的当前限制。然而,少提示情境的提升表明它们有能力获取新的金融专业知识。
要在金融领域继续提高LLMs的性能,可能需要有针对性地培训它们,使其掌握金融概念、公式和推理技巧。然而,要通过CFA考试可能还有一段距离要走。
一开发者搞了款ChatGPT应用程序WinGPT,竟可在老古董Win3.1 设备运行
最近,有开发者异想天开,竟然为Windows3.1的个人电脑制作了一个ChatGPT应用程序WinGPT。(注:Windows3.1是微软于1992年4月6日发布的Windows3.x系列的基于MS-DOS的操作系统。)站长网2023-06-28 15:35:240000战场换了,武器变了,腾讯能否复刻“吃鸡大战”的胜利?
12月15日,腾讯派对游戏《元梦之星》将正式上线。作为国民级游戏赛道,派对游戏已成为国内游戏厂商必争之地。仅上海游戏四小龙中,就有鹰角网络、莉莉丝两家正在筹备进军。0000蛋糕快被OpenAI们分完了,AI初创公司陷融资困境
据海外媒体报道,对AI初创企业的投资列车正在缓慢减速。一些年轻的初创企业发现,完成新一轮的融资目标已经变得越来越困难,而在一年之前,投资者们肯定会跃跃欲试。以初创公司LiquidAI为例,这间公司正在研发一种新型的AI模型,它可以在使用过程中不断学习,而不只是进行预训练,而这种方法与流行的OpenAI模型工作方式截然不同。0000一碗「番茄肥牛饭」的 AI 之旅
很多走在前沿的企业正在用AIGC辅助进行快速进化,并在用更短的时间进行弯道超车。比如这次我们要聊的这家餐饮公司,认识他们,可以先从一些数据开始:-关于小红书推广,使用AI数字员工后,至少能帮助节省1个运营人员、2个文案、3个设计,大大降低了成本。-关于新品研发,使用AI工具后,周期缩短的同时,判断也更精准了。之前仅做产品调研就要用一个月,现在几天就能快速决策和搞定。站长网2023-12-27 12:17:160000支付宝升级租赁行业平台治理规范 打击非法向未成年人提供租赁服务
今日,支付宝宣布升级租赁行业平台治理规范。针对业内偶发的“高价租赁、未成年人租赁以及多头租赁和暴力催收”等现象,推出了一套全链路升级的治理方案。以下为将加强治理的典型案例:高价租赁变相放贷在各大网络平台,常见的高价租赁包括租赁商户发布租金明显高于同品类租赁商品价格,或转销售价远高于租赁标的市场价格的行为,以及通过租赁服务变相放高利贷的行为。非法向未成年人提供租赁服务站长网2023-07-04 00:57:030000