人工智能模型透明度评估:Llama 2位列第一,GPT-4透明度不佳
站长网2023-10-21 10:26:111阅
要点:
1. 十大主流AI模型的透明度正在受到关注,其中Llama2在透明度评估中位列第一,而GPT-4等模型的透明度不佳。
2. 斯坦福大学、MIT、普林斯顿大学等团队提出了“基础模型透明度指数”,对十个主流模型的透明度进行评估,结果显示透明度普遍不高。
3. 尽管有开源模型如Llama2等获得较高评分,但整体而言,AI行业的透明度不足,对模型构建过程、数据来源和劳动力等关键方面缺乏透明。
近年来,人工智能领域的主流模型透明度成为焦点,斯坦福大学、MIT、普林斯顿大学等机构合作提出了“基础模型透明度指数”来评估十大主流AI模型的透明度。结果显示,Llama2位列第一,而GPT-4等模型的透明度较低。
尽管AI模型的社会影响日益增大,人们对于这些模型的构建、训练和使用方式仍有诸多疑问,包括数据来源、劳动力待遇等。然而,该评估系统也引发了一些争议,一些开发者认为要求公司公开商业机密过于幼稚。
论文地址:https://arxiv.org/pdf/2310.12941.pdf
尽管如此,透明度对于AI模型的发展和应用至关重要,尤其是在生成式AI领域,因为模型既有提高生产力的潜力,也可能被用来伤害他人。透明度的不足可能导致模型被滥用,因此开发者需要更加注重透明度,包括对模型的构建、功能、风险等方面的公开。
然而,目前大多数主要基础模型开发者都未能提供足够的透明度,这凸显了人工智能行业亟需改进透明度的问题。同时,开源基础模型如Llama2、BLOOMZ等获得较高评分,但仍有改进空间,因为只有极少数开发者透明地展示了模型的局限性和其他关键信息。
在当前的政策争论中,是否应该将人工智能模型开源成为一个争议焦点,但无论开源还是闭源,透明度都是关键因素,以确保AI模型的负面影响得到控制。
0001
评论列表
共(0)条相关推荐
美团 2023 年营收 2767 亿元 同比增长25.8%
美团今日公布了其截至12月31日的2023年第四季度及全年财报数据,展现出了稳健的增长态势。具体来看,第四季度营收达到了737亿元,同比显著增长22.6%。值得一提的是,净利润实现了扭亏为盈,达到22亿元,而去年同期则为亏损11亿元。经过调整后,净利润更是增长至43.7亿元,远高于去年同期的8.3亿元。站长网2024-03-23 05:18:470001B站取消播放时长指标外显改版 社区与产品负责人道歉
昨晚,B站社区与产品负责人方方通过其个人账号发表声明,对UP主阿test关于B站产品设计的批评做出回应,并代表B站产品团队向广大UP主和用户致以诚挚的歉意。在回应中,方方首先提到了B站此前推出的播放时长指标外显改版。他表示,团队意识到这一决策过于理想化和自信,没有充分考虑到外界对于这一改动的接受和理解程度。因此,团队已经决定取消这一改版,以更好地满足用户需求。站长网2024-05-24 10:21:200000研究机器学习立功!2024年诺贝尔物理学奖揭晓:两位科学家获奖
快科技10月8日消息,今日,瑞典皇家科学院宣布,将2024年诺贝尔物理学奖授予约翰J霍普菲尔德(JohnJ.Hopfield)和杰弗里E辛顿(GeoffreyE.Hinton),表彰他们在使用人工神经网络进行机器学习的基础性发现和发明。据了解,两位获奖者将平分1100万瑞典克朗(约合745万元人民币)奖金。0000OPPO Find X7宣布支持AI通话摘要 通话结束即可一键生成
今日,OPPO官方宣布,FindX7成为首款支持AI通话摘要的手机。用户在通话结束后,只需一键,即可生成摘要,并自动创建待办事项和提醒。此外,OPPO表示,在人工智能领域持续发力,最新推出的安第斯大模型拥有高达70亿的参数。这款大模型为全新小布助手赋予了强大的功能,支持AI文章摘要、小布问答、AIGC消除以及AI通话摘要等。并准备了AI画师、小布照相馆、小布连麦等100多种功能。站长网2024-01-08 15:58:560000苹果客服回应iPhone13鼓包:电池老化及高温环境等因素导致
近日,社交媒体上涌现出大量关于iPhone13电池鼓包的投诉和讨论。网友们纷纷表示,手机电池在没有任何外力作用的情况下,突然鼓起,这不仅是外观上的瑕疵,更存在严重的安全隐患。针对这一情况,苹果官方客服迅速作出回应。他们表示,已接到多起关于电池鼓包的反馈,经过工程师分析,这主要是由于电池老化及高温环境共同作用的结果。苹果建议用户密切关注电池健康情况,并及时采取相应措施。站长网2024-06-29 16:22:460000