人工智能模型透明度评估:Llama 2位列第一,GPT-4透明度不佳
站长网2023-10-21 10:26:111阅
要点:
1. 十大主流AI模型的透明度正在受到关注,其中Llama2在透明度评估中位列第一,而GPT-4等模型的透明度不佳。
2. 斯坦福大学、MIT、普林斯顿大学等团队提出了“基础模型透明度指数”,对十个主流模型的透明度进行评估,结果显示透明度普遍不高。
3. 尽管有开源模型如Llama2等获得较高评分,但整体而言,AI行业的透明度不足,对模型构建过程、数据来源和劳动力等关键方面缺乏透明。
近年来,人工智能领域的主流模型透明度成为焦点,斯坦福大学、MIT、普林斯顿大学等机构合作提出了“基础模型透明度指数”来评估十大主流AI模型的透明度。结果显示,Llama2位列第一,而GPT-4等模型的透明度较低。
尽管AI模型的社会影响日益增大,人们对于这些模型的构建、训练和使用方式仍有诸多疑问,包括数据来源、劳动力待遇等。然而,该评估系统也引发了一些争议,一些开发者认为要求公司公开商业机密过于幼稚。

论文地址:https://arxiv.org/pdf/2310.12941.pdf
尽管如此,透明度对于AI模型的发展和应用至关重要,尤其是在生成式AI领域,因为模型既有提高生产力的潜力,也可能被用来伤害他人。透明度的不足可能导致模型被滥用,因此开发者需要更加注重透明度,包括对模型的构建、功能、风险等方面的公开。
然而,目前大多数主要基础模型开发者都未能提供足够的透明度,这凸显了人工智能行业亟需改进透明度的问题。同时,开源基础模型如Llama2、BLOOMZ等获得较高评分,但仍有改进空间,因为只有极少数开发者透明地展示了模型的局限性和其他关键信息。
在当前的政策争论中,是否应该将人工智能模型开源成为一个争议焦点,但无论开源还是闭源,透明度都是关键因素,以确保AI模型的负面影响得到控制。
0001
评论列表
共(0)条相关推荐
官宣:小米13系列、Redmi K60系列澎湃OS正式版即将推送
快科技112月2日消息,据小米澎湃OS官方在小米社区公告,首批澎湃OS正式版适配机型测试进展顺利,将会在近期正式推送。其中包括小米13系列、RedmiK60至尊版、RedmiK60Pro、RedmiK60,不用机型之间发版机型存在细微差异,但都会在近期逐步推送。届时,这些老用户也能体验到全新的小米澎湃OS了。站长网2023-12-02 15:16:320000英国议员:英国需加快AI监管立法 负责将落后美国和欧盟
文章概要:1.英国国会技术委员会表示,英国政府对AI的监管方法落后于欧盟和美国。2.议员们呼吁英国政府制定AI法案,否则在AI监管方面将落后于其他司法管辖区。3.议员希望11月召开的AI安全峰会应包括尽可能多的国家参与。据英国卫报英国国会科技、创新和技术委员会表示,英国应制定新法律来监管人工智能,否则在制定人工智能监管标准方面将落后于欧盟和美国。站长网2023-08-31 12:07:340000谷歌 DeepMind 研究人员推出 Promptbreeder:一种自我推理、自我完善的人工智能系统,可在给定领域内自动生成有效的特定领域提示语
站长之家(ChinaZ.com)10月9日消息:大型语言模型(LLMs)因其模仿人类特性而引起了广泛关注。这些模型能够回答问题、生成内容、总结长文本段落等等。提示语对于提高LLMs(如GPT-3.5和GPT-4)的性能至关重要。站长网2023-10-09 09:13:120000百万网友围观DALL-E 3新玩法!钢铁侠特斯拉皆“中招”,强迫症友好,博主分享提示词
DALL-E3被网友们玩疯了!你见过这样的钢铁侠和蝙蝠侠吗?身体部件被大卸八块整齐地平铺在桌面上。虽然但是,看起来着实舒适。最近这样一种玩法火了起来,相关的两篇博文吸引了近百万网友们的围观。感觉也不需要摄影了,各种“产品”对DALL-E3来说都可以信手拈来。比如很难正常拍出来的特斯拉产品系列,也都能直接搞定。甚至一些天马行空的。比如,河马的食谱???站长网2023-10-08 17:58:270000小米13 Ultra白色版公布!网友:必是爆品 我冲了
快科技4月17日消息,小米集团卢伟冰公布了小米13Ultra白色版真机照。这款白色版本采用素皮材质,是小米13系列唯一一款白色素皮手机。对此,有网友表示:白色必是爆品,我冲了”。还有网友担心小米13Ultra首销会被抢光,卢伟冰回复这取决于大家的热情”。站长网2023-04-17 20:06:070000