OpenAI预警系统探索 GPT-4 在制造生物武器方面的优势
划重点:
1. 📡 OpenAI通过研发早期预警系统,评估GPT-4是否能提高获取生物威胁信息的效率。
2. 🤖 对100名参与者进行的研究表明,使用GPT-4与互联网相结合,在生物危害任务的准确性和完整性上略有改善,但效果并不显著。
3. 🌐 文章强调研究限制,仅评估了信息获取而非实际应用,未探讨GPT-4在新型生物武器开发中的潜在贡献,且使用的GPT-4模型缺乏互联网研究和高级数据分析工具。
OpenAI最近着手研发GPT-4的早期预警系统,以探讨大型语言模型是否能够提高获取关于生物威胁信息的效率,相较于互联网。该系统旨在作为一种“触发器”,提示潜在存在生物武器的可能性,需要进一步调查,同时纳入OpenAI的预防框架。
研究采用了100名参与者,包括50名具有湿实验经验的博士生物学家和50名至少在大学修过一门生物学课程的本科生。实验中,参与者被随机分配到两组:一个只能访问互联网的对照组,另一个除了互联网外还可以使用GPT-4的处理组。处理组的专家可以访问GPT-4的研究版本,该版本不会拒绝有关高风险生物制剂的直接问题。
每个参与者都被要求完成一系列涵盖生物危害生成过程各个方面的任务。OpenAI根据五个结果指标评估了参与者的表现:准确性、完整性、创新性、用时和自评难度。其中,专家评估了准确性、完整性和创新性,而用时则直接来源于参与者的回答,任务难度由参与者在1到10的评分标尺上自评。
研究结果显示,相较于只使用互联网的基准,处理组的参与者在准确性和完整性方面都略有改善。在准确性评分的10分制度上,专家组平均提高了0.88,学生组提高了0.25。对于完整性的改善也类似,专家组为0.82,学生组为0.41。然而,OpenAI指出,这些效果并不足以在统计学上具有显著性。
OpenAI表示,对于LLM用户而言,在完整性方面的优势可能是由于模型生成和人类生成的输出记录习惯不同。语言模型倾向于生成更长的输出,其中可能包含更多相关信息,而使用互联网的人并不总是记录每个相关细节,即使他们已经找到并认为这是重要的。
然而,研究存在一些限制,仅评估了对信息的获取而非实际应用,未探讨LLM在新型生物武器开发中的潜在贡献。此外,所使用的GPT-4模型缺乏互联网研究和高级数据分析工具,因此结果只能被视为初步的。
国内首例AI外挂案告破 涉案金额达3000万元
据余江公安公众号消息,余江公安网安大队成功打击了一起涉及AI外挂的案件。这款AI外挂在FPS游戏中广泛使用,可以帮助玩家在游戏中获得压倒性的优势。该外挂不需要修改游戏程序和代码,只需要合适的显卡配置和配合特定硬件设备即可使用。站长网2023-09-22 11:55:250000突发!微软正与OpenAI洽谈,140亿美元投资股权
华尔街日报独家消息,微软正与OpenAI进行140亿美元的投资股权谈判。除了股权之外,微软作为OpenAI的最大股东,其转型之后在公司治理、发展方面有多少实际的控制权也是谈判重点。特别是微软退出OpenAI董事会后,整个谈判流程非常复杂、繁琐。为了更好地理清这些,双方都带了金融谈判专家进场,微软找了摩根士丹利,OpenAI则找了高盛。0000AI日报:Claude 3.5 Sonnet不免费了;海螺AI上线音乐和视频生成;360AI 助手推出模型竞技场
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、Claude3.5Sonnet对免费用户关闭?站长网2024-09-03 15:10:040000生数科技发布自研多模态通用大模型 同时推出PixWeaver、VoxCraft等工具
9月20日,生数科技发布了自主研发的多模态通用大模型,并同时推出了两款应用产品:视觉创意设计平台PixWeaver和3D资产创建工具VoxCraft。站长网2023-09-21 09:08:550003Perplexity 推出新功能 Pages,帮助用户生成定制化网页
划重点:-Perplexity的新功能Pages可以根据用户提示生成定制化的网页,帮助用户进行研究和写作。-Pages利用Perplexity的AI搜索模型找到信息,并创建可以发布和分享的研究报告。-用户可以根据需要将写作针对初学者、专家读者或更普遍的受众群体。站长网2024-05-31 19:47:320000