研究揭示:ChatGPT不能让业余人员成为优秀的编程者
文章概要:
1. 针对Flappy Bird的一项实验表明,AI无法轻松让非程序员创建复杂游戏。
2. 实验中,使用Python和ChatGPT生成Flappy Bird游戏的35次尝试,并未找到稳定的生成方法。
3.改进方法,包括尝试不同编程语言、更精确的提示和更有效地整合ChatGPT。
近日,一项关于使用OpenAI的ChatGPT进行游戏编程的研究在网上引起了广泛关注。该研究通过生成Flappy Bird游戏35次,试图验证AI是否能够让非程序员轻松创建复杂的游戏应用程序。然而,研究结果表明,AI编程并不像人们想象的那么容易。
实验由DiverSE研究小组进行,他们使用Python编程语言和ChatGPT3.5以及4版本进行了多次尝试。研究涵盖了不同的提示和策略,包括:
简单描述游戏的提示、提供详细功能列表、简要描述最重要的功能、提供完整的代码示例并寻求匹配提示,以及在不查看中间代码的情况下使用一系列提示生成代码。
然而,研究人员并未找到一个能够始终生成可玩游戏的"魔法提示"。有些尝试生成了可玩的游戏,无需额外的技术干预,但许多会话导致了需要修复代码的无法使用的游戏。

图源备注:图片由AI生成,图片授权服务商Midjourney
有趣的是,即使使用相同的提示,ChatGPT也生成了完全不同的代码版本,产生了完全不同的结果。研究小组称输出质量存在显著的不一致性,有时甚至会陷入死局。
研究还发现,虽然技术知识有限的业余者可以利用ChatGPT创建游戏,但在没有编程知识的情况下,这几乎不可能系统地实现。通常需要直接介入代码以修复错误。如果游戏从一开始就处于糟糕状态,那么在没有编程知识的情况下修复它会更加困难,因为缺乏视觉反馈。如果无法阅读代码,只能指出在游戏中可见的错误,但如果游戏无法运行,这种可能性就会消失。

在实验过程中,ChatGPT经常将问题拆分并将占位符插入代码中,而不更新实施。这对开发人员有益,但对最终用户来说,游戏是不完整且无法使用的。
研究小组强调了ChatGPT在编程中的好处,包括为游戏提供新的变体或独特功能的灵感,将生成的代码用作起点,以及最终用户有时能够创建有趣的、有时可运行的游戏。
对于解决这些问题,研究小组建议尝试使用不同的编程语言、寻找更好的提示或更好地控制ChatGPT的语言,并改进将ChatGPT输出更有效地整合到开发环境中以节省时间。他们还提到,关于35个使用GPT-3.5和GPT-4通过ChatGPT生成的会话、代码、观察和结果的详细信息都可以在GitHub上找到。
这项研究揭示了使用AI编程工具来创建复杂游戏应用程序的挑战,尽管有潜力,但远没有达到一种轻松的程度。AI在编程领域的应用仍然需要进一步的研究和改进,以使非程序员能够更轻松地创建复杂的程序。
实验项目网址:https://github.com/diverse-project/enduserprogrammingLLM/
旅游网站Expedia 利用人工智能挑战 Google 旅行搜索主导地位
据外媒报道,Expedia旅游网站日前宣布,将进一步整合人工智能技术,旨在让用户在其平台上进行全面的旅行搜索,摆脱对外部搜索引擎的依赖。该公司计划通过利用大数据和机器学习,根据用户的过往旅行经历,为其推荐个性化的旅行目的地,以吸引更多直接流量。0000百度文库上线“智能漫画”“智能画本”功能 可一句话生成漫画
百度文库在2024年的Create2024百度AI开发者大会上发布了全新的「智能漫画」和「智能画本」功能,标志着内容创作迈入了跨模态时代。这些功能让用户只需输入一句话就能在几分钟内创作出漫画或画本,从创意激发到内容生成实现了全链路创作路径的打通。用户还可以通过发布作品和分享获取收益,甚至兼职赚钱。在家庭教育中,父母可以利用「智能画本」为孩子创作专属故事,增强亲子之间的交流和互动。站长网2024-04-19 14:23:210000AI公司Cohere宣布计划明年将伦敦员工数量增加一倍
划重点:🔍Cohere计划在未来一年内将伦敦全球研究中心的员工数量翻倍,达到约50人。🔍顶尖AI研究人员WojciechGaluba加入由Cohere首席科学家PhilBlunsom领导的伦敦团队。🔍Cohere认为伦敦是重要的研究中心之一,并加大在该市场的团队建设力度。站长网2023-11-01 16:53:250000微软开源GraphRAG:极大增强大模型问答、摘要、推理
7月3日,微软在官网开源了基于图的RAG(检索增强生成)——GraphRAG。为了增强大模型的搜索、问答、摘要、推理等能力,RAG已经成为GPT-4、Qwen-2、文心一言、讯飞星火、Gemini等国内外知名大模型标配功能。传统的RAG系统在处理外部数据源时,只是简单地将文档转换为文本,将其分割为片段,然后嵌入到向量空间中,使得相似的语义对应相近的位置。站长网2024-07-03 09:00:050001老黄深夜炸场,世界最强AI芯片H200震撼发布!性能飙升90%,Llama 2推理速度翻倍,大批超算中心来袭
【新智元导读】刚刚,英伟达发布了目前世界最强的AI芯片H200,性能较H100提升了60%到90%,还能和H100兼容。算力荒下,大科技公司们又要开始疯狂囤货了。英伟达的节奏,越来越可怕了。就在刚刚,老黄又一次在深夜炸场——发布目前世界最强的AI芯片H200!较前任霸主H100,H200的性能直接提升了60%到90%。站长网2023-11-14 08:59:500000