陶哲轩:初学者不宜用AI工具做专家级任务,GPT对专家帮助不大
近几个月来,著名数学家陶哲轩一直尝试用 ChatGPT 等大模型 AI 工具来辅助解决数学问题,并与大家分享结果、交流心得,比如用 ChatGPT 写代码、证明数学定理、生成 LaTeX 表达式程序代码等。
对于自己的研究以及人们来说,GPT 等 AI 工具的作用究竟大不大呢?近两天,陶哲轩似乎得出了他的结论。
陶哲轩发现,虽然 AI 工具对自己研究中的核心数学部分并不是那么有用(或者可能只是因为不想在自认为可以熟练完成的任务上尝试),但是在生成代码和创建论文中的流程图初稿(他使用了自己过去很少用的 LaTeX 包 (tikz))等任务中都非常有用。
总的来说,他发现 GPT 允许自己为一项计算任务抽象出特定语言,比如 Python、SAGE、正则表达式、LaTeX 等。他可以用自然语言向 GPT 表达自己的请求,然后 GPT 会以合适的语言提供适当的代码。尽管在没有完全集成的情况下,他依然必须将 GPT 输出内容复制粘贴到可以编译的文档中。
陶哲轩承认 GPT 开始改变他的工作流程,过去会避免使用代码密集型解决方案来解决任务,但现在这种状况正在消失。他发现自己更愿意将编码作为日常工作的一部分了。
就拿 GitHub Copilot 而言,陶哲轩惊喜地发现,在使用 VSCode LaTeXworkshop 设置后,它可以自动完成标准信函了。仅给出开头段落和接下来的句子,Copilot 提供的其余段落与他实际要写的内容非常接近。并且通过对 Copilotshuchu 内容的小修小改,他可以将完成标准信函的时间省掉一大半。
陶哲轩分享了自己在论文中使用自动完成功能的一张截图。在尝试自动完成证明大纲时,Copilot 确实引用了论文其余部分的相关结果,但随后给出了一些随机分析数论的废话。
到目前为止,除了一些非常短的自动完成工作或编写重复的文本模式之外,他发现 Copilot 在写数学论文时更有趣而不是有用,但未来可能会有令他惊讶的效果。
事实证明,GPT 提供的正则表达式虽然没有按照陶哲轩想要的方式来处理嵌套分隔符,但足够接近。他可以在自己阅读正则表达式文档后调整成想要的。在他看来,需要一定的正则表达式技能才能完成类似的任务,但要比没有 GPT 辅助时所需要的技能少。
一般来说,GPT 似乎允许人们在基于文本的任务中提升自己的技能,但随着技能水平的提高,「收益」递减。完全不熟悉任务的人可能会通过 GPT 成为高级初学者,初学者可以达到中级技能水平,中级水平的人可能会成为专家,至少在某些方面是这样。但对于专家而言,使用 GPT 进一步提供的收益相对不大。
因此,陶哲轩不建议初学者使用 AI 工具来完成专家级的任务,因为无法正确地对输出进行检查。不过他也认为,人们可以用 AI 工具来完成比正常水平高出一个技能水平的任务,这样有足够的能力来检查输出的结果,并决定是否接受或者额外调整。
有人问了,万一人们没有清楚意识到这种技能水平上的差距呢?陶哲轩表示,他相信随着 AI 工具变得越来越熟悉,大多数人会对这些工具能做什么、不能做什么有更准确的心理模型,并进行相应的校准。
当然陶哲轩也同意对公众展开 AI 教育以及进行独立的输出验证,这些都会成为现代世界越来越重要的技能。
你赞同陶哲轩的观点吗?
原文链接:https://mathstodon.xyz/@tao/111024521278833999
360智脑大模型2.0将于6月13日14点发布
360官方宣布,360智脑大模型2.0将于6月13日14点正式发布,具备技术优势、搜索增强优势、场景优势、大模型安全优势、数据优势、工程化优势、内容安全优势、算力优势等人工智能研发领域八大优势。据悉,“360智脑”为360自研千亿参数大语言模型,在此前多项测评中已具备认知智能通用大模型能力。2023年4月,“360智脑”结合360搜索、智能硬件等优势场景的落地应用已陆续成熟,并开放内测。站长网2023-06-12 17:12:570000理想汽车宣布全新价格:MEGA降价3万元 售价52.98万元
理想汽车今日宣布,自2024年4月22日起,其旗下2024款理想L7、理想L8、理想L9及理想MEGA将采用全新的价格体系。无论是新定购的用户还是已定购但尚未交付的用户,均可享受这一新价格政策。此举无疑将进一步推动理想汽车在市场上的竞争力,满足更多消费者的需求。站长网2024-04-22 09:33:520000400万人在线抢华为三折叠像买彩票 客服回应:建议保持理性
华为最新发布的三折叠手机MateXT引发了市场的极大关注,目前预约人数已突破500万,使得原价购买这款手机的难度堪比中彩票。尽管该手机起售价接近2万元,被称为华为史上最贵的手机,但这并未阻挡消费者的热情,许多人正准备抢购。站长网2024-09-13 17:31:270000月入25万,批量AI美女,收割中年男人的钱包
号称“最难被电商撬动”的中年男人们,拜倒在了AI美女们的石榴裙下。“中年男人不如狗”这句话,一直被视为是中年男性在消费鄙视链里的真实写照。爱捯饬的女人买化妆品、买衣服,居家的女人买厨具、买食物,但一提到男人,似乎就是“保温杯里泡枸杞”或者“一把钓杆打天下”。而在内容平台上,一批面容姣好,身材傲人的AI美女达人,却把炯炯目光对准了一向备受忽视的中年男人们。站长网2024-03-22 16:38:010000长安汽车申请“SLGPT”“DEEPALGPT”商标
天眼查App显示,近日,长安汽车申请注册“SLGPT”“DEEPALGPT”商标,国际分类涉及广告销售、科学仪器,当前商标状态均为申请中。昨日,长安汽车与腾讯在重庆签署深化战略合作协议。双方将在此前合作基础之上,围绕智能座舱、导航及地图、自动驾驶、海外生态、企业数字化转型等多领域加强合作,共同推动更高质量的数字化转型,助力长安汽车拓展海外市场。站长网2023-07-12 16:23:470001