一周打完1000场官司,中科院发布AI法庭AgentCourt
在人工智能重塑各个行业的今天,法律界也迎来了前所未有的变革。传统的法律实践面临着效率低下、成本高昂等挑战,而AI技术的出现为解决这些问题提供了新的可能。
从最初斯坦福小镇火遍全网,25个由大语言模型(LLMs)驱动的智能体生活交友,打开了多Agent新视角。
而现在,AI法庭也来了!
最近,来自中科院深圳先进研究院的研究团队开发了一个名为AgentCourt的模拟智能法庭,
它是一个基于大语言模型(LLMs)的法庭模拟系统,旨在通过AI驱动的虚拟法庭来革新法律教育、案例分析和法律研究。

论文地址:https://doi.org/10.48550/arXiv.2408.08089
代码:https://github.com/relic-yuexi/AgentCourt
AgentCourt实战演示:https://b23.tv/e6eQMfM
该系统能够模拟完整的法庭程序。法官、原告律师、辩护律师以及其他参与者均由大型语言模型驱动的自主代理扮演。他们的主要目标是通过模拟法庭流程来帮助律师代理学习如何有效辩论案件,并提高其整体法律专业技能。

该篇文章的主要贡献有:
1. 全面模拟,真实再现
AgentCourt不仅仅是一个模拟工具,它是一个高度复杂的系统,能够精确模拟民事法庭的设置,实现多方互动和复杂的法律推理。这是首次将AI技术应用于法庭环境模拟中,为法律教育和实践提供了前所未有的可能性。
2. 对抗性交互,强化法律推理
在AgentCourt的模拟过程中,大型语言模型(LLMs)的法律推理能力通过智能体之间的对抗性交互得到了显著增强。这种利用对抗性多智能体交互的方法,不仅超越了简单的信息传递,更为未来的相关研究提供了新的视角和思路。
3. 高效模拟,真实案例验证
该工作成功模拟了1,000个中国真实的民事案例,这些案例在AgentCourt中仅用数天时间完成,而在现实世界中,这可能需要律师们花费十年时间。通过自动和人工评估方法,验证了智能体进化的有效性。
为了尽量真实的模拟法庭,研究人员设置了以下的人物:
1. 原告与被告代理
模拟开始于案件发生之前,两名由ERNIE-Speed-128K驱动的代理分别扮演潜在的原告和被告。一旦涉及案件,他们将自动寻求律师事务所的法律援助,这是法律纠纷中的典型行为。系统配置使得原告或被告在与律师的互动中可以直接获得诉状或答辩状,无需从头起草。
2. 律师代理
设计了两名律师代理,同样由ERNIE-Speed-128K驱动。当原告和被告在律师事务所寻求帮助时,这些律师代理将被随机分配为原告律师和被告律师。他们与各自的客户沟通,收集案件相关信息,并利用丰富的法律经验、案例先例和法定代码,按照规定程序进行法庭辩论,维护各自客户的利益。
3. 法官代理
在法庭中,法官负责监督整个过程,听取双方律师的论点,并在适当时候提问。最终,法官总结并评估律师的每一轮论点,然后作出最终判决。
4. 法庭书记员代理
为了创造更真实的法庭环境并促进代理的进化,他们设计了法庭书记员代理,负责宣布审判的开始和记录审判的全过程。

这些由大模型驱动的Agent,可以根据初始数据,自发地进行法庭的模拟,而无需任何人工的监督。
研究人员利用中国裁判文书网的数据,编译了一个包含10,000个民事判决的数据集。预处理的重点是提高数据集质量,精心清洗并选择了1,389个高质量案例,这些案例同时包含原告的诉求和被告的辩护。
为了解决潜在的重复问题,他们采用了BERT进行「案件介绍」部分的语义向量化,并使用K-Means聚类对相似文档进行分组。这产生了1,000个代表性文档,用于模拟法庭训练和测试。
数据生成与匿名化
利用ERNIE-Speed-128K API(百度智能云文档2024)生成并匿名化高保真模拟文本,这些文本专门针对民事判决。这产生了一个精选的数据集,包含1,000个训练样本和50个测试样本,旨在支持模拟法庭环境中强大的法律论证和判决预测,从而推进法律分析技术。
通过这些严格的数据处理步骤,AgentCourt确保了模拟环境的真实性和数据的可靠性,为法律AI的发展奠定了坚实的基础。
在得到数据后,各个Agent各司其职,根据一定的流程展开法庭的辩论。该论文的模拟过程如下:

在模拟完1000个民事案例后,原告律师和被告律师的能力都得到了很大的提升,文章中的自动评估和人工评估展示了实验结果:
实验基于1,000个真实世界的民事案件,通过自动评估和人工评估两种方式,全面检验了AgentCourt系统的效能。自动评估采用了LawBench评估标准,涵盖了法律知识的记忆、理解和应用三个层面。人工评估则由经验丰富的法律专家进行,评估了智能体的思维敏捷性、专业知识性和逻辑严谨性。
实验结果显示,在AgentCourt中经历了数千次对抗性法律案件模拟(相当于现实世界律师十年的工作经验),律师代理在处理法律任务的能力上有了显著提升。无论是在自动评估还是人工评估中,进化后的代理都展现出了更快的响应速度、更深的法律知识和更强的逻辑推理能力,在复杂案件分析、法律推理和辩论策略上,部分AI律师甚至超越了人类专家的表现。


就像自动评估中的Article Recitation任务,经过进化后的律师Agent可以较好的背诵出指定法律的内容。而未经进化的律师就只能「阿巴阿巴」了。

AgentCourt的出现在未来可能对法律行业产生深远影响:
1. 法律教育革新: 为法律院校提供高度仿真的实践平台,学生可与顶级AI律师对战,快速积累经验。
2. 提高司法效率: AI辅助可以加速案件预审、证据分析等流程,减轻法官和律师的工作负担。
3. 降低法律服务成本: AI律师助手可以处理大量初级工作,使优质法律服务更加平价可及。
4. 推动法律研究: 海量案例模拟为法学研究提供了前所未有的数据支持,助力发现新的法律模式和理论。
5. 伦理挑战: AI在法律领域的应用也带来了一系列伦理问题,如决策过程的透明度、AI偏见的控制等,需要社会各界共同探讨。
参考资料:
https://github.com/relic-yuexi/AgentCourt
苹果Vision Pro将于4月在中国上市 首批货源紧张
据供应链消息人士透露,苹果公司将于今年4月份在中国大陆地区正式发售其首款VR头显产品VisionPro。消息人士称,工信部注册流程已接近完成,首批在华销售货源可能会比较紧张。苹果CEO库克在2月2日访问纽约第五大道AppleStore时,曾被问及VisionPro在中国上市的具体时间。库克当时并未给出确切日期,但他表示:“很快了。”站长网2024-02-06 14:56:240000特斯拉发布2023年全年财报:营收967.73亿美元 同比增长19%
站长之家(ChinaZ.com)1月25日消息:特斯拉公布了2023年的全年财报。报告显示,该公司在2023年总营收达到967.73亿美元,同比增长19%。其中,第四季度营收为251.67亿美元,同比增长3%。站长网2024-01-25 08:51:300000微信问一问搜索功能开始内测 进行种子用户招募
近日,微信“问一问”开启内测,进行种子用户招募。优质创作者即可报名体验,填写招募信息后,官方人员将会逐一筛选,让更多创作者参与。据了解,在问一问,创作者可以浏览微信内用户的常见问题,并对感兴趣的问题进行回答。优质的答案会在用户搜索相关问题时进行展现,帮助更多人解答问题。站长网2023-06-03 16:23:160001漫画平台快看成立AIGC事业部
今日,国内漫画平台快看正式成立AIGC事业部。快看世界创始人兼CEO陈安妮在内部信中表示,快看期待且相信Al一定能为内容产业带来新的机会乃至颠覆式的生态体系变革。据了解,快看创办于2014年,是中国年轻人的国漫IP平台和分享社区。截止到2021年8月,快看总用户超过3.4亿,月活接近5000万。2021年8月,快看融资2.4亿美元,创下行业纪录。目前,公司已经累计完成融资超过40亿元。站长网2023-04-27 16:50:130001特朗普遇袭刷屏照片,版权是视觉中国的?视觉中国回应
这两天的一个大新闻——特朗普遭遇枪击。一时间,相关照片和视频在网络上疯传。其中,一组特朗普高举拳头,耳旁流血的照片更是颇具艺术感,并且被广泛传播。据了解,这组照片出自普利策新闻奖得主,美联社摄影记者埃文·武奇之手。一时间,埃文·武奇几乎被全世界关注和讨论,大家都知道那张经典照片是出自他手了。埃文·武奇也在自己的多个社交平台发布了他拍摄的特朗普遇袭相关照片。。站长网2024-07-15 16:45:360000