谷歌搜索推出EdiT5 具备语法检查功能
要点:
谷歌搜索引擎引入了名为EdiT5的文本编辑AI模型,具备语法检查功能,提高了搜索结果的语法准确性和速度。
EdiT5模型采用了一种革命性的方法,将语法错误校正视为文本编辑问题,采用T5Transformer编码-解码架构,大大减少了解码步骤,降低了延迟。
通过精心的数据训练和模型大小的优化,EdiT5模型在语法错误校正性能方面表现出色,同时具有低延迟。
谷歌搜索引擎引入了一项革命性的语法校正功能,由EdiT5模型提供支持,该模型采用了一种创新的方法来解决复杂的语法错误校正问题,旨在提高搜索结果的语法准确性和速度。传统上,语法错误校正一直被视为翻译问题,使用自回归变换器模型。
虽然有效,但这种方法在自回归解码方面存在效率问题,限制了并行处理能力。EdiT5团队重新构想了语法错误校正问题,将其视为文本编辑问题,并采用了T5Transformer编码-解码架构,大大减少了解码步骤,降低了延迟。该模型使用编码器来确定哪些标记保留或删除,生成草稿输出,然后可以使用非自回归指针网络进行可选的重新排序,解码器仅插入草稿中缺少的标记,大大减少了传统翻译型语法错误校正的处理时间。
论文地址:https://aclanthology.org/2022.findings-emnlp.156.pdf
为了进一步提高解码速度,团队将解码器简化为单层,同时增加了编码器的大小,这一战略性的调整有效地平衡了工作负载,并使EdiT5模型取得了惊人的平均延迟仅为4.1毫秒的成绩。在公开的BEA语法错误校正基准测试中,性能评估显示了EdiT5的卓越性能,一个具有391百万参数的大型EdiT5模型优于一个具有248百万参数的T5基础模型,提高了F0.5分数,这是用于测量校正准确性的指标,这一改进伴随着显著的9倍加速,展示了该模型的卓越效率。
研究还强调了模型大小在生成准确的语法校正中的关键作用,团队利用一种称为硬蒸馏的技术,将大型语言模型(LLMs)的优势与EdiT5的低延迟相结合,通过培训教师LLM并利用它为学生EdiT5模型生成培训数据,确保了准确性和速度之间的强大协同作用。开发过程还包括对训练数据的精细调优,以确保最佳性能。培训集由不符合语法要求的源句子和符合语法要求的目标句子组成,经过严格的自我培训和迭代改进,有效地消除了不必要的改写、人工制品和语法错误,从而产生更清晰、更一致的培训数据。
最终,实施了两个基于EdiT5的模型:一个语法错误校正模型和一个语法分类器。当用户使用语法检查功能时,查询经过模型校正后由分类器验证。这两步过程确保用户只会看到准确的校正建议,减少了错误或混淆建议的风险。谷歌搜索引擎引入了EdiT5模型提供支持的语法检查功能,为高效和准确的语法校正设定了新的标准。
用户现在可以在搜索中包含“语法检查”短语,自信地评估其查询的语法正确性。这一自然语言处理的里程碑再次证明了谷歌提高用户体验和提供可靠、精确搜索结果的承诺。这项革命性的发展将改变我们在搜索引擎中进行语法校正的方式,使我们能够更自信地表达自己的需求。
制作已故亲人的AI视频业务在中国迅速兴起
人们在家庭成员去世后,越来越多地寻求通过人工智能生成的虚拟形象来处理他们的悲痛。孙凯每周都会与母亲进行一次视频通话。他会向她倾诉工作上的压力,中年男性面临的困境,以及一些连妻子都未曾分享的想法。偶尔,母亲会发表评论,比如嘱咐他要照顾好自己——他是她唯一的孩子。但大多数时候,她只是在听。图源备注:图片由AI生成,图片授权服务商Midjourney站长网2024-05-14 09:19:370001努比亚Z50S Pro外观公布:配备定制Sensor和专业光学镜头
努比亚Z50SPro的发布引起了广泛的关注。这款新机的外观设计非常吸引人,采用了复刻相机设计,并配备了全新的定制Sensor和专业的光学镜头。首先,努比亚Z50SPro采用了类似于相机镜头的圆形设计,并且配备了专业的光学镜头。此外,该机还采用了罕见的横向设计,并在背部采用了拼接方案,使得整个设备看起来非常精致。直角中框和直屏设计也使得这款手机的视觉效果非常出色。站长网2023-07-17 23:38:100000华为开发者大会2024:历经5年研发 华为发布自研仓颉编程语言
站长之家(ChinaZ.com)6月21日消息:在今日的华为开发者大会2024上,华为终端BG软件部总裁龚体发表了重要演讲,向全球开发者正式介绍了华为自研的仓颉编程语言,并发布了HarmonyOSNEXT仓颉语言开发者预览版。这是华为首次公开发布仓颉编程语言,标志着其在编程语言领域的重要突破。0000马斯克:特斯拉低成本新车型研发已取得相当深入进展
站长之家(ChinaZ.com)1月25日消息:特斯拉近日公布了2023年的财务报告,全年总营收达到967.73亿美元(约合6928.95亿元人民币),同比增长19%。在财报发布后的电话会议上,特斯拉CEO埃隆·马斯克透露,特斯拉在研发一款新的低成本汽车方面取得了“相当深入的进展”,但他并未透露具体细节或发布时间。马斯克明确表示,他不会在业绩电话会议上讨论新产品发布。站长网2024-01-25 09:43:530000鸿海规划新增五到六条生产线来迎合 AI 服务器客户的强劲需求
鸿海集团旗下的鸿百科技在备货iPhone15新机时,其AI服务器相关业务需求同步强劲。为此,鸿海集团规划新增五到六条生产线来迎合AI服务器客户的要求。站长网2023-06-13 14:07:560000