首页站长资讯Google 升级 Gmail 人工智能垃圾邮件过滤器：RETVec 现能有效识别并处理「对抗性文本操纵」

Google 升级 Gmail 人工智能垃圾邮件过滤器：RETVec 现能有效识别并处理「对抗性文本操纵」

站长网2023-12-05 11:48:190阅

站长之家(ChinaZ.com) 12 月 5 日消息：Google 在其安全博客上宣布，Gmail 的垃圾邮件过滤功能经历了近年来最大规模的升级。这一升级主要体现在一种名为 RETVec（Resilient & Efficient Text Vectorizer，弹性高效文本向量化器）的新文本分类系统上。

Google 表示，RETVec 能有效识别并处理「对抗性文本操纵」，这类邮件通常包含特殊字符、表情符号、拼写错误和其他杂乱字符，过去这些内容对人类而言易于理解，但机器难以辨识。

此前，包含大量特殊字符的垃圾邮件往往能轻易绕过 Gmail 的防御。但随着 RETVec 技术的升级，用户反映表示近几个月这类邮件不再是问题。

RETVec 的独特之处在于，它不仅能够处理像「恭喜！您的彩票账户中有 1000 美元余额」这样的直接的垃圾邮件，还能识别出更为复杂的「对抗性文本操纵」。例如，邮件主题「𝐂𝐡𝐞𝐜𝐤_𝐘𝐨𝐮𝐫_𝐀𝐜𝐜𝐨𝐮𝐧𝐭」之所以看起来加粗，是因为它使用了类似「数学粗体大写 C」这样的 Unicode 字符。这些字符虽然看似普通拉丁字母，但实际上并非如此，使得传统垃圾邮件过滤器难以识别。

Google 表示，RETVec 的高效性体现在其对字符级操纵的弹性，包括字符插入、删除、拼写错误、同形异义字、LEET 替代等。RETVec 模型基于一种能够高效编码所有 UTF-8 字符和单词的新型字符编码器。因此，RETVec 能够立即适用于 100 多种语言，无需查找表或固定的词汇量。

Google 强调，与使用固定词汇量或同形异义字查找表的传统方法相比，RETVec 的资源利用率大大降低。此外，RETVec 的开源特性使其有望广泛应用于世界各地，消除同形异义字攻击的威胁。

RETVec 采用类似于人类阅读的方式，通过机器学习 TensorFlow 模型识别单词的视觉「相似性」，而非其实际字符内容。Google 的测试表明，使用 RETVec 替换 Gmail 垃圾邮件分类器原有的文本向量化器，使得垃圾邮件检测率提高了 38%，误报率降低了 19.4%。同时，RETVec 的部署使模型的 TPU 使用率降低了 83%，使其成为近年来最大规模的防御升级之一。

据 Google 透露，RETVec 已在内部测试了一年时间，并已经部署到用户的 Gmail 账户中。

Google升级 Gmail人工智能垃圾邮件过滤器RETVec现能有效识别并处理对抗性文本操纵

0000

评论列表

共(0)条

相关推荐

特斯拉三季度盈利超预期：特斯拉发布2024年第三季度财报
特斯拉于今日发布了2024财年第三季度的财务报告。报告显示，特斯拉第三季度的总营收达到251.82亿美元，相较于去年同期的233.50亿美元增长了8%。尽管与上一季度的255.00亿美元相比有所下降，但归属于普通股股东的净利润却实现了显著增长，从去年同期的18.53亿美元增至21.67亿美元，增长了17%，与上一季度的14.78亿美元相比，增长同样显著。
站长网站长资讯2024-10-24 08:32:05
0000
站长资讯
科大讯飞公布讯飞星火认知大模型官网将于5月6日发布
今日，科大讯飞正式公布了讯飞星火认知大模型官网（xinghuo.xfyun.cn）。据介绍，讯飞星火认知大模型通过海量文本、代码和知识的学习，拥有跨领域的知识和语言理解能力，能够基于自然对话方式理解与执行任务。只需一个指令，便可以懂你所言、答你所问、创你所需、解你所难、学你所教。据了解，讯飞星火认知大模型将于5月6日正式发布。
站长网2023-04-24 16:11:02
000139
站长资讯
Keras 3.0正式发布引入全新的大模型训练和部署功能
要点:经过5个月的更新迭代，Keras3.0全面支持TensorFlow、JAX和PyTorch，实现了对Keras的完全重写。Keras3.0的API可用于JAX、TensorFlow和PyTorch，支持跨框架的数据pipeline，使用户可以选择最适合其目标的框架。Keras3.0引入了新的大模型训练和部署功能，支持各种预训练模型，并高度向后兼容Keras2.0，用户可以平滑过渡。
站长网2023-11-29 14:16:01
0000
站长资讯
AI初创公司Galileo推新工具，可解释AI大模型的幻觉现象
文章概要:1.美国AI初创公司Galileo发布新工具，帮助用户更好地理解和解释大型语言模型（LLMs）的输出，特别是幻觉现象。2.GalileoStudio现在具备实时监测功能，允许用户评估输入和输出，提供新指标和防护措施以优化LLMs的性能。3.Galileo还引入了"接地性"指标，用于确定模型输出是否与训练数据相关，以区分幻觉和模型输出的真实性。
站长网2023-09-20 11:42:15
0002
站长资讯
王小川旗下百川智能发布Baichuan-53B大模型
据新浪科技消息，今日，王小川旗下百川智能宣布发布大模型产品Baichuan-53B。Baichuan-53B定位闭源大模型，目前在写作、文本创作能力方面，已经达到行业最好的水平。Baichuan-53B主要面向B端用户提供服务，发布后，该大模型也将启动内测，预计下个月将会开放API等相关组件。据悉，在此之前，百川智能发布了Baichuan-7B、Baichuan-13B两个通用大语言模型。
站长网2023-08-08 14:43:48
0000