Google 升级 Gmail 人工智能垃圾邮件过滤器:RETVec 现能有效识别并处理「对抗性文本操纵」
站长之家(ChinaZ.com) 12 月 5 日消息:Google 在其安全博客上宣布,Gmail 的垃圾邮件过滤功能经历了近年来最大规模的升级。这一升级主要体现在一种名为 RETVec(Resilient & Efficient Text Vectorizer,弹性高效文本向量化器)的新文本分类系统上。
Google 表示,RETVec 能有效识别并处理「对抗性文本操纵」,这类邮件通常包含特殊字符、表情符号、拼写错误和其他杂乱字符,过去这些内容对人类而言易于理解,但机器难以辨识。
此前,包含大量特殊字符的垃圾邮件往往能轻易绕过 Gmail 的防御。但随着 RETVec 技术的升级,用户反映表示近几个月这类邮件不再是问题。
RETVec 的独特之处在于,它不仅能够处理像「恭喜!您的彩票账户中有 1000 美元余额」这样的直接的垃圾邮件,还能识别出更为复杂的「对抗性文本操纵」。例如,邮件主题「𝐂𝐡𝐞𝐜𝐤_𝐘𝐨𝐮𝐫_𝐀𝐜𝐜𝐨𝐮𝐧𝐭」之所以看起来加粗,是因为它使用了类似「数学粗体大写 C」这样的 Unicode 字符。这些字符虽然看似普通拉丁字母,但实际上并非如此,使得传统垃圾邮件过滤器难以识别。
Google 表示,RETVec 的高效性体现在其对字符级操纵的弹性,包括字符插入、删除、拼写错误、同形异义字、LEET 替代等。RETVec 模型基于一种能够高效编码所有 UTF-8 字符和单词的新型字符编码器。因此,RETVec 能够立即适用于 100 多种语言,无需查找表或固定的词汇量。
Google 强调,与使用固定词汇量或同形异义字查找表的传统方法相比,RETVec 的资源利用率大大降低。此外,RETVec 的开源特性使其有望广泛应用于世界各地,消除同形异义字攻击的威胁。
RETVec 采用类似于人类阅读的方式,通过机器学习 TensorFlow 模型识别单词的视觉「相似性」,而非其实际字符内容。Google 的测试表明,使用 RETVec 替换 Gmail 垃圾邮件分类器原有的文本向量化器,使得垃圾邮件检测率提高了 38%,误报率降低了 19.4%。同时,RETVec 的部署使模型的 TPU 使用率降低了 83%,使其成为近年来最大规模的防御升级之一。
据 Google 透露,RETVec 已在内部测试了一年时间,并已经部署到用户的 Gmail 账户中。
特斯拉三季度盈利超预期:特斯拉发布2024年第三季度财报
特斯拉于今日发布了2024财年第三季度的财务报告。报告显示,特斯拉第三季度的总营收达到251.82亿美元,相较于去年同期的233.50亿美元增长了8%。尽管与上一季度的255.00亿美元相比有所下降,但归属于普通股股东的净利润却实现了显著增长,从去年同期的18.53亿美元增至21.67亿美元,增长了17%,与上一季度的14.78亿美元相比,增长同样显著。0000科大讯飞公布讯飞星火认知大模型官网 将于5月6日发布
今日,科大讯飞正式公布了讯飞星火认知大模型官网(xinghuo.xfyun.cn)。据介绍,讯飞星火认知大模型通过海量文本、代码和知识的学习,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。只需一个指令,便可以懂你所言、答你所问、创你所需、解你所难、学你所教。据了解,讯飞星火认知大模型将于5月6日正式发布。站长网2023-04-24 16:11:02000139Keras 3.0正式发布 引入全新的大模型训练和部署功能
要点:经过5个月的更新迭代,Keras3.0全面支持TensorFlow、JAX和PyTorch,实现了对Keras的完全重写。Keras3.0的API可用于JAX、TensorFlow和PyTorch,支持跨框架的数据pipeline,使用户可以选择最适合其目标的框架。Keras3.0引入了新的大模型训练和部署功能,支持各种预训练模型,并高度向后兼容Keras2.0,用户可以平滑过渡。站长网2023-11-29 14:16:010000AI初创公司Galileo推新工具,可解释AI大模型的幻觉现象
文章概要:1.美国AI初创公司Galileo发布新工具,帮助用户更好地理解和解释大型语言模型(LLMs)的输出,特别是幻觉现象。2.GalileoStudio现在具备实时监测功能,允许用户评估输入和输出,提供新指标和防护措施以优化LLMs的性能。3.Galileo还引入了"接地性"指标,用于确定模型输出是否与训练数据相关,以区分幻觉和模型输出的真实性。站长网2023-09-20 11:42:150002王小川旗下百川智能发布Baichuan-53B大模型
据新浪科技消息,今日,王小川旗下百川智能宣布发布大模型产品Baichuan-53B。Baichuan-53B定位闭源大模型,目前在写作、文本创作能力方面,已经达到行业最好的水平。Baichuan-53B主要面向B端用户提供服务,发布后,该大模型也将启动内测,预计下个月将会开放API等相关组件。据悉,在此之前,百川智能发布了Baichuan-7B、Baichuan-13B两个通用大语言模型。站长网2023-08-08 14:43:480000