Google 升级 Gmail 人工智能垃圾邮件过滤器:RETVec 现能有效识别并处理「对抗性文本操纵」
站长之家(ChinaZ.com) 12 月 5 日消息:Google 在其安全博客上宣布,Gmail 的垃圾邮件过滤功能经历了近年来最大规模的升级。这一升级主要体现在一种名为 RETVec(Resilient & Efficient Text Vectorizer,弹性高效文本向量化器)的新文本分类系统上。
Google 表示,RETVec 能有效识别并处理「对抗性文本操纵」,这类邮件通常包含特殊字符、表情符号、拼写错误和其他杂乱字符,过去这些内容对人类而言易于理解,但机器难以辨识。
此前,包含大量特殊字符的垃圾邮件往往能轻易绕过 Gmail 的防御。但随着 RETVec 技术的升级,用户反映表示近几个月这类邮件不再是问题。
RETVec 的独特之处在于,它不仅能够处理像「恭喜!您的彩票账户中有 1000 美元余额」这样的直接的垃圾邮件,还能识别出更为复杂的「对抗性文本操纵」。例如,邮件主题「𝐂𝐡𝐞𝐜𝐤_𝐘𝐨𝐮𝐫_𝐀𝐜𝐜𝐨𝐮𝐧𝐭」之所以看起来加粗,是因为它使用了类似「数学粗体大写 C」这样的 Unicode 字符。这些字符虽然看似普通拉丁字母,但实际上并非如此,使得传统垃圾邮件过滤器难以识别。
Google 表示,RETVec 的高效性体现在其对字符级操纵的弹性,包括字符插入、删除、拼写错误、同形异义字、LEET 替代等。RETVec 模型基于一种能够高效编码所有 UTF-8 字符和单词的新型字符编码器。因此,RETVec 能够立即适用于 100 多种语言,无需查找表或固定的词汇量。
Google 强调,与使用固定词汇量或同形异义字查找表的传统方法相比,RETVec 的资源利用率大大降低。此外,RETVec 的开源特性使其有望广泛应用于世界各地,消除同形异义字攻击的威胁。
RETVec 采用类似于人类阅读的方式,通过机器学习 TensorFlow 模型识别单词的视觉「相似性」,而非其实际字符内容。Google 的测试表明,使用 RETVec 替换 Gmail 垃圾邮件分类器原有的文本向量化器,使得垃圾邮件检测率提高了 38%,误报率降低了 19.4%。同时,RETVec 的部署使模型的 TPU 使用率降低了 83%,使其成为近年来最大规模的防御升级之一。
据 Google 透露,RETVec 已在内部测试了一年时间,并已经部署到用户的 Gmail 账户中。
英伟达发布Nemotron-4 15B: 8 万亿训练数据,性能超LLaMA-2
**划重点:**1.🌐Nemotron-415B拥有150亿参数,基于8万亿文本标注数据预训练,在多领域测试中超越同类大小的开源模型,尤其在代码语言准确率上表现出色。2.🧠采用标准Transformer架构,结合自注意力、全局注意力和多头注意力等机制,以及旋转位置编码技术,提升模型表达和泛化能力。站长网2024-03-07 14:50:250000拼多多市值超越阿里 成美股市值最大的中概股
截至北京时间12月1日凌晨美股收盘,拼多多成功超越阿里巴巴,成为在美国上市的中国公司中市值最高的企业。拼多多的收盘价格上涨了4.03%,报收于147.44美元,市值达到了1959亿美元。而阿里巴巴同日的涨幅微乎其微,仅为0.25%,收盘价为74.86美元,市值为1907亿美元。越来越多的人开始使用拼多多进行购物,而淘宝、天猫、京东等竞争对手的市场份额受到了一定程度的挤压。站长网2023-12-01 09:53:040000苏宁易购与百度电商达成深度合作 共同探索AI智能电商领域
苏宁易购宣布与百度电商以618为契机达成深度合作。苏宁易购全品类上百万款商品将接入百度电商,合作内容涉及搜索、直播、视频、商城等。后续双方或将共同探索智能电商领域。此次双方达成合作,百度电商依托苏宁易购家电3C等优质品类和品牌资源,可进一步强化商品供应能力,快速建立涵盖3C数码、美妆个护、食品酒水等不同行业的12个一级类目,2000多个品牌,10万个SKU的自闭环核心商品池,形成交易心智。站长网2023-06-15 12:26:530000中国移动业绩出炉:移动客户达到9.90亿户 5G套餐用户7.5亿
中国移动近日发布了其2023年前三季度的财务报告。该公司在前三季度实现了7756亿元的营运收入,同比增长率为7.2%;EBITDA为2685亿元,同比增长率为6.7%;股东应占利润为1055亿元,同比增长率为7.1%。其中,中国移动的移动客户数达到了9.90亿户,其中包括了7.5亿户的5G套餐用户。同时,有线宽带客户的数量也达到2.95亿户。站长网2023-10-22 09:25:290000Snap宣布在最新的AR开发平台Lens Studio 5.0集成ChatGPT功能
Snap宣布在最新的AR开发平台LensStudio5.0版本中集成了ChatGPT功能,这一举措在极大地增强了增强现实(AR)技术的趣味性和效率。借助ChatGPT,Snap的开发者们现在能够更轻松地创造出更加有趣、科普、对话和创意性质的Snapchat镜头。这包括通过ChatGPT创建的无限测验和随机生成的镜头,以及根据用户的语音提示自动应用滤镜和导演模式来改变相机风格。站长网2023-11-13 17:20:330000