当AI学会了闻味儿,人类就可以少工作70年
不知道有多少人还记得Google Nose。
这个谷歌在 2013 年愚人节上线的搞怪项目声称有一个包含 1500 万种味道的气味资料库,用户只需要在谷歌搜索框输入关键词,点击“闻一闻”,就能直接在电脑旁闻到该物体的味道,比如新车的味道,篝火的味道,以及埃及古墓的味道(?)等等。
就是这个十年前离谱但脑洞大开的玩笑,正在被它的发明者部分变成现实。
今年 9 月初的《科学》杂志刊登了一篇由初创公司Osmo(从谷歌分拆)和莫奈尔化学感官中心(Monell Chemical Senses Center)等多个研究团队共同发布的论文,其中称,AI模型可以让机器拥有比人类更好的“嗅觉”。
乍一听这简直太不可思议了,毕竟对大众来说,嗅觉是比视觉和听觉抽象得多的存在。RGB颜色图谱可以描述人眼看到的色彩,人耳听到的声音也可以转化为不同频率的波长,甚至让人感受到震动,但唯独嗅觉,看不见摸不着,更难以用量化的指标描述。
换句话说,把气味数字化听起来就是件不可能的事。
而这篇论文的研究人员核心要做的,正是去试图创建一个能够如实反映气味特征的人类嗅觉高维图谱,即POM(Principle Odor Map)。
那么具体是怎么做的呢?
我们知道,气味是人类嗅觉系统对散布于空气中的某些特定分子的感应。气味分子进入鼻孔后,会与鼻腔上方的嗅觉细胞产生(受体)反应,产生的生物电波再通过神经传到大脑,继而识别味道。
而气味的构成实际要比色彩、声音复杂得多,有数以百万计的不同种类,每种气味又都由数百个化学分子组成,其性质各不相同。与之相应地,人类的功能性嗅觉受体有大约 400 个,远远超过了我们用于视觉的 4 个,以及用于味觉的约 40 个。
所以面对如此复杂的嗅觉机制,研究人员首先做的事情就是创建了一个机器学习模型——消息传递神经网络(MPNN)。
这是一种特定的图神经网络(GNN),因为图神经网络是一种基于图结构的深度学习方法,将传统的图分析引入,提供了对非规则数据提取特征的方法,因而也非常适合用来学习复杂的气味特征。
模型搭好之后,接下来就要喂给它学习材料。
研究人员结合了Good Scents and Leffingwell & Associates(GS-LF)香精香料数据库,建立了一个包含约 5000 个分子的参考数据集作为训练基础素材,每个分子可以有多个气味标签,比如果味、花香、芝士味和薄荷味等等。
通过将分子的形状结构作为数据输入,模型得以输出最能描述某种气味的对应气味词。
为了使训练结果更准确,研究者同样用到了各种方法来优化模型参数。比如将GS-LF香精香料数据库按照8: 2 的比例划分为训练集和测试集,训练集被进一步划分为五个交叉验证的子集;以及使用贝叶斯优化算法对数据进行交叉验证,并对GNN模型的超参数进行优化等。
实验最终将形成如下的嗅觉高维图谱POM(局部):
这张图直观表示了每种气味的感知距离,比如花香(floral)、肉味(meaty)和酒香(ethereal)几个大类彼此间是存在较大感知距离的;但每个大类下包括的更具体的气味,比如花香下的百合花香(muguet)、薰衣草香(lavender)和茉莉花香(jasmine),感知距离则较为接近。
论文将POM和此前有过研究先例的基于摩根指纹的气味空间图(Morgan fingerprint-based maps)进行了对比,发现后者尚无法体现上述感知距离:
为了进一步验证模型训练效果,研究者接着找来了 15 位气味专家,来和模型比拼谁识别气味更准确。
15 位专家每人需要闻 400 种气味,研究者会给出 55 个气味形容词,让他们就每种气味对这 55 个选项用1- 5 分来打分,评定每个气味形容词在多大程度上适合于这个气味。
结果发现,对于其中53%的测试分子,模型的表现都优于小组成员的平均值。
研究者还将模型的预测结果按气味描述词进行了分类,发现除麝香外,模型对分子气味的预测结果均在人类组的误差分布中,且在 30 个气味描述词的预测结果中优于人类组中位数:
后续,研究者还对模型的性能进行了反复验证,获得了较为稳定的分子结构-气味关系。
下面就进入到了最激动人心的气味图谱大规模绘制环节,并最终得到了下面这张图:
你可以把上文那个表示气味感知距离的坐标图理解成是这张图的无限放大版。论文提到,这张图中包含了约 50 万种气味分子,当中甚至有许多还没有被发现或合成出来(但确实能计算出来)。
做个更直观的比较,如果让一名训练有素的人类评价员寻找这些气味,大概需要连续工作 70 年才可以全部收集到。
看起来,这篇论文着实是完成了一件大事。
这时就有网友发问了,机器为什么需要闻气味呢?
其他人也纷纷给出了自己的见解,比如认为可以用于工厂污水处理的质量控制,进行爆炸物、毒品或是尸体的嗅探等等:
有人希望可以据此研发出一款好的除臭剂,因为人在进行大量有氧运动比如跑步或举重后会散发出不好的气味:
也有人对这一研究成果在医疗方面的应用很感兴趣,比如可以用来开发嗅觉丧失症的新疗法,或者通过气味检测疾病等等:
还有香水行业的从业者觉得这帮了自己大忙,“让它告诉我的同事什么时候他们喷了太多古龙水”:
这些预测事实上都不无道理。首先机器确实可以帮人类解决有时对气味辨别不准确的问题——研究表明,每个人对气味的感知程度都各不相同,会根据感觉和生理信号引发不同反应,其中也受到经验、期望、个性或情境因素的影响。
而气味某些时候对人来说又十分重要。
不好的气味就不用说了,某些有害气体还可能会危害健康,这时如果可以有机器代替某些特定职业帮助人类或动物作业就再好不过。
而对另一些气味可以为之带来好处的职业,比如调香师、厨师、设计师、艺术家和建筑师等等,也有调配出更具功能性的气味的需要。一些场合会将气味应用在环境中,比如纽约Sloan-Kettering癌症中心会在空气中散布香草油,以降低患者对于磁共振成像(MRI)测试的幽闭恐惧症;芝加哥期货交易也会散布特定的香味以降低交易大厅的噪音分贝。
还有研究表明,人类大多数与气味有关的记忆都来自婴儿及幼儿时期的最初十年,而语言和视觉所产生的记忆通常在10- 30 岁之间产生。这部分解释了气味可以唤起人遥远的回忆,而且透过气味所引起的回忆,经常比视觉或听觉所引起的回忆,更加情绪倾向。
所以气味和人类的联系还是非常紧密的,只是我们在很多时候并不容易察觉。
网友们的猜想也在论文的作者之一、来自Osmo公司的Alex Wiltschko那里得到了验证。他在发布在Osmo官网的一篇文章中写道,
“气味图谱是我们实现更远大目标的基础。如果可以开发出能够复制我们鼻子或狗的鼻子的功能系统,我们就可以尽早发现疾病;人工智能也将帮助医生找到更有可能在临床上取得成功的药物,更好地帮助合成化学家和调香大师进行工作……我们未来的工作目标是,为改善人类健康和幸福奠定坚实的科学和商业基础。”
不过他也表示,论文依然存在诸多不足。
比如,无法体现分子气味的浓淡,只能预测它闻起来是什么样;只对单个分子气味进行了预测,现实生活中更多却是混合气味;而即便是所有的能力都达到了,对气味的复制和还原也将是很大的挑战等等。
最后,说了这么多,有一个网友的评论倒是很朴实,“我觉得这会让品酒失去乐趣”:
华为余承东:问界全系车型实现智驾全国都能开
华为余承东在微博中宣布,问界汽车的全系车型今日迎来了重磅的OTA升级,其中M9车型更是成功解锁了无需依赖高精地图的城区NCA功能。这一重要突破,标志着问界全系车型在智能驾驶方面迈出了坚实的一步,实现了全国范围内的智能驾驶体验,让驾驶更加便捷与舒适。站长网2024-03-19 17:23:480000尴尬!谷歌手动删除搜索中奇怪的 AI 回答
划重点:-谷歌的AIOverview产品在推出时出现了一些怪异回答,导致谷歌需要手动禁用特定搜索的AIOverviews。-一些用户在社交媒体上发布了各种有趣的回答,但很快就被删除。-这个失误显示了AI领域竞争的艰难性,以及在AI技术完善之前进行优化的风险。站长网2024-05-27 14:56:160000德国新闻主播成为AI投资骗局中Deepfake滥用的受害者
德国知名新闻主播AndréSchünke最近成为Deepfake滥用的受害者。骗子利用他们的数码复制品在Facebook上的虚假宣传视频中做广告,宣传一个AI支持的投资平台,承诺巨大的利润。这些视频使用了新闻主播真实的声音克隆,看起来非常逼真。0000IBM研究表明:未来三年,40%工人将因AI需要重新学习技能
本文概要:1.研究显示,高管预计40%的员工需要重新学习技能,以适应人工智能和自动化的发展。2.初级员工将面临最大的变革,77%的高管认为他们将受到生成式人工智能的影响。3.87%的高管认为员工更有可能被人工智能增强而不是被取代。站长网2023-08-21 16:18:450000AI图像缩放器Pixelhunter 适用于社交媒体
Pixelhunter是一种基于AI的图像缩放器,适用于社交媒体,可针对各种平台优化图像。它能自动调整大小,支持102种尺寸,并使用对象识别和裁剪功能。体验地址:https://pixelhunter.io/站长网2023-08-07 15:36:190000