当AI学会了闻味儿，人类就可以少工作70年

站长网2023-09-23 10:35:540阅

不知道有多少人还记得Google Nose。

这个谷歌在 2013 年愚人节上线的搞怪项目声称有一个包含 1500 万种味道的气味资料库，用户只需要在谷歌搜索框输入关键词，点击“闻一闻”，就能直接在电脑旁闻到该物体的味道，比如新车的味道，篝火的味道，以及埃及古墓的味道（？）等等。

就是这个十年前离谱但脑洞大开的玩笑，正在被它的发明者部分变成现实。

今年 9 月初的《科学》杂志刊登了一篇由初创公司Osmo（从谷歌分拆）和莫奈尔化学感官中心（Monell Chemical Senses Center）等多个研究团队共同发布的论文，其中称，AI模型可以让机器拥有比人类更好的“嗅觉”。

乍一听这简直太不可思议了，毕竟对大众来说，嗅觉是比视觉和听觉抽象得多的存在。RGB颜色图谱可以描述人眼看到的色彩，人耳听到的声音也可以转化为不同频率的波长，甚至让人感受到震动，但唯独嗅觉，看不见摸不着，更难以用量化的指标描述。

换句话说，把气味数字化听起来就是件不可能的事。

而这篇论文的研究人员核心要做的，正是去试图创建一个能够如实反映气味特征的人类嗅觉高维图谱，即POM（Principle Odor Map）。

那么具体是怎么做的呢？

我们知道，气味是人类嗅觉系统对散布于空气中的某些特定分子的感应。气味分子进入鼻孔后，会与鼻腔上方的嗅觉细胞产生（受体）反应，产生的生物电波再通过神经传到大脑，继而识别味道。

而气味的构成实际要比色彩、声音复杂得多，有数以百万计的不同种类，每种气味又都由数百个化学分子组成，其性质各不相同。与之相应地，人类的功能性嗅觉受体有大约 400 个，远远超过了我们用于视觉的 4 个，以及用于味觉的约 40 个。

所以面对如此复杂的嗅觉机制，研究人员首先做的事情就是创建了一个机器学习模型——消息传递神经网络（MPNN）。

模型示意图

这是一种特定的图神经网络（GNN），因为图神经网络是一种基于图结构的深度学习方法，将传统的图分析引入，提供了对非规则数据提取特征的方法，因而也非常适合用来学习复杂的气味特征。

模型搭好之后，接下来就要喂给它学习材料。

研究人员结合了Good Scents and Leffingwell & Associates（GS-LF）香精香料数据库，建立了一个包含约 5000 个分子的参考数据集作为训练基础素材，每个分子可以有多个气味标签，比如果味、花香、芝士味和薄荷味等等。

GS-LF数据库中的部分分子

通过将分子的形状结构作为数据输入，模型得以输出最能描述某种气味的对应气味词。

为了使训练结果更准确，研究者同样用到了各种方法来优化模型参数。比如将GS-LF香精香料数据库按照8： 2 的比例划分为训练集和测试集，训练集被进一步划分为五个交叉验证的子集；以及使用贝叶斯优化算法对数据进行交叉验证，并对GNN模型的超参数进行优化等。

实验最终将形成如下的嗅觉高维图谱POM（局部）：

这张图直观表示了每种气味的感知距离，比如花香（floral）、肉味（meaty）和酒香（ethereal）几个大类彼此间是存在较大感知距离的；但每个大类下包括的更具体的气味，比如花香下的百合花香（muguet）、薰衣草香（lavender）和茉莉花香（jasmine），感知距离则较为接近。

论文将POM和此前有过研究先例的基于摩根指纹的气味空间图（Morgan fingerprint-based maps）进行了对比，发现后者尚无法体现上述感知距离：

为了进一步验证模型训练效果，研究者接着找来了 15 位气味专家，来和模型比拼谁识别气味更准确。

15 位专家每人需要闻 400 种气味，研究者会给出 55 个气味形容词，让他们就每种气味对这 55 个选项用1- 5 分来打分，评定每个气味形容词在多大程度上适合于这个气味。

结果发现，对于其中53%的测试分子，模型的表现都优于小组成员的平均值。

研究者还将模型的预测结果按气味描述词进行了分类，发现除麝香外，模型对分子气味的预测结果均在人类组的误差分布中，且在 30 个气味描述词的预测结果中优于人类组中位数：

后续，研究者还对模型的性能进行了反复验证，获得了较为稳定的分子结构-气味关系。

下面就进入到了最激动人心的气味图谱大规模绘制环节，并最终得到了下面这张图：

你可以把上文那个表示气味感知距离的坐标图理解成是这张图的无限放大版。论文提到，这张图中包含了约 50 万种气味分子，当中甚至有许多还没有被发现或合成出来（但确实能计算出来）。

做个更直观的比较，如果让一名训练有素的人类评价员寻找这些气味，大概需要连续工作 70 年才可以全部收集到。

看起来，这篇论文着实是完成了一件大事。

这时就有网友发问了，机器为什么需要闻气味呢？

其他人也纷纷给出了自己的见解，比如认为可以用于工厂污水处理的质量控制，进行爆炸物、毒品或是尸体的嗅探等等：

这样一来警犬和搜救犬可能要下班了

有人希望可以据此研发出一款好的除臭剂，因为人在进行大量有氧运动比如跑步或举重后会散发出不好的气味：

也有人对这一研究成果在医疗方面的应用很感兴趣，比如可以用来开发嗅觉丧失症的新疗法，或者通过气味检测疾病等等：

还有香水行业的从业者觉得这帮了自己大忙，“让它告诉我的同事什么时候他们喷了太多古龙水”：

这些预测事实上都不无道理。首先机器确实可以帮人类解决有时对气味辨别不准确的问题——研究表明，每个人对气味的感知程度都各不相同，会根据感觉和生理信号引发不同反应，其中也受到经验、期望、个性或情境因素的影响。

而气味某些时候对人来说又十分重要。

不好的气味就不用说了，某些有害气体还可能会危害健康，这时如果可以有机器代替某些特定职业帮助人类或动物作业就再好不过。

而对另一些气味可以为之带来好处的职业，比如调香师、厨师、设计师、艺术家和建筑师等等，也有调配出更具功能性的气味的需要。一些场合会将气味应用在环境中，比如纽约Sloan-Kettering癌症中心会在空气中散布香草油，以降低患者对于磁共振成像（MRI）测试的幽闭恐惧症；芝加哥期货交易也会散布特定的香味以降低交易大厅的噪音分贝。

还有研究表明，人类大多数与气味有关的记忆都来自婴儿及幼儿时期的最初十年，而语言和视觉所产生的记忆通常在10- 30 岁之间产生。这部分解释了气味可以唤起人遥远的回忆，而且透过气味所引起的回忆，经常比视觉或听觉所引起的回忆，更加情绪倾向。

所以气味和人类的联系还是非常紧密的，只是我们在很多时候并不容易察觉。

网友们的猜想也在论文的作者之一、来自Osmo公司的Alex Wiltschko那里得到了验证。他在发布在Osmo官网的一篇文章中写道，

“气味图谱是我们实现更远大目标的基础。如果可以开发出能够复制我们鼻子或狗的鼻子的功能系统，我们就可以尽早发现疾病；人工智能也将帮助医生找到更有可能在临床上取得成功的药物，更好地帮助合成化学家和调香大师进行工作……我们未来的工作目标是，为改善人类健康和幸福奠定坚实的科学和商业基础。”

不过他也表示，论文依然存在诸多不足。

比如，无法体现分子气味的浓淡，只能预测它闻起来是什么样；只对单个分子气味进行了预测，现实生活中更多却是混合气味；而即便是所有的能力都达到了，对气味的复制和还原也将是很大的挑战等等。

最后，说了这么多，有一个网友的评论倒是很朴实，“我觉得这会让品酒失去乐趣”：

当AI学会了闻味儿人类就可以少工作70年

0000

评论列表

共(0)条

相关推荐

花上百万加盟，遍地开花的俄货店，藏着绥芬河商人的“生意经”
“战斗民族”俄罗斯，正在抢占年轻人的社交平台。新一代旅游顶流是“花600元坐通往俄罗斯的雪国列车”和“比芬兰挪威更有性价比的追极光”，刷屏社交平台获赞上千的还有“西伯利亚大仓鼠（棕熊）合影”和“俄罗斯猛男指导开坦克”.......毗邻中国的俄罗斯，堪称中国年轻人的“网红景点”。
站长网站长资讯2024-12-26 09:40:41
0000
站长资讯
押注元宇宙的 Facebook 梦想破灭生成式人工智能兴起
元宇宙技术曾风靡一时，但随着生成式人工智能技术的兴起，元宇宙业务逐渐被科技业界所抛弃。2021年，Facebook创始人马克·扎克伯格将公司更名为Meta，元宇宙技术成为科技界的痴迷对象。然而，缺乏连贯的产品愿景最终导致元宇宙走向衰落。扎克伯格的模糊承诺和缺乏清晰的商业问题解决方案使得元宇宙无法吸引用户。
站长网2023-05-09 15:33:50
0000
站长资讯
确认！已有 116 个 AI 大模型通过国家备案
划重点:📝国家互联网信息办公室发布《生成式人工智能服务已备案信息的公告》。📝116个AI大模型通过备案确认，意味着它们已符合相关规范并可在中国境内合法应用。📝生成式人工智能应用或功能上线后需公示备案信息，包括模型名称及备案号。
站长网2024-04-19 09:15:01
0000
通义千问开源：大模型时代“虹吸效应”的开始
12月1日，阿里云举办发布会，正式发布并开源“业界最强开源大模型”通义千问720亿参数模型Qwen-72B。同时，通义千问开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。至此，通义千问共开源18亿、70亿、140亿、720亿参数的4款大语言模型，以及视觉理解、音频理解两款多模态大模型，实现了“全尺寸、全模态”开源。
站长网站长资讯2023-12-05 17:57:48
0002
站长资讯
首搭易三方技术平台！腾势Z9 GT预售：33.98万起
快科技8月20日消息，今日晚间，比亚迪举办2024腾势汽车科技日暨腾势Z9GT预售发布会。腾势Z9GT共推出5款车型，有三厢和两厢两种造型，插混车型有三款，售价区间为33.98-41.98万元；纯电版有两款，售价分别为35.98万和38.98万元。新车将于9月初开启全国的试驾，九月下旬正式上市，上市即交付；三厢版的腾势Z9，预计四季度上市即交付。
站长网2024-08-20 23:31:38
0000