用大模型读取你的想法,并转化成文本!恐怖的DeWave模型
悉尼科技大学的科研人员,通过大语言模型、EEG(大脑活动检测工具)、脑机接口等技术,开发了一个可自动读取人类想法,并转化成文本的AI大模型——DeWave。
DeWave的使用方法非常简单,用户只需要戴上EEG,然后开启你的思维活动,DeWave就能将你的想法直接翻译成文本,就像现实版的《读心人》非常“恐怖”。
相比马斯克的Neuralink脑机接口芯片,DeWave使用更加简单方便,无需做昂贵的手术植入芯片,通过海量数据训练的大模型就能将脑电波翻译成文本。
DeWave可帮助那些无法说话的脑血栓、中风、聋哑人等,可与正常人进行交流,目前翻译的准确率在40%左右。其实这个产品用于谈恋爱场景也不错,双方都带上这个,再也不怕对方撒谎了。
值得一提的是,该研究已经被全球顶级机器学习大会“NeurIPS”,评选为重要论文。
论文地址:https://arxiv.org/abs/2309.14030v3
DeWave功能展示
其实这项技术与去年10月19日,Meta发布的通过MEG(另外一种大脑活动检测工具)重构人类大脑成像过程有点类似。都是通过EEG、MEG等工具捕获大脑微弱活动电流,检测这些磁场变化,然后获得脑部活动数据。
获得原始大脑数据后,研究人员就可以用大语言模型等对其进行解码,提取重要的视觉、文本信息。所以,获取大脑活动数据是翻译、重构人类想法、思维画面的关键基础。
Meta的论文地址:https://ai.meta.com/static-resource/image-decoding
DeWave简单介绍
DeWave的核心技术思路是,将连续的脑电波信号转化为离散的编码,然后输入预训练的大语言模型进行文本翻译。
首先,通过向量量化变分编码器的结构,将接收到的脑电波信号,转换成一系列向量化的特征表示。
然后,这些特征表示会被进一步转化为一系列离散的代码,每个代码都对应码本里的一个离散词向量。码本就像一个字典,里面有限个数的离散词向量。特征表示通过在码本中找到最匹配的那个离散词向量,来获得对应的离散代码。
在得到一系列离散代码之后,就可以像处理语言词向量一样,输入到预训练的大语言模型,最终生成翻译的文本内容。
DeWave训练流程
DeWave的训练流程主要分为三个阶段:1)自监督编码器预训练(仅原始EEG脑磁波),这一阶段会先训练一个脑电波自编码模型,输入原始EEG波形,通过重建实现自监督。这样可以提取有用的时域和频域特征。
2)编码器和码本训练,固定好波形编码器后,训练Transformer编码器与离散码本,获得稳定可分离的脑电波表示。
3)端到端微调,解冻大语言模型允许端到端训练。在编码器引导下微调BART模型,实现EEG到文本的生成。需要注意的是,对词级特征输入并不需要第一阶段的预训练,可以直接从第二阶段开始。
DeWave局限性
研究人员表示,DeWave模型在将脑电波转化为文本的任务中取得了一定的成果,但也存在一些局限性。
依赖于预训练大语言模型:DeWave在实现脑电波到文本的转换过程中使用了预训练大语言模型,如BART。
这意味着DeWave方法的性能受限于预训练语言模型的质量和能力。如果预训练语言模型不够准确或不具备广泛的语言理解能力,可能会影响到DeWave方法的翻译性能。
对平行数据的依赖性:DeWave方法在训练过程中需要使用平行的脑电波和文本对数据,以进行监督学习。
然而,获取大规模的平行数据对于某些任务可能是困难的或成本较高的。因此,如果缺乏足够的平行数据,DeWave方法的性能可能会受到限制。
对标记的依赖性:尽管DeWave方法在文中声称可以在没有标记(如眼动追踪)的情况下实现脑电波到文本的翻译,但它仍然依赖于基于标记的对齐过程。
DeWave使用了事件标记来将脑电波分割成单词级别的特征,这可能导致在没有标记的情况下无法准确地对脑电波进行分割和翻译。
悉尼科技大学首席研究员兼DeWave作者, Chin-Teng Lin表示,DeWave是第一个将离散编码集成在大脑到文本翻译领域的产品,引入了一种创新的神经解码方法。同时与大语言模型的集成,也开辟了神经科学和AI相结合的全新探索。
什么是EEG
EEG 是电脑图(Electroencephalogram) 的缩写,它是一种记录大脑电活动的检测方法。EEG 主要是通过头皮上的电极来捕捉大脑神经细胞之间通信的微小电信号。
大脑活动产生电流,当神经细胞(神经元)被激活时,它们会产生电信号。EEG 检测的是大量神经元同步活动所产生的电位变化。主要用于科学研究、脑部检测、脑部疾病治疗等。
什么是MEG
MEG,全称为脑磁图(Magnetoencephalography),是一种神经成像技术,用于测量大脑活动中产生的极微弱的磁场。MEG能够提供关于大脑功能的空间和时间信息。
MEG的工作原理是基于生物电活动产生磁场的物理原理。当大脑中的神经元活动时,它们会产生微小的电流,这些电流会产生相应的磁场。
MEG设备使用一种非常灵敏的传感器,称为超导量子干涉设备(SQUIDs),来检测这些微小的磁场。
MEG主要应用:定位脑功能、研究大脑通信、诊断和治疗规划、研究神经发育和疾病等。
昆仑万维AI Agents开发平台「天工SkyAgents」开放测试
12月25日,昆仑万维AIAgents开发平台「天工SkyAgents」Beta版正式开放测试(https://model-platform.tiangong.cn/)。「天工SkyAgents」基于昆仑万维的「天工大模型」,具备自主学习和独立思考能力。用户可以通过自然语言构建自己的私人助理,并将不同任务模块化,实现执行各种任务。站长网2023-12-25 18:54:380000网信办等三部门:加快推进大模型、生成式人工智能标准研制
近日,中央网信办、市场监管总局、工业和信息化部联合印发《信息化标准建设行动计划(2024—2027年)》(以下简称《行动计划》),要求加强统筹协调和系统推进,健全国家信息化标准体系,提升信息化发展综合能力,有力推动网络强国建设。站长网2024-05-29 17:58:000000无屏幕人工智能可穿戴设备 Humane AI Pin 的四大功能:旨在取代智能手机
HumaneAIPin于上周四正式亮相,向公众展示了这款无屏幕AI可穿戴设备的更多细节,该设备旨在取代智能手机。Humane由前苹果员工ImranChaudhri和BethanyBongiorno领导,直到本周一直保持隐秘状态,使AIPin成为计算未来的热点话题。当然,这是否能与iPhone一样具有革命性,目前尚待观察。站长网2023-11-13 18:54:190000微博App推出图片机型水印边框功能
近日,有网友发现,微博悄然上线了图片信息边框功能。该功能类似于小米等手机厂商推出的“定制画框”,有需要的用户可以在微博APP“写微博”→“选中图片”→下一步→点击下面的“边框”图标→点击“图片信息”中添加。微博图片边框可以显示手机型号、拍照位置、快门参数、曝光补偿等多种照片信息。有需要的小伙伴可以来试试哦!站长网2023-06-29 19:07:300000苹果发布 iOS 15.7.5.、macOS 11.7.6 和 macOS 12.6.5 安全更新
苹果公司今天推送了新的iOS15.7.5.macOSBIGSur11.7.6和macOSMonterey12.6.5更新,新软件为那些运行旧版Mac、iPad和iPhone的用户引入了安全改进,这些软件无法更新到iOS16.iPadOS16和macOSVentura。站长网2023-04-12 12:38:410000