摘要: 芬兰的研究人员利用机器学习开发出一种技术,可以在你阅读时读取你的脑信号来捕捉你的兴趣点。未来涌现的数据越来越多,人们又将如何智能地筛分导航信息呢?所以面对堆积如山的 MBs(数据流量),我们需要更好的方式 ...
芬兰的研究人员利用机器学习开发出一种技术,可以在你阅读时读取你的脑信号来捕捉你的兴趣点。
未来涌现的数据越来越多,人们又将如何智能地筛分导航信息呢?所以面对堆积如山的 MBs(数据流量),我们需要更好的方式去过滤分流数字内容。
芬兰的研究人员一直关注这个问题,并且已经使用脑电图(electroencephalogram,EGG)感知器监控人们阅读 Wiki 文章时的脑信号,并将它与经过训练的机器学习模型结合起来去解析 EEG 数据,同时识别出阅读者感兴趣的概念。这个研究团队使用该技术生成了一列关键词,这些关键词是阅读者读到包含信息的地方时心理上标记下来(mentally flag)的。这些关键词之后可用于预测与这个阅读者相关的其他 Wiki 文章。或者线下帮助过滤一条社交媒体回复,或者为增强现实用户实时标记出一条符合其兴趣的内容。
「我们已经探索了搜索过程中人类大脑中产生的信号,」研究者 Tuukka Ruotsalo 说。「现在我们想要采集极端(extreme)的信号,我们能尝试直接读取使用者大脑中的兴趣和注意吗?」
该团队来自赫尔辛基信息技术研究所(HIIT),认为这是研究人员首次展示了基于直接从脑信号中提取关联推荐新信息。「现在有很多脑机接口研究,但通常... 主要研究的都是向计算机作出明确的命令,」Ruotsalo 说。「所以那就意味着,你想控制房间里的光线和你在做一个明确的模式时,你正在尝试明确地做一些事情,然后计算机就要试着从大脑中读取这些你要做的事情。」
「在我们的研究中,这些是自然进行的。你只要阅读就好,我们不会让你在读到一个兴奋的单词时去拉左右胳膊。你就是在阅读,同时因为文本中有些地方与你相关,我们能让机器学习与文本唤起的事件匹配的大脑信号,并使用这些信号,」他补充道。
你只需要读你的书就好,计算机会挑出你阅读中的兴趣点或者有关联的地方。
「所以在某种意义上,它是纯粹的被动互动。你只要阅读,计算机会挑出你阅读中的兴趣点或者有关联的地方。」
虽然这是一个研究,只有 15 名测试者和一个脑电帽(EEG cap),没人愿意在实验室之外的地方戴上那个帽子,但是它可以让我们窥探到未来的可能性。一旦有了高质量的 EGG 感知器(人人都能戴的可穿戴智能帽子?),让整个过程不再那么麻烦,并且可切实结合机器学习软件,经过训练后能掌握一点读心术时,它就能走出实验室了。
「如果你只研究纯粹的信号无视其他事情,那就难了,」Ruotsalo 解释道,他指出该团队没有通过跟踪任何物理上的身体移动比如眼球运动来解释兴趣。他们对关联的理解仅仅是基于他们的机器学习模型解析 EEG 脑波。
「这是一个真正具有挑战性的机器学习任务。你需要训练这个系统来探测它。有很多像移动或眼球运动这样更加容易的东西... 能在信号中真实地看到。这次你真正要做的是把它从噪音中找出来。」
Ruotsalo 说他们在数据量适度的数据集上训练模型,只使用了平均 120 词的 6 个文件,每个文件都用来为其对应的测试对象建立模型。实验还包括使用少量的初始化监督学习,使用的是每个维基百科文章的前六个句子。据 Ruotsalo 表明,在未来的研究中他们想看看是否可以在没有任何监督学习下达到同等实验结果。
虽然「兴趣」的概念是相当广泛的,它可能是由读者因各种不同原因在心理上标记的一个关键词,他强调人们已经经过有效地训练来以这种方式导航信息,因为他们已经习惯使用通过这种兴趣信号的语言来实现的数字服务。
Ruotsalo 接着说:「这就是现在我们在数字世界中所做的。我们点赞或者点击链接和搜索引擎,只要我们点击了,它们就认为这是里面一定有什么。这就使得在没有任何明确的行动下也能获取我们的兴趣,所以你其实是从大脑中读取维基百科的。」
那么这就意味着当人们在阅读相当大小的文本时从他们的思维中提取出兴趣信号是可能的。如果你考虑如何在一个人沉浸于某个内容时使用定制营销信息来抓取他的兴趣,那么这就有点恐怖了(dystopic)。所以换句话来说,将目标广告真正读取的是你的意图,而不只是你的点击。
Ruotsalo 希望未来将技术应用于其他更好的商业用途。
「例如在有大量的信息需要处理,很多事情需要控制、记忆的工作任务中,这可以作为一种支持 agent 类型的软件,并且标记上『这对用户很重要』,然后能以后提醒用户:『记得查阅这些你发现有趣的事情』,」他建议道。「这样的用户建模能在一个真正的信息密集型任务中自动提取特征是很重要的。
「即使是搜索类型的场景,你正在与你的环境进行交互,在投影机上查看数字内容,我们同样可以看到你对它的兴趣,然后它可以自动检测并为你注释或推送个性化内容」
「我们已经在数字世界中留下了各种痕迹。我们正在研究过去看过的文档,并可能会粘贴一些我们以后想要再查看的数字内容,但是所有这些都可以自动记录。然后,我们表达的各种偏好,不论是评级还是其他什么,都能用于不同的服务建模。他补充说:「看来,现在所有这一切都可以通过从大脑中读取」。
这并不是他们团队第一次参与解决搜索和信息超载问题。Ruotsalo 也是构建 SciNet 视觉检测搜索接口的研究人员,后来由这项技术成立了一家商业公司 Etsimo。
「信息检索或推荐是一种过滤问题,所以我们试图过滤信息,来找到到底什么是有趣的或相关的。他补充说:「我认为这是现在最大的问题之一,所有这些新的系统只是推送我们不一定想要的事情。」
我来说两句排行榜