导读 卡迪夫大学的科学家创造了一种尖端的人工智能(AI)系统,可以准确地预测一个人最有可能看到的图像区域。基于人脑的力学及其区分图像不同部分...

卡迪夫大学的科学家创造了一种尖端的人工智能(AI)系统,可以准确地预测一个人最有可能看到的图像区域。

基于人脑的力学及其区分图像不同部分的能力,研究人员表示,这种新型系统比以前任何东西都更准确地代表了人类的视觉。

新系统的应用范围从机器人、多媒体通信和视频监控到自动图像编辑和在医学图像中查找肿瘤。

卡迪夫大学的多媒体计算研究小组现在正计划通过帮助放射科医生在医学图像中发现病变来测试该系统,其总体目标是提高医疗诊断的速度,准确性和灵敏度。

该系统已在《神经计算》杂志上发表。

能够集中注意力是人类视觉系统的重要组成部分,它使我们能够选择和解释特定场景中最相关的信息。

世界各地的科学家一直在使用计算机软件来尝试重建这种能力,以挑选出图像中最突出的部分,但到目前为止,成功率参差不齐。

在他们的研究中,该团队使用了一种称为卷积神经网络的深度学习计算机算法,该算法旨在模仿人脑中相互连接的神经元网络,并专门针对视觉皮层进行建模。

这种类型的算法非常适合将图像作为输入,并能够为图像本身中的各种对象或方面分配重要性。

在他们的研究中,该团队利用了一个巨大的图像数据库,其中每张图像已经被人类评估或查看,并使用眼动追踪软件分配了所谓的“感兴趣区域”。

然后将这些图像输入算法,并使用一种称为深度学习的AI,系统慢慢开始从图像中学习,然后可以准确地预测图像的哪些部分最突出。

新系统针对七个已经在使用的最先进的视觉显著性系统进行了测试,并显示出在所有指标上都更胜一筹。

该研究的合着者,来自卡迪夫大学计算机科学与信息学院的Hantao Liu博士说:“这项研究表明,我们的尖端系统使用机器学习的最新进展,优于目前存在的现有最先进的视觉显著性模型。

“能够成功预测人们在自然图像中的位置可以解锁从自动目标检测到机器人,图像处理和医疗诊断的广泛应用。

“我们的代码是免费提供的,因此每个人都可以从研究中受益,并找到将这项技术应用于现实世界问题和应用的新方法。

“我们的下一步是与放射科医生合作,确定这些模型如何帮助他们检测医学图像中的病变。