陕西科技大学利用亚马逊云科技加速探索大脑奥秘 致力于为全球数亿听障人士带来新声
2021年6月16日,陕西科技大学创造性地利用亚马逊云科技的算力、机器学习平台,以及云上开源数据集进行人类脑部活动的研究,将项目研发实践时间从使用本地算力、自建机器学习环境所需的一年减少至105天,缩短三分之二,加快科研进度,通过皮肤听声致力于为全球数亿听障人士带来福音。
人类脑部活动研究是陕西科技大学著名的皮肤听声研究项目的一个延伸课题。皮肤听声是通过声电转化,将声音信号转化为电流,刺激人体皮肤,信息反馈到相关的大脑功能区,实现听声效果。通过反复训练,能够让听障人士获得语言能力。此技术不依赖于人体的任何残余听力,让全聋人士也可以感受到声音信号,比助听器及电子耳蜗有更大的优越性。
当今,全球有4.6亿人受到听障问题的困扰,其中,在中国有2600万听障残疾人士,零听力人士超过500万。对尚具微弱听力的听障人士,目前可以利用人工耳蜗进行补救,但是数十万的设备费用、手术费用、专业教师训练费,阻碍了大多数患者的求医之路。与此同时,人工耳蜗仍不能治愈零听力。该研究团队的项目如果能让皮肤听声技术得到推广,将是全球数亿听障人士的福音。
要更好地实现皮肤听声,就要更准确地知道声音和皮肤刺激是如何作用于脑部拓扑功能区的具体区域,以保证刺激信号的一致性。《功能磁共振图像 (fMRI) 解码的无参数注意力》研究,是利用开源的功能磁共振图像数据集,对大量的脑部磁共振图像进行可视化分析。分析过程中,需要分批获取原始数据集,对原始数据集进行数据预处理,汇入标准数据集,将标准数据集输入卷积神经网络,输出可视化的结果。
研究团队使用的高质量开源数据集全部存储于Amazon Simple Storage Service (Amazon S3) 上,数据量高达12TB。如果将数据下载到学校实验室的本地计算机进行处理,需要数周时间才能完成下载。同时,如果利用学校实验室的算力来处理这些数据,在开始处理数据之前,需要花费很多时间搭建和配置机器学习环境;在开始处理数据之后,面对高达12TB的数据,实验室的本地工作站犹如小马拉大车,速度往往以周计算。
最终,研究团队决定采用上云方式,使用亚马逊云科技的云上算力进行数据处理,不仅节省了长达数周的数据下载时间,而且通过使用Amazon SageMaker机器学习平台,不需要自己搭建机器学习环境,既省时也省力。研究团队使用Amazon SageMaker处理Amazon S3上的数据,数据存取速度比使用本地实验室算力提高了10倍,并仅用3个多月时间,就处理完成了包括1200份受试者数据的开源数据集,获得了解码精度达88.7%脑功能区可视化数据,让整个研究项目的实验时间缩短了三分之二,研究总周期减少了一半。
研究团队负责人齐勇博士表示,“使用亚马逊云科技最大的好处就是方便快捷。不仅能快速准备好海量数据,而且由于使用Amazon SageMaker开展机器学习,不用自己搭建机器学习环境,数据的处理均可以在云上进行,从而解放了团队大量的精力。在2020年疫情期间,研究团队不用集中到实验室,通过远程即可实现协作,真正做到让团队专注于研究项目上,节省了大量的宝贵时间。”
研究团队在此项目中形成的脑功能解码可视化分析平台,有望为脑科学研究提供脑部功能拓扑状态探测仪器,借助功能核磁共振图像(fMRI)探究皮肤触觉与大脑认知区域中血红蛋白变化速率的定量分析方法。同时,运用基于注意力模型的深度学习计算机视觉分析技术,与现有的医疗影像分析框架相结合,将大脑图像信息快速解耦,分离得到脑部的拓扑功能分配机制,分析大脑皮层功能区域的变化特点,有助于识别各类脑疾病,判断病灶部位,并对进一步了解脑部功能机制提供非主观可重复实验的数据样本。
亚马逊云科技大中华区商业事业部总经理李晓芒表示,“亚马逊云科技在云计算以及人工智能领域的愿景,简单总结就是普惠。我们非常高兴看到亚马逊云科技的产品和服务能够帮助陕西科技大学科研团队在人类脑部活动这样领先的科研项目中,做出有望让众多患者受益的研究成果,造福大众,让普惠的内涵得到进一步延伸。”