原文请点击:Li Xiong: Researching the human elements of cybersecurity
熊莉校友,艾默里大学数学与计算机系Winship Distinguished Research 副教授;毕业于湖北省黄石二中,1992年考入中国科学技术大学计算机科学系,1996年获得郭沫若奖学金,1987年获得学士学位。后赴美留学,1999年获得约翰霍普金斯大学计算机科学硕士学位,2005年获得佐治亚理工学院计算机科学博士学位。
网络安全对于每个人来说都是至关重要的因为个人数据都暴露在那里,计算机科学家熊莉说。每一天几乎每一件你做的事情都以数字的形式收集和存储在某处了。
熊莉是埃默里大学数学与计算机科学系和生物医学信息系的 Winship 杰出研究副教授。她领导着埃默里大学的 AIMS 实验室,研究领域为网络安全及相关。
这个实验室的长期目标之一就是去研究一些方法去管理能够使生物医学研究获益的健康数据并且能够保证个体病人的隐私。
我的研究在某种意义上来说有很强的个人因素是以人为导向,熊说。我想以一种能够保护你的机密并且能够有益于你和社会的方式来收集你的数据。简单来说,我想要你告诉我你的所有信息但又不泄露给我你的任何信息。这听起来不可能,但是就像大部分的计算机科学问题一样它是个优化问题。
在这篇访谈中,熊讲述了目前在网络安全中的一些挑战和她作为一个计算机科学家的工作。
你从哪里来的?
我成长在中国武汉。如果你把中国地图覆盖美国地图上,武汉在中国的位置大约就是亚特兰大在美国的位置。武汉人喜欢辣的食物并且他们的个性也有一点点火辣。但是他们其实非常善良热心肠。
我父母是普通的中产阶级,他们在过去现在和将来都给我很大的影响。他们灌输给我的概念, 知识可以为人类造福。我父母在政府工作,我母亲在银行工作。
你是怎么对计算机感兴趣的?
在高中我就喜欢数学和物理,尤其逻辑和分析。我喜欢找到一个最快的最优美的方式去解决一个问题。在我申请大学的时候,一位来自中国科学技术大学的高中校友做招聘老师,他建议我考虑计算机。同时我父亲也起了很大的作用,他研究了很多觉得计算机有很好的前景。
我被中科大计算机系录取了。
你怎么会到美国?
实际上一直到快要大学毕业的时候我都没考虑过去美国。在那个时候,我们很少接触外面世界,不像现在,这个世界因为通讯发达变得很小。
我毕业那年也就是 1997 年网络才刚刚开始普及。我直到大四才有了个邮箱账号。那时候网络连接很慢。我记得有一本大书叫皮尔森的指导,在申请美国大学的时候我们拿它当圣经。我用有限的信息源在一台打字机上打我的申请。
我被约翰霍普金斯大学录取为博士生。我有时候称自己为霍普金斯退学者,因为我读了一年半拿到硕士学位后就退学了。那是个互联网爆炸的时期,我想去看看工业界在干什么。
我在一个做股票市场分析的私人企业工作了几年之后就发现对网络安全有兴趣,但是私人企业做的没那么有挑战性。所以我就回学校然后去了佐治亚理工。
网络安全对普通人多重要?
网络安全对于每个人来说都是至关重要的,因为个人数据都暴露在那里。每一天几乎每一件你做的事情的数据记录都以数字的形式收集和存储在某处了。你每天的活动轨迹也被你的智能手机记录了。
当你去看医生的时候,你的症状和处方也被记录了。你的网络搜索词也被记录了。你投票注册的人口统计资料和你购物的详细清单都被记录了。
这些信息对你来说都是很有用的。你能收到专门为你定制的购物券,个人推荐。你可以很快的接入地图并且定位周边餐馆得到路线。
这种信息对社会也是有用的。例如,公共卫生官员可以从药店收集到的数据中判断爆发的流感疫情。他们就能够用算法去预测哪里爆发传播然后就可以主动干预了。
而另一方面,也有很多不当使用数据的危险。有偷盗和个人隐私被侵犯的潜在风险。
作为一个网络安全专家,你和普通大众做的有什么不同?
我主要是禁用我的手机上的位置访问。默认情况下,当你下载一个应用程序它会询问是否可以使用您的位置。所以,如果你到您的手机上的“设置” ,然后去“隐私”和“定位服务”,你可能会发现很多你的应用程序正在访问您的位置。
你的位置记录被收集,它们可以被用来建立你的个人资料。该资料就能识别你住的地方和工作,你的生活轨迹,甚至你的宗教和政治观点。
我不是很偏执,但我可能比大多数人谨慎。我禁用大多数定位服务,但不是全部。你可能会认为是没有风险的,但总是有一定的风险。
事实上,我的研究小组的一个主要项目是建设确保隐私的定位机制。我们试图模糊用户的精确位置可以保护隐私,但同时模糊的位置也有可行的应用。这就是对个人因素的考虑。是有用性和保护隐私之间的折衷和优化。
你最近收到一个来自 PCORI 的百万基金。你能不能说一下你们实验室在这个项目上的工作?
所有医疗都是以经验为基础的,依赖于病人的某些特性,症状,处方,预后。如果为每个进入医院或诊所的患者收集详细的电子信息,那么你可以建立一个庞大的数据集。
当一个新的病人进来,你可以输入他的特点,把它和这个庞大的数据集对比。你可以得到一个定制的解决方案,即所谓的精准医疗,根据每个患者的特征。
我们正在寻找途径,同时保护数据中的个人隐私做这种数据分析。我们需要确保当我们汇总数据,该数据的质量有保证。
保护个人的隐私的一种方法是添加一些噪声扰乱。但是,当你扰乱数据,其质量受到影响。所以,你必须解决如何扰乱它刚好保护个人身份而不牺牲数据的价值.
另一个挑战是利用效率。医院可以将数据在存储之前加密,以确保它不被滥用。但分析加密数据需要大量的计算使得它在现实世界中是不切实际的。
我们试图设计出快速易用性结合起来的方法。我们的项目以病人为中心,而不是一个尺寸适合所有人的方法。我们建立数据的时候保证数据有用并且考虑病人隐私偏好和风险。
又回到个人因素是非常重要的:我们希望能够在不牺牲个人隐私的前提下确保社会利益。长期目标是促进可持续和可扩展的涉及大量的医疗保健数据的生物医学研究的同时,还赋予患者更严格和透明的隐私控制。
新闻来源:艾默里大学 News Center 网站,By Carol Clark | Emory Report | Feb. 23, 2016