当前,数字经济给人类生产生活带来广泛而深刻的影响,但随之而来的海量数据安全问题日益凸显。在今天(4月26日)举行的中关村论坛——数据安全治理与发展论坛上,围绕智能网联汽车、人工智能等领域,国内外专家学者开展交流讨论,共商数据安全治理路径。
近年来,智能网联汽车数据安全问题日益凸显。以北京经开区为例,现有838辆入网汽车,367个智能网联路口,每天增加的各类数据超过305TB,包含车牌、人类隐私行为、车辆轨迹等等敏感信息。
论坛上发布了《北京市高级别自动驾驶示范区数据安全治理白皮书》,率先开展数据分级分类、实时感知安全态势等专项工作,北京市高级别自动驾驶示范区工作办公室常务副主任许宏伟介绍,示范区首次提出了整体数据化一体的治理。从治理维度、治理要点这几个方面,需要三个体系,一个是组织体系,一个是制度体系,还有一个是技术体系。
“在整个数据的治理要点,我们提出了全生命周期的安全,就是从采集、传输、存储、使用、共享,最后再怎么销毁,从车端、路端、云端,车车传输、车云传输、路云传输,这些方面都要进行分级分类。”许宏伟说,同时从端的通信防护、云端防护,按照车、路、云三方,从安全治理和静态脱敏打造了一个技术体系。”
北京市网信办从2022年起,连续开展汽车数据安全管理年度报告评审工作,指导车企合规开展汽车数据处理活动。奥迪中国数据保护官李钊说,2021年奥迪中国成立了数据保护办公室,对于所有数据,在传输过程中都采用了非常增强的安全保密协议,同时采用了加密的措施,防止数据被篡改或者泄露,这样能够保证数据的完整性。
“在制度的层面,我们一定要确保相关的管理制度,比如说个人信息保护政策,或者是数据分类分级的制度,符合国家最新监管的要求,在技术层面也一定要保障在数据处理的生命周期内都得到友好的保障。”李钊说。
随着人工智能的高速发展,数据安全和隐私保护也遭遇重大挑战。人工智能大模型有赖于数以亿计的训练数据和强化学习,如何确保在过程中,过滤掉个人隐私数据和有害数据呢?中国科学院信息工程研究所研究员虎嵩林指出,提升检测能力的同时,在全流程加大安全防护。
“我们怎么样检测到这个数据是有害的?怎么检测到这个数据涉及到隐私数据?怎么样检测到这个数据与人类的价值观有所冲突数据信息,这都是我们关键技术的一个研究点。”虎嵩林表示,还需要在安全防护上加大能力,从数据阶段到预训练阶段,到人类价值观对齐阶段,一直到最后的推理阶段,实际上现在的安全都是成系列来进行干预。
针对人工智能领域引发的价值偏见、隐私泄露、虚假信息等问题,还可以“用魔法打败魔法”。清华大学人工智能研究院常务副院长孙茂松表示,生成式人工智能为数据安全治理提供了一个新的更有效的手段。比如,现在数据里面有很多隐私问题,但可以用生成式人工智能生成符合真实情况的数据,同时规避掉隐私。这个就显示出它的威力,以前没有生成式人工智能时,就做不到这一点。
另外,目前人工智能领域管理面临的环境是非常复杂的,有些情况可能在互联网上还没有出现,没有那种数据,但是预测到这种情况可能会发生,这时候给大模型增加某些条件,生成式人工智能就会把还没有碰到的情景的一些数据给生成出来,这样人类可以预先作出研判。