天天看点

面向物联网设备识别的对抗样本技术研究物联网设备安全形势严峻,对于设备管理人员,通过识别设备获取设备相关信息,可以采取有针

作者:朝史暮今

面向物联网设备识别的对抗样本技术研究

物联网设备安全形势严峻,对于设备管理人员,通过识别设备获取设备相关信息,可以采取有针对性的安全防护措施。

对于设备攻击者,可以基于设备信息采取有针对性的攻击。本文围绕面向物联网设备识别的对抗样本技术展开研究,通过生成对抗样本干扰攻击者对设备的识别,从而保护设备信息不被恶意利用。

对抗样本是指通过向原始样本中加入精心构造的并且人类较难感知的对抗性扰动,从而欺骗目标模型,造成模型对添加扰动后的对抗性样本做出错误的决策。

同时又不影响人的判断。本文总结了近年来自然语言处理中对抗样本的相关工作。根据是否使目标模型给出指定的错误判断,文本对抗可分为定向性与非定向性。

根据对抗扰动的粒度,文本对抗可分为句级、词级、字级和多级;根据对目标模型的可见性,文本对抗又可分为白盒对抗和黑盒对抗。

在白盒场景下,主流的方法为基于梯度的对抗样本生成方法;在黑盒场景下,一种重要的方法为基于搜索空间的对抗样本生成方法。

物联网设备的应用层报文存在差异性,且报文往往携带设备相关信息,但现有的设备识别技术忽略了设备信息间的关联关系,难以细粒度、高精度地识别物联网设备信息,且缺乏对未知设备的识别能力,无法为对抗样本提供可靠、强有力的对抗目标。

同时,物联网设备识别的对抗样本技术缺乏研究,用于识别的应用层报文数据与图像、自然语言文本有较大差异。

整体来看,在迭代次数相同的情况下,基于全局最优的随机搜索算法生成对抗样本的成功率较低,改动率较高,但访问模型次数较少。

基于局部与全局最优的搜索算法成功率较高,改动率较低,但访问模型的次数较多。两种算法制造的扰动均没有被察觉,侧面反映了在构造搜索空间时对结构、视觉、语义一致性的控制效果较好。

针对上述问题,主要研究点与贡献如下。

提出了一种基于实体关系提取模型的物联网设备识别方法,从物联网设备的应用层报文中提取设备信息三元组(设备类型,厂商,产品型号)。

该方法通过定义关系类型,将设备类型、厂商、产品型号作为关系中的主体和客体,联合抽取报文中设备信息实体和关系。

此外,该方法基于词对来对报文中的实体和关系的主体与客体进行标识,解决了多词实体以及关系重叠的问题。

此方法充分利用了物联网设备报文的语义信息和设备信息实体之间的潜在关系,实现了对物联网设备的细粒度识别,提高了对未知设备的识别能力。

实验验证了此物联网设备识别方法的有效性,论文在1万多条测试集上评估已知设备识别效果,模型F1值能够达到90.99%。

在1255条报文数据上评估未知设备识别效果,在能给出设备识别结果的数据中模型F1值达到了79.10%。

考虑到真实场景下攻击者的指纹模型是黑盒,本文将对抗样本的生成转化为组合优化问题。物联网设备指纹的对抗样本既要影响黑客的威胁模型,又不能影响一般用户的正常使用。

对抗样本需满足结构、视觉、语义一致性要求,设计了一种结合区域划分、字符扰动与词级扰动的搜索空间构造方法。

此外,设计了两种搜索算法用以在搜索空间寻找对抗样本。此方法能在黑盒场景下,有效地干扰黑客或攻击者的设备识别,又保证一般用户的正常访问和使用。

实验表明本文物联网设备指的对抗样本生成方法在1000条报文数据中,对产品型号的扰动成功率能够达到85.60%,且生成的对抗样本较难为人类所感知。

对于本文提出的物联网设备指纹对对抗样本生成技术,也有进一步改进的空间:(1)搜索空间的局限性,在构造搜索空间时,使用的语义相似词表完全是基于词向量的余弦相似度计算,由于设备报文语料库的局限,词与其语义相似词之间可能与人类理解的语义相似具有一定差距,增加了对抗样本被感知的风险。未来可以在搜索空间的上探索更加强而有效的约束;(2)对抗样本生成算法的局限性,两种算法本质上都是随机的搜索,生成对抗样本的效率有待进一步提升。未来可以在降低对模型的访问次数上进行深入研究。

面向物联网设备识别的对抗样本技术研究物联网设备安全形势严峻,对于设备管理人员,通过识别设备获取设备相关信息,可以采取有针
面向物联网设备识别的对抗样本技术研究物联网设备安全形势严峻,对于设备管理人员,通过识别设备获取设备相关信息,可以采取有针
面向物联网设备识别的对抗样本技术研究物联网设备安全形势严峻,对于设备管理人员,通过识别设备获取设备相关信息,可以采取有针
面向物联网设备识别的对抗样本技术研究物联网设备安全形势严峻,对于设备管理人员,通过识别设备获取设备相关信息,可以采取有针
面向物联网设备识别的对抗样本技术研究物联网设备安全形势严峻,对于设备管理人员,通过识别设备获取设备相关信息,可以采取有针
面向物联网设备识别的对抗样本技术研究物联网设备安全形势严峻,对于设备管理人员,通过识别设备获取设备相关信息,可以采取有针

继续阅读