天天看点

机器学习在安全领域的应用

黄反鉴定,恶意链接,业务风控领域、病毒分析、APT检测

恶意代码分类

数据集

KDD 99
HTTP DATASET CSIC 2010

标注过的针对web服务的35000个正常请求和25000个攻击请求。常用于waf类产品的功能评测

SEA数据集

检测伪装者攻击

ADFA-LD数据集

入侵检测系统

Alexa 域名数据集

提供全球前100万域名下载,可用于训练正常的域名和DGA域名

MNIST 数据集

计算机视觉,手写数字,标签

movie Review Data

评论,正向和负向,用于恶意评论检测

xss出现的情况

可用来检测xss

WAVSEP 靶场

WAVSEP 是一个包含漏洞的web应用程序,目的是帮助测试web应用漏洞扫描器的功能、质量和准确性

webshell

以网页形式存在的一种命令执行环境

僵尸网络

恶意软件分析沙箱

基于虚拟机实现

k近邻算法(KNN)

分类

与k个邻居样本的分类一致

Brute Force

K-D Tree

Ball Tree

在python中的使用

import numpy as np
from sklearn.neighbors import NearestNeighbors

def demo1():
    a = np.array([[-1,-1],[-2,-1],[-3,-2],[1,1],[2,1],[3,2]])
    nbrs = NearestNeighbors(n_neighbors=2,algorithm='ball_tree').fit(a)
    print(nbrs.kneighbors_graph(a).toarray())  

if __name__ == "__main__":
    demo1()      

继续阅读