攻和防谁更厉害?AI技术在恶意软件检测中的应用和对抗

news/2024/7/1 5:13:10

AI技术的发展为网络安全带来新机遇的同时,黑客也在逐渐利用AI漏洞建立对抗样本以躲避攻击,双方在各自领域的更多尝试也将是AI技术发展的一场新博弈。那么,在应用中,如何利用AI检测技术与恶意软件展开对抗?

腾讯安全技术专家王佳斌为您带来分享解读。

AI检测的背景

上世纪50、60年代,早期的人工智能技术已出现,70年代到80年代,机器学习技术已被大家认识和应用。到2010年后,深度学习技术已被广泛应用在各大领域,安全领域也是其中之一。

传统的检测方式是人工定制的安全检测方案,通过输入的数据进行研判,进而得到检测结果。新的AI检测方式是通过输入数据和已知结果训练模型,再由模型去做检测。

image

攻击方视角

从攻击者的视角,如何运用AI安全检测?

通过AI的方式选择攻击目标,钓鱼是攻击者广泛使用的攻击方式。新的研究显示通过AI技术对社交网络信息的训练,可以找到一些容易被攻击的对象。

早期的钓鱼方式包括短信、诈骗电话等,发展至今攻击方升级为通过AI技术采集相关信息对社交网络信息进行训练。

数据调查显示,广撒网式的钓鱼方式成功率仅为15%,新的训练技术成功率可提升30%及以上。

image

从攻击方的视角,如何对抗安全防护?

在恶意应用和恶意软件检测的过程中,黑产分发病毒除了会分发大量的恶意应用外,也会掺杂一些正常的应用。如果用这些数据去训练模型,模型研判会有很高的误判率,由此便会出现训练数据的污染。

image

从攻击方的视角,如何对研判数据进行修改和干扰?

对研判数据进行修改和干扰主要表现为在数据传入时绕过AI检测对数据做出变化。之中涉及到几种模型测试类别,即可直接拿到模型的白盒测试和不能直接拿到模型的黑盒测试,其中黑盒测试更接近于安全领域对抗过程。

目前已有的遗传编程算法对于恶意攻击首先可根据结构化字段做随机化操作得到一个子群,经过分类器研判并做迭代测试找到变种子集再重新训练。通过遗传演算重新找到变种子群,再用分类器研判。这种递归方式对于找到逃过AI检测样本有较大帮助。

image

防御方视角

AI已广泛应用于安全检测技术中,从防御者的视角来看,传统经典的检测方式还需要持续检测和优化。AI是对传统检测方式的补充,但不是一种替代,对此,王佳斌提出了几点建议:

第一, 传统的检测方式和AI的检测方式可以形成叠加的效应,防止被单点突破。

第二,传统检测方式提供的检测结果可为AI模型训练提供不错的数据源。对于模型自身的鲁棒性,要引入一些提升鲁棒性的方法,包括主动将对抗样本引入到训练集里形成对抗性训练,防御性的增流等。

第三,对于传统经典的检测方案要持续检测,训练数据要进行很好的清洗和提纯,足够有表征意义和纯净的训练数据才能将AI训练的更好。在此基础上还要保证模型的安全性和加密性,模型本身需要建立多种叠加效果,引入专家系统并做兜底策略。

image

如今,黑客正在越来越多的利用AI漏洞构建“对抗样本”进行躲避攻击,除了上述的防御方式,更多的AI攻击应对方法还在探索之中。对于AI在恶意软件检测中的应用和对抗解读,开发者觉得有哪些值得借鉴和可以改进的地方呢?欢迎留言说出您的看法~

本文首发于安卓绿色联盟公众号。

http://lihuaxi.xjx100.cn/news/236110.html

相关文章

Python基础08-数据类型:集合set

目录 集合的概念 集合的方法 集合可变吗? 集合的概念 先理解一些概念。 数据类型按照是否可变分为可变类型、不可变类型。按照访问方式可以分为顺序访问、映射访问。 如何区分可变类型、不可变类型?就看在内存中存储内容是否可以被修改。如果内存地…

机器学习-线性回归LinearRegression

概述 今天要说一下机器学习中大多数书籍第一个讲的(有的可能是KNN)模型-线性回归。说起线性回归,首先要介绍一下机器学习中的两个常见的问题:回归任务和分类任务。那什么是回归任务和分类任务呢?简单的来说&#xff0c…

在 Node.js 中用子进程操作标准输入/输出

翻译:疯狂的技术宅原文:http://2ality.com/2018/05/chi... 本文首发微信公众号:jingchengyideng欢迎关注,每天都给你推送新鲜的前端技术文章 在本中,我们在 Node.js 中把 shell 命令作为子进程运行。然后异步读取这些进…

Python基础09-字符串格式化

字符串格式化。主要是%格式,format格式化方法,具体写在代码例子的注释里。 msg list() # %s 接收字符串 msg.append("i am %s, which is a database." % "mysql") msg.append("i am %s, which is a %s." % ("db2&q…

个人项目-小学四则运算 “软件”之初版

本次作业要求来自:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2166 我的github远程仓库的地址:https://github.com/yanyuluu/yanyuluu/tree/master/ruanjiangc 第一部分:要求 具体要求:任何编程语言都可以&#xf…

单例测试模式中【饿汉式】与【懒汉式】的区别

package day25.thread;/** /*** author Mr Chen* create 2018-10-09 18:37* 单例测试模式:保证类在内存中只有一个对象*/ public class Dome01 {public static void main(String[] args){Singleton s1 Singleton.s; //成员变量被私有&#xf…

Python基础10-函数基础

目录 函数的定义 函数的返回值 函数的参数 参数的传递 参数的默认值 可变长参数 全局变量与局部变量 函数嵌套定义 风湿理论——函数即变量 函数的定义 定义函数的关键字def。函数名,本例函数名是test。小括号里面是参数。冒号后缩进的代码块是函数内容。…

电脑录音软件哪个好,怎么用电脑录音

如今科技迅速发展,不仅唱歌的时候喜欢录音,就连追剧看电视都喜欢把一些经典或者搞笑的音频录制下来,很多喜剧给我们的休闲时光带来了欢声笑语,碰到经典的对话或者旁白总想录制下来,那电脑录音软件哪个好,怎…