人工智能在网络安全领域的应用

新闻分类

联系我们

地址：北京市海淀区北四环西路9号 ,主营：人脸识别,活体检测,身份证识别,银行卡识别,名片识别,车牌识别，OCR识别等及智能识别技术。
电话：13146317170 廖经理
传真：
邮箱：398017534@qq.com

人工智能在网络安全领域的应用

什么是智能？

在进一步讨论人工智能这个话题之前，让我们首先来定义什么是智能（译者注：在英文中，智能即intelligence）。智能在广义上是相当复杂的，在科学和哲学的许多方面都存在着猛烈的争论。但在本文中，我提供了下面这个定义。

关于智能，我有两个很重要的观念。首先，许多科学家以为，人类的智能根源于大脑如何在多种不同类型的感官数据中发现并存储具有相关性的分层方式。例如，当你在捕获的数据包或日志文件中看到某个网络称号中存在“Gaurav-iPhone”的时分，你会很自然地想到这很有可能是你的朋友Gaurav的iPhone。你会无认识地将有关同事姓名的学问与有关常用设备类型的学问联络起来。在生活中，你会不时地无认识地去更新这两个模型，并且会遭到来自于多源的多媒体感官输入的影响，这些源包括Apple的广告、电视节目、电子邮件、文章以及走廊上的说话。你可以试着将这个过程与传统的恣意字符串方式匹配程序做个比较，并且在输入的灵活性和输出的准确性上坚持分歧。

其次，智能是一种预测，这是处置问题的一种方法。比如：你的眼睛正试图看到它所能看到的一切，与此同时，大脑会根据它希冀眼睛所能看到的东西来经过神经系统向眼睛发送预测信息。这种预测机制“填补”了本没有认识到的东西，也就是为什么你无法正常识别视觉盲点的缘由。这种预测机制也让你能够在晚上漆黑一片的卧室里行走而不会被绊倒：你的大脑向运动神经系统发送信号，为肌肉提供一个行走时所希冀的模型。

常规的人工智能与狭义人工智能

人工智能这个概念最初是由一些探求超越传统程序的计算机科学家在20世纪50年代提出来的。他们遭到了超智能程序的启示，该程序的智能特征与人类相似，比如“星球大战”中的R2D2和C-3PO，以及Superman III中的超级计算机，这是常规的人工智能。常规的人工智能在今天并不存在。我们不知道如何模仿人类大脑中止工作，以致不知道模仿它的一小部分智能。

今天存在的人工智能，我们可以称之为狭义人工智能。往常有许多很有用的产品运用到了狭义人工智能，他们可以保质保量地执行一些任务，以致比人类做得更好。例如亚马逊的Alexa，它的输入范围是有限的，但同时别离了多种狭义人工智能技术来完成某些任务，这让人错误地以为它具有智能。当前的国际象棋和围棋世界冠军也是狭义人工智能的运用。这些狭义人工智能系统具有前面讨论过的三个智能元素：存储特定范畴的学问、获取新学问的机制以及运用这些学问的机制。

当前也存在着几种经过狭义人工智能来处置网络安全范畴问题的方法。固然，能够经过图灵测试并取代安全团队成员的安全机器人并不存在，但是，基于狭义人工智能的工具能够提早发现要挟和漏洞，并且能够比大多数人更好地权衡安全状况。

人工智能、机器学习、专家系统和深度学习之间的区别

机器学习是归结算法的应用，是学问获取过程的第一步，是在20世纪60年代探求人工智能的过程中产生的。机器学习可以说是侧重于“学习”的算法。计算机不是经过编写特定的计算机指令来完成任务，而是运用大量数据中止“锻炼”，使其能够学习如何执行任务。用于锻炼的样本可以由外部提供，也可以由学问发现过程的前一阶段提供。

这么多年来，呈现了很多种机器学习算法，包括决策树、归结逻辑、聚类、贝叶斯网络和人工神经网络。人工智能与统计学密切相关，以致相互堆叠。

机器学习被以为是脱胎于专家系统，但又与之不同，专家系统是根据精心准备的学问体系（规则）经过基于模糊规则的推理来处置问题的。专家系统被吹捧为20世纪80年代人工智能最成功的案例。专家系统背后的原理是，智能系统从它们所具有的学问中获取才干，而不是从它们运用的特定推理战略中获取才干。简而言之，专家系统具有学问，但并不完好会自学。它们需求人类程序员或操作员来让它们变得愈加聪明。但是，假设根据我们对智能的定义中止判别的话，它们并不聪明。

往常回到会学习的系统上来。机器学习很难，由于在多个维度的数据之间关联方式是一个难题。这是一个大数据和计算密集型问题。人类大脑不时地从大量的源并且逾越多个维度获取大量的感官数据，慢慢地完善它的模型，然后才干抵达网络安全团队中熟练员工的智能和专业学问水平。请想象一下一个大学毕业生大脑所接受的锻炼数据量（标志的和未标志的）。在大多数情况下，适用于机器学习系统的锻炼数据相当稀少，从而使得机器学习程序无法提供准确的结果。

人工神经网络和深度学习

近年来，我们看到一种被称为深度学习的机器学习技术展开十分疾速，这是一种早期机器学习方法人工神经网络的演进，该神经网络是遭到人类大脑结构的启示而创造出来的。在神经网络中，每个节点都会为其输入分配权重，以表示其正在执行的操作的正确与否。最终的输出由这些权重的和决议。理论运用中的神经网络有许多层，每个层对应于神经网络要完成的各个子任务。

神经网络报告的输出采用“概率向量”的方式，例如，系统可能会说该图像有90％的确信度包含给定的动物，该动物有25％的确信度是鳄鱼。

直到目前为止，神经网络的研讨几乎没有产生任何可以称之为“智能”的东西。预测输出的确信度很低，因此并没有什么用。你可能曾经想到，目前遇到的最基本的问题是，即使是最基本的神经网络，它的计算密集度也很高，树立和运用神经网络来完成复杂的任务是不真实际的。多伦多大学的GeoffreyHinton指导的一个小型研讨小组不时在研讨这个问题，他们将超级计算机的算法并行化，并证明了这个观念。

为了理解这个问题，我们举一个计算机视觉和自动驾驶汽车方面的例子：识别交通停车标志。当停车标志检测神经网络在锻炼的时分，很可能会呈现很多不正确的答案。例如，它在良好的能见度下可能就做得很好，但在恶劣的天气条件下就不行。这个网络需求大量的锻炼。它需求看到成千上万，以致数百万的图像，直到各种神经元输入的权重都调好为止，并且无论环境条件如何，它每次都能得出正确的答案。直到做到这一点，我们可能才会说这个神经网络曾经学会了停车标志的样子。

这正是2012年吴恩达（Andrew Ng）在谷歌所做的事情。吴恩达的严重突破是增加神经网络中的层数和神经元的数量，然后经过运转海量数据来锻炼它，这些海量数据主要是1000万个来自YouTube视频的图像。深度学习中的“深度”表示这种神经网络包含了的大量层。谷歌大脑项目是一个在16000个CPU核上运用深度学习算法锻炼的神经网络。该系统曾经学会了在YouTube视频中识别一些东西，例如“猫”，即使该系统从未被告知过“猫”是什么。神经网络能“看到”猫这个视觉图像、包含单词“猫”的视觉图像，以及包含单词“猫”的音频之间的相关性，并且将这种相关性学习为学问，就像一个小孩子一样。

今天，基于深度学习的图像识别通常做得比人类更好，例如自动驾驶车辆、识别血液中的癌症和核磁共振扫描图像中的肿瘤。还有很多深度学习的变体得到了积极地改进和运用。有些模型可以中止堆叠以产生更高级的分类才干。以下图片来自于亚马逊Rekognition System的演示，深度学习技术能识别出图像和视频流中的对象、面部和上下文。

这样的系统能否算是智能呢？由于深度学习和其他先进的机器学习算法确实在它们各自的范畴中止了学习，并变得相当的博学，因此它们确实具有了“智能”的两个关键要素。

这样的系统能否知道如何运用它们的学问来处置问题呢？狭义人工智能系统目前需求人工干预才干与理想世界的问题处置工作流程相关联、与传统系统以及其他人员中止交互。人们需求懂得将检测跟踪人员的交通摄像机与其他的面部检测和图像检测系统相融合，运用来自加利福尼亚DMV驾驶执照的图像数据和汽车牌照数据库中止锻炼。

假设在公共场所安装这样的系统，我们就能大大进步社区的犯罪打击才干。试想一下，这样还可能会产生倍增效应，我们的警察、安全人员和调查人员每天都有进步工作效率和速度的潜力！假设拿这种狭义人工智能作为武器，这些特勤人员的工作效率会变得更高。

人工智能（AI）、机器学习（ML）、专家系统和深度学习之间的关系也可以参照下面的维恩图中止理解。

上一条：手机扫描识别第二代居民身份证OCR 下一条：人脸识别中人脸检测Cascade CNN