数学在人工智能中的应用

(整期优先)网络出版时间:2020-11-11
/ 3

数学在人工智能中的应用

王胤杰

江苏省天一中学 214101


摘要:人工智能(AI:Artificial Intelligence)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新技术科学。它是计算机科学的一个分支,它企图了解智能的实质,可以产出一种新的可以和人类智能相似的方式做出反应的智能机器,该领域的研究主要有机器人、语言识别、图像识别、自然语言处理和专家系统等。这些研究领域不仅包含编程所涉及到的工程学方法和模拟法,而且也包含了许多近代数学的基础知识。数学是人工智能的基石。本文着重阐述了数学在人工智能中的应用。

关键词:人工智能、数学建模、矩阵理论;

引言:人工智能是一门融合了计算机科学、统计学、脑神经学和社会科学的前沿综合性学科。它的目标是希望计算机拥有像人一样的智力能力,可以替代人类实现识别、认知、分类和决策等多种功能。近年来,随着计算机技术和脑神经科学的进一步发展,各种机器学习技术百花初绽,这些极大推动了人工智能的发展。人工智能的研究领域主要有五层,最底层是基础设施建设,包括大数据和计算能力两部分,数据越大人工智能的能力越强。往上一层是算法,比如机器学习、深度学习等算法。再上一层是主要的技术方向,如计算机视觉、语音工程、NLP、规划决策系统,大数据统计分析等。第四层是各个具体技术,包括图像识别,图像理解,视频识别,语音识别,语义理解,语音合成,机器翻译,情感分析等。最上层为人工智能的应用领域。其中前四层研究领域都需要深厚的数学知识。



一、 人工智能的实现步骤与数学的关系:

在所有理工科一类的项目中,大多数项目的第一步都需要对研究目标和已知的数据建立一个函数来连接二者的关系。人工智能是通过模拟人认识客观事物和解决实际问题的方法对实际系统或系统的某一部分进行描述和表达的过程。因此,实现人工智能最关键的是建立研究目标和已知数据的函数关系。

二、建立数学模型

人工智能所涉及到的函数主要有两种,一种是线性函数,一种是非线性函数。人工智能是一个黑盒子。假设输入一个x值,经过黑盒子运算,输出一个y值。如果黑盒子里边的算法是线性函数,就叫线性模型。如果输出是连续值就叫回归,如果输出是离散值就叫分类。比如给出房子的平米数,预测房价就是回归,因为房价是连续的数值40万,55万,66.13万。如果是预测有几个卧室,就是分类,因为卧室数量肯定是整数,而且也是有限的整数。例如:有人最近想卖房子,他知道自己的房子是50平米,想预估这个房子的价格,进行了初步的分析。首先,他去房屋中介网站上看了一下其他房屋的价格,刚开始,他只是关注了他们同一小区房屋的价格,发现有两组数据,(100平米,350万),(250平米,650万),利用5fab8b6d59567_html_13a76c2999759db6.gif 这个函数关系,根据这两个数据(两点确定一条直线),找到如下函数关系:房屋的价格=3×房屋面积+50。根据上述函数关系,预估该房屋的价格为200万。

以上过程,按照人工智能中的术语和过程进行分析:

数据集:关于收集的简单数据(100平米,350万),(250平米,650万)可看作数据集,简称(x,y)。

特征:房子的面积。

模型:房屋的价格=3×房屋面积+50。

预测:给定一个特征(房屋面积),带入模型,模型输出房屋的价格就是预测值

为了做到最有效的线性回归,需要寻找到函数中的最优解,也就是找到损失函数最小的函数。用计算机拟合一般随机给定线性方程y=kx+b中k和b的值,将数据集带入方程后计算出损失函数的值,之后调整k和b的值,再将数据集带入计算损失函数的值,不断的尝试,直到损失函数最小。有两种方法调整k和b,冷热方法和梯度下降方法。

1.冷热方法

  • 首先随机先把k和b分别调大,然后计算损失函数,如果值大了,就分别调小K和b.如果值小了,就调大k和b。但是这种方法也有自己的局限,k和b两个值调整是有多种情况:同时调大,同时调小,K大b小,k小b大,大到多少,小到多少。有无数个组合…..需要一遍一遍的去尝试,效率不高。

  • 2.梯度下降法

梯度下降的基本过程就和下山的场景很类似。首先,如果把可微分的损失函数代表着一座山,那目标就是找到这个函数的最小值,也就是山底。根据之前的场景假设,最快的下山的方式就是找到当前位置最陡峭的方向,然后沿着此方向向下走,对应到函数中,就是找到给定点的梯度,然后朝着梯度相反的方向,就能让函数值下降的最快。因为梯度的方向就是函数之变化最快的方向,所以重复利用这个方法,反复求取梯度,最后就能到达局部的最小值。梯度就是分别对每个变量进行微分,然后用逗号分割开。代表着函数在某个给定点的切线的斜率。在多变量函数中,梯度是一个向量,向量有方向,梯度的方向就指出了函数在给定点的上升最快的方向。有了梯度,每次参数的变化利用下面公式计算:

5fab8b6d59567_html_f686858a5c3e97fb.png

其中θ就是参数k和b,其中的5fab8b6d59567_html_d7eec3c80b244bd1.gif5fab8b6d59567_html_f962c6a58c6eb0a4.gif 表示参数更新后和更新前。5fab8b6d59567_html_ef1a1a00b8b2d6ab.gif 是学习率或者步长,用来控制每一步走的距离。5fab8b6d59567_html_ef1a1a00b8b2d6ab.gif 不能太大也不能太小,太小的话,可能导致迟迟走不到最低点,太大的话,会导致错过最低点。

三、矩阵理论在人工智能中的应用

矩阵理论在人工智能方面有着广泛的应用,但是矩阵在人工智能当中最重要的并不是矩阵运算,而是矩阵模型空间变化的几何意义。线性变化和矩阵之间存在一一对应的关系,若线性变化为 y1=x1, y2=x2,……,yn= xn则这种情况称之为恒等变换,从而对应行列式为n的单位矩阵。

在AI中,图像分析和文本的分析都涉及到矩阵的利用和变化。对于人工智能来讲,每一个图片和每一个文本都会有各自所相对应的矩阵。这些矩阵往往十分大,数据也很复杂。就可以利用卷积来缩小对应矩阵来找到相对应的特征。卷积是卷积神经网络最核心的概念,它用来提取图像的局部特征,它是一个数学计算方法。图1描述了一幅图片和其相对应的矩阵之间的映射关系。

5fab8b6d59567_html_33a4164ab3bff2b3.png

图1 一幅图片和其对应的矩阵之间的映射关系

池化:就是将特征矩阵划分为若干小块,从每个子矩阵中选取一个值替代该子矩阵,这样做的目的是压缩特征矩阵,简化接下来的计算。池化有两种方式:Max Pooling(最大值池化)和Average Pooling(平均值池化),前者是从子矩阵中取最大值,后者是取平均值。图2描述了压缩特征矩阵的例子,图3描述了最大池化和平均值池化的例子。

5fab8b6d59567_html_631e6442b3dc6df.png

图2 压缩特征矩阵


5fab8b6d59567_html_6f63e06457618dbc.jpg

图3 最大池化和最小池化

小结

随着技术的发展,人工智能朝着更类似人脑智能的方向发展。然而,无论怎么发展,人工智能都必须借助数学工具。数学是思维科学的基础,它被认为是多种学科的基础科学,数学也进入语言、思维领域。人工智能与思维科学的关系是实践和理论的关系,人工智能是处于思维科学的技术应用层次,是它的一个应用分支。数学将促进人工智能更快地发展。