联系我们
- 地 址:北京市海淀区北四环西路9号 ,主 营:人脸识别,活体检测,身份证识别,银行卡识别,名片识别,车牌识别,OCR识别等及智能识别技术。
- 电 话:13146317170 廖经理
- 传 真:
- 邮 箱:398017534@qq.com
入门机器学习,对数学有要求
入门机器学习,对数学有要求
在过去的几个月里,我不断和一些人交流,他们曾经开端切入数据科学范畴并积极运用机器学习(ML)技术来探究统计规律、或构建完善的数据驱动产品。但是,我发现很多状况下统计剖析结果不尽人意的缘由是是缺乏必要的数学直觉和学问框架。这就是我决议写这篇博客的主要缘由。
最近兴起了许多易于运用的机器学习和深度学习的装置包,如scikit-learn,weka,tensorflow,r-caret等。机器学习理论是横跨统计、概率、计算机科学和算法等相关范畴,能够用来构建智能应用程序。固然机器和深度学习有着无限前景,但就这些技术而言,透彻的数学了解对控制内部运算和取得较好的效果是十分有必要的。
为什么要强调数学?
毫无疑问机器学习中数学是重要的,例如你需求:
1. 选择适宜的算法,包括思索精度、锻炼时间、模型的复杂性、参数和数量特征;
2.选择参数设置和考证战略;
3.经过理解偏向方差权衡来辨认拟合缺乏与过度拟合;
4.估量正确的置信区间和不肯定性。
需求具备数学根底:
到底需求具备几数学学问才干了解机器学习这个穿插范畴的技术呢?这个问题没有统一的答案,通常是因人而异的。机器学习的数学公式和理论研讨正在停止中,研讨人员也正在研发更多的先进技术,所以答复这个问题是不太容易的。下面我将从以下方面论述我以为成为机器学习科学家/工程师所需的最低数学程度以及每个数学概念的重要性。
1. 线性代数:在ML中,线性代数四处都是。主成分剖析(PCA)、奇特值合成(SVD)、矩阵的特征合成、LU合成、QR合成/因式合成、对称矩阵,正交化和正交化、矩阵运算、投影、特征值和特征向量、向量空间和标准这些都是了解机器学习及其优化办法所必需的。线性代数令人惊奇的是,有很多在线资源。 我不断说传统的课堂正在死亡,由于互联网上有大量的资源。我最喜欢的线性代数课程是MIT(Gilbert Strang教授)课程。
2. 概率理论与统计学:机器学习与统计学范畴是有很多类似的中央。实践上,有人最近将机器学习定义为“在Mac上统计数据”。 机器学习需求根本统计和概率理论的综合学问,如概率规则和公理、贝叶斯定理、随机变量、方差和希冀、条件和结合散布、规范散布(伯努利,二项式,多项式,平均和高斯)、矩生成函数、最大似然估量(MLE)、先验和后验、最大后验估量(MAP)和抽样办法。
3. 多元微积分:主要范畴包括微积分、偏导数、向量值函数、梯度方向、Hessian矩阵、雅可比矩阵、拉普拉斯和拉格朗日散布。
4. 算法和复杂度优化: 这些在评价计算的效率和可扩展性,或应用稠密矩阵时,显得十分重要。 需求学问包括数据构造(二叉树,散列,堆,堆栈等)、动态规划、随机和线性算法、图形、梯度/随机降落和原对偶办法。
5. 其他:包括上述四个主要范畴未涵盖的其他数学主题。它们包括实剖析和复剖析(汇合和序列、拓扑、度量空间、单值和连续函数、限制、柯西内核、傅里叶变换),信息理论(熵,信息增益),函数空间和Manifolds流形。
一些机器学习喜好者是数学新手, 关于初学者,你不需求控制很多数学学问才干开端机器学习。
最近兴起了许多易于运用的机器学习和深度学习的装置包,如scikit-learn,weka,tensorflow,r-caret等。机器学习理论是横跨统计、概率、计算机科学和算法等相关范畴,能够用来构建智能应用程序。固然机器和深度学习有着无限前景,但就这些技术而言,透彻的数学了解对控制内部运算和取得较好的效果是十分有必要的。
为什么要强调数学?
毫无疑问机器学习中数学是重要的,例如你需求:
1. 选择适宜的算法,包括思索精度、锻炼时间、模型的复杂性、参数和数量特征;
2.选择参数设置和考证战略;
3.经过理解偏向方差权衡来辨认拟合缺乏与过度拟合;
4.估量正确的置信区间和不肯定性。
需求具备数学根底:
到底需求具备几数学学问才干了解机器学习这个穿插范畴的技术呢?这个问题没有统一的答案,通常是因人而异的。机器学习的数学公式和理论研讨正在停止中,研讨人员也正在研发更多的先进技术,所以答复这个问题是不太容易的。下面我将从以下方面论述我以为成为机器学习科学家/工程师所需的最低数学程度以及每个数学概念的重要性。
1. 线性代数:在ML中,线性代数四处都是。主成分剖析(PCA)、奇特值合成(SVD)、矩阵的特征合成、LU合成、QR合成/因式合成、对称矩阵,正交化和正交化、矩阵运算、投影、特征值和特征向量、向量空间和标准这些都是了解机器学习及其优化办法所必需的。线性代数令人惊奇的是,有很多在线资源。 我不断说传统的课堂正在死亡,由于互联网上有大量的资源。我最喜欢的线性代数课程是MIT(Gilbert Strang教授)课程。
2. 概率理论与统计学:机器学习与统计学范畴是有很多类似的中央。实践上,有人最近将机器学习定义为“在Mac上统计数据”。 机器学习需求根本统计和概率理论的综合学问,如概率规则和公理、贝叶斯定理、随机变量、方差和希冀、条件和结合散布、规范散布(伯努利,二项式,多项式,平均和高斯)、矩生成函数、最大似然估量(MLE)、先验和后验、最大后验估量(MAP)和抽样办法。
3. 多元微积分:主要范畴包括微积分、偏导数、向量值函数、梯度方向、Hessian矩阵、雅可比矩阵、拉普拉斯和拉格朗日散布。
4. 算法和复杂度优化: 这些在评价计算的效率和可扩展性,或应用稠密矩阵时,显得十分重要。 需求学问包括数据构造(二叉树,散列,堆,堆栈等)、动态规划、随机和线性算法、图形、梯度/随机降落和原对偶办法。
5. 其他:包括上述四个主要范畴未涵盖的其他数学主题。它们包括实剖析和复剖析(汇合和序列、拓扑、度量空间、单值和连续函数、限制、柯西内核、傅里叶变换),信息理论(熵,信息增益),函数空间和Manifolds流形。
一些机器学习喜好者是数学新手, 关于初学者,你不需求控制很多数学学问才干开端机器学习。
上一条:卷积神经网络CNN与深度学习常用框架
下一条:人脸识别SDK,活体SDK