‼️以法国公立大学和法国工程师学院为例,转专业申请是可行的!本篇主要探讨以下两个话题:⭐️哪些数学知识更重要?🪐如果要自学,路径和资源是什么?
人工智能之所以依赖数学,不是因为我们需要用公式去堆砌代码,而是因为我们需要用“数学思维”和计算机进行交互。人工智能的本质是让计算机通过算力,来模拟人的大脑进行决策,人工智能专业,就是不断地去优化这个模拟过程。人工智能专业想要走到高薪梯队,数学专业能力是最核心的竞争力。
话题一:四大数学知识是人工智能领域核心技能
一、线性代数:构建模型的空间观
神经网络听上去像是一个哲学概念,但它的本质是——矩阵乘法。我们对图像的识别,对声音的处理,对语言的理解,全部可以还原为一系列向量与矩阵的线性变换——因为世界本质上是结构性的。
我们输入一张图片,它其实是一堆像素矩阵;我们用神经元传递信息,本质是用线性组合(加权求和)提取特征;我们不断堆叠网络的层级,就是为了通过多个线性映射加非线性激活,让模型去捕捉那些人类肉眼无法直接感知的“高维抽象结构”。
这里的核心数学知识包括:
- 向量与矩阵运算:输入是向量,权重是向量,输出是点积,整层是矩阵乘法。
- 线性变换:本质上就是网络层的功能。
- 特征值与特征向量:用于PCA降维、理解数据分布方向。
- 张量:高维数据结构,是深度学习的数据承载体。
一句话,线性代数是空间的语言,是我们和计算机交流的共同起点。
二、概率论:为不确定性赋予可预测性
AI系统是确定的吗?从技术角度是,从哲学角度不是。它处理的是现实世界,而现实世界充满了模糊与随机。概率论的伟大之处在于,它不试图去抹除不确定性,而是接受它、利用它,并在此基础上做出最优判断。
这里的核心数学知识包括:
- 随机变量与概率分布:用来建模数据特性,常用如高斯分布。
- 贝叶斯定理:核心推理工具,广泛应用于分类器、更新模型。
- 最大似然估计(MLE)与最大后验估计(MAP):训练模型时用于参数估计。
- 熵与KL散度:衡量信息量与分布差异,是损失函数如交叉熵的理论基础。
- 隐马尔可夫模型(HMM):在序列建模、语音识别中广泛应用。
AI的决策能力之所以高级,可能是因为他的理性和克制,人是很难做到的:在错误无法避免的情况下,做出总体上最优的选择。
三、微积分:理解变化、追求极值
反向传播算法是深度学习的灵魂,但你如果不懂链式法则、梯度下降、偏导数的含义,你只是在复制别人的公式,而不知道它在“思考什么”。微积分是动态世界的语言。
这里的核心数学知识包括:
- 偏导数:度量输出对每一个参数的影响。
- 链式法则:反向传播核心。
- 梯度下降法:最基本的优化方式,通过梯度引导方向。
- 学习率、局部极小值问题:与收敛速度和收敛质量息息相关。
- 导数与函数性质(凸性、连续性):决定是否存在最优解。
四、优化理论:AI的进化机制
“煮泡面要三分钟,烧水要两分钟,最快做好一顿饭要几分钟?”
答:五分钟。
“煮泡面要三分钟,烧水要两分钟,烤香肠要两分钟,最快做好一顿饭要几分钟?
答:不是七分钟,还是五分钟。因为可以一边烤肠一边煮泡面” 。
这就是华罗庚老前辈的优选法。优化理论可以看成是华罗庚华老“优选法”的现代进阶版应用,这里的核心数学知识包括:
- 损失函数:模型学习的目标,可以是交叉熵、均方误差等。
- 各种优化器:SGD、Adam、RMSprop 等根据梯度调整参数。
- 凸优化理论:在特定条件下保证全局最优。
- 拉格朗日乘子法:处理带约束的优化问题。
- 探索-利用平衡:强化学习中优化行为策略的博弈。
话题二:转专业或者学前自学储备分级指南
非数学和编程专业的同学如果想转专业,要做好从本科一年级开始重新学习的准备,这里给大家一份转专业行动清单:
1️⃣第一阶段:打基础(适合数学基础薄弱者,可跳过)
学习初高中数学课本(代数、函数、基础几何)
线上资源:Khan Academy(初等代数、函数)、B站清华附中数学课,推荐大家两者结合看,前者是免费的,主要帮助大家适应“用英语学数学”,并且扫清专业词汇,毕竟日后大量文献都是英语的。
2️⃣第二阶段:核心数学模块入门(高数基础)
1. 线性代数:
理论内容:矩阵运算、线性变换、特征值、张量概念
推荐课程:MIT OpenCourseWare - Gilbert Strang《线性代数》
2. 概率与统计:
理论内容:条件概率、概率分布、期望、方差、熵
推荐课程:Khan Academy《概率论》、斯坦福CS109公开课
3. 微积分:
理论内容:导数、偏导数、梯度、极值点、链式法则
推荐课程:Paul's Online Math Notes 或 小破站上的《微积分入门》
3️⃣第三阶段:数理工具的AI应用拓展
这一阶段目标是将数学概念引入到具体AI场景中。我们需要强化掌握反向传播算法(需要链式法则 + 偏导),理解优化算法原理:梯度下降、Adam、动量法。等这些基础AI拓展理论。看上去很琐碎,但其实大部分的教程这一部分的知识都是打包的,跟着学就行。同时,这一部分内容以后可能还会彻底变更,因为这是基于目前大语言模型的通用算法理论,以后也许会有变化,需要更新。
推荐课程:Andrew Ng《Machine Learning》第一章(梯度下降)
4️⃣第四阶段:简易编程与实践
1. 学会Python基础(列表、函数、循环三大模块)。Python目前还是最重要最通用的编程语言,相对其他的语言更简单。另外,现在在AI工具的加持下,比如腾讯混元,Cursor工具,会让大家学习编程的过程非常简单——类似于带着纠错软件来学习外语,大大简化了大家改bug的时间。妥妥的时代福利!
2. 掌握NumPy和Pandas进行矩阵与数据处理
可以通过项目来练习,Python实现线性回归、逻辑回归模型。基本上所有新一点的Python教程都带这种项目,逃不掉的。
推荐平台:廖雪峰Python教程,或Python官方文档 + Codecademy
5️⃣第五阶段:小规模实战项目与模型实现
这一阶段我们会实现一些经典模型,初步接触真实数据和调参逻辑。当然高级的肯定接触不到,这就是为啥还得科班去学习,因为我们没有项目练手,更没有算力强大的计算卡。居家条件常见的两个基础练习是用Kaggle数据集实现二分类模型以及TensorFlow或PyTorch构建三层神经网络。
推荐资源:fast.ai、Kaggle Courses、Coursera《Deep Learning Specialization》,这里的资源我比较推荐国外原生的,尤其是coursera上的资源。
自此,我们对于人工智能专业的储备基本可以达到大一下班学习的水平。在另一方面,P叔个人认为国外的教程视频做的普遍比较好,更形象,而国内的的经典教材习题多,方便练习。当然,我们也可以随时使用AI工具来帮我们答疑和指导练习题,AI时代妥妥的人间福利千万不要错过!