李宏毅机器学习笔记（一）

本文最后更新于：2022年4月24日下午

课程信息：李宏毅Machine Learning 2017 fall B站链接，李宏毅老师课程主页

笔记导航：

Introduction of this course

What is Machine Learning?

$\approx$ Looking for a Function From Data

机器学习三步骤：把大象塞进冰箱

Learning Map：

Regression: The output of the target function $f$ is “scalar”.（e.g.预测PM2.5进行天气预报）

Classification:

Classification的Model分为Linear Model和Non-linear Model，Non-linear Model中最出名的就是Deep Learning。

以上均为Supervised Learning，均需要大量的Training Data，Training Data可以告诉我们要找的那个function的Input与Output之间有什么样的关系(Function的output又常叫label)。

Semi-supervised learning（半监督学习）可以减少Training Data的用量。Transfer Learning（迁移学习）也可以减少Training Data的用量，数据可以与考虑的任务无关（可以是标记的或未标记的）。

Unsupervised Learning就是想让机器学到无师自通。例1：让机器看大量的文章，看机器是否可以学会词汇的意思，比如用向量表示词汇。例2：让机器去动物园看一大堆，看机器是否能在看过动物后学会自己创造动物。例3：机器在看过大量图片后是否能学会自己生成图片。

Structured Learning是我们希望机器能输出有结构性的东西。

Reinforcement Learning（强化学习）是我们不告诉机器正确答案，只告诉机器我们对它输出的评价，机器唯一知道的的就是它做的好与不好。更加符合人类真实学习的情景。Alpha Go is supervised learning + reinforcement learning.

机器学习

本博客所有文章除特别声明外，均采用 CC BY-SA 4.0 协议，转载请注明出处！