李宏毅机器学习笔记(一)

本文最后更新于:2022年4月24日 下午

课程信息:李宏毅Machine Learning 2017 fall B站链接李宏毅老师课程主页

参考博客参考笔记

笔记导航:

Introduction of this course

What is Machine Learning?

$\approx$ Looking for a Function From Data

机器学习三步骤:把大象塞进冰箱

Learning Map:

Regression: The output of the target function $f$ is “scalar”.(e.g.预测PM2.5进行天气预报)

Classification:

  • Binary Classification 二元分类 (e.g.Spam filtering)
  • Multi-class Classification 多分类 (e.g.Document Classification)

Classification的Model分为Linear Model和Non-linear Model,Non-linear Model中最出名的就是Deep Learning。

以上均为Supervised Learning,均需要大量的Training Data,Training Data可以告诉我们要找的那个function的Input与Output之间有什么样的关系(Function的output又常叫label)。

Semi-supervised learning(半监督学习)可以减少Training Data的用量。Transfer Learning(迁移学习)也可以减少Training Data的用量,数据可以与考虑的任务无关(可以是标记的或未标记的)。

Unsupervised Learning就是想让机器学到无师自通。例1:让机器看大量的文章,看机器是否可以学会词汇的意思,比如用向量表示词汇。例2:让机器去动物园看一大堆,看机器是否能在看过动物后学会自己创造动物。例3:机器在看过大量图片后是否能学会自己生成图片。

Structured Learning是我们希望机器能输出有结构性的东西。

Reinforcement Learning(强化学习)是我们不告诉机器正确答案,只告诉机器我们对它输出的评价,机器唯一知道的的就是它做的好与不好。更加符合人类真实学习的情景。Alpha Go is supervised learning + reinforcement learning.


本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!