李宏毅机器学习笔记(一)
本文最后更新于:2022年4月24日 下午
课程信息:李宏毅Machine Learning 2017 fall B站链接,李宏毅老师课程主页
笔记导航:
Introduction of this course
What is Machine Learning?
$\approx$ Looking for a Function From Data
机器学习三步骤:把大象塞进冰箱
Learning Map:
Regression: The output of the target function $f$ is “scalar”.(e.g.预测PM2.5进行天气预报)
Classification:
- Binary Classification 二元分类 (e.g.Spam filtering)
- Multi-class Classification 多分类 (e.g.Document Classification)
Classification的Model分为Linear Model和Non-linear Model,Non-linear Model中最出名的就是Deep Learning。
以上均为Supervised Learning,均需要大量的Training Data,Training Data可以告诉我们要找的那个function的Input与Output之间有什么样的关系(Function的output又常叫label)。
Semi-supervised learning(半监督学习)可以减少Training Data的用量。Transfer Learning(迁移学习)也可以减少Training Data的用量,数据可以与考虑的任务无关(可以是标记的或未标记的)。
Unsupervised Learning就是想让机器学到无师自通。例1:让机器看大量的文章,看机器是否可以学会词汇的意思,比如用向量表示词汇。例2:让机器去动物园看一大堆,看机器是否能在看过动物后学会自己创造动物。例3:机器在看过大量图片后是否能学会自己生成图片。
Structured Learning是我们希望机器能输出有结构性的东西。
Reinforcement Learning(强化学习)是我们不告诉机器正确答案,只告诉机器我们对它输出的评价,机器唯一知道的的就是它做的好与不好。更加符合人类真实学习的情景。Alpha Go is supervised learning + reinforcement learning.
本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!