1.2 无监督学习和强化学习

创始人

2024-03-09 10:00:46

0次

1.2 无监督学习和强化学习

无监督学习
- 定义
- 无监督学习与监督学习的区别
- 相关概念
- 流程图
强化学习

无监督学习

定义

无监督学习 (Unsupervised Learning）是指从无标注数据中学习预测模型的机器学习问题，其本质是学习数据中的统计规律或潜在结构。

无监督学习与监督学习的区别

监督学习：

标注数据：表示输入输出的对应关系
预测模型：对给定的输入产生相应的输出
本质：学习输入到输出的映射的统计规律

无监督学习：

无标注数据：自然得到的数据
预测模型：表示数据的类别、转换或概率
本质：学习数据中的统计规律或潜在结构

相关概念

输入空间：X
隐式结构空间：Z
模型：函数z=g(x)z=g(x)z=g(x)，条件概率分布P(z∣x)P(z \mid x)P(z∣x)或条件概率分布P(x∣z)P(x \mid z)P(x∣z)
假设空间（Hypothesis Space）：所有这些可能模型的集合。
目的：选出在给定评价标准下的最优模型。
样本容量为N的训练集:
U={x1,x2,⋯,xN}U=\left\{x_{1}, x_{2}, \cdots, x_{N}\right\}U={x1,x2,⋯,xN}

流程图

在这里插入图片描述

强化学习

假如环境中，有一个奖励rtr_{t}rt，如果采取动作ata_{t}at，环境就能根据智能系统，来决定下一个状态st+1s_{t+1}st+1、奖励rt+1r_{t+1}rt+1，之后再不停地循环，智能系统决定下一个状态和奖励是根据长期累积奖励最大化来实现的。

强化学习可以基于策略，也可以基于价值，基于策略则选择最优策略，而基于价值的选择最优价值，之后会的得到一个最优模型。

在这里插入图片描述

注：以上笔记素材来自于 B站_简博士_十分钟机器学习系列视频《统计学习方法》

上一篇：无犯罪记录证明、临时身份证明手机点一点轻松就能办

下一篇：传奇开服架设教程

相关内容

热门资讯

倍轻松（688793）披露涉及... 截至2025年12月24日收盘，倍轻松（688793）报收于26.43元，较前一交易日上涨1.23%...

景区5万月薪招185腹肌帅哥陪... 月薪5w+，急招185+帅哥腹肌陪滑官！近日，四川绵阳九皇山景区一则招聘文章，吸引了网友注意。网友表...

海南这五年：构建与自贸港建设相... 中新网海口12月24日电 (记者符宇群)海南省司法厅厅长王磊24日在海口举行的海南司法行政“十四五...

七彩化学（300758）披露提... 截至2025年12月24日收盘，七彩化学（300758）报收于13.16元，较前一交易日下跌0.3%...

广田集团（002482）披露修... 截至2025年12月24日收盘，广田集团（002482）报收于1.73元，较前一交易日上涨1.17%...

靖国神社，被起诉张昀/央视新闻当地时间23日，二战期间被强征兵役的韩军遗属等举行记者会，介绍诉讼内容。当地时间...

蓝科高新（601798）披露制... 截至2025年12月24日收盘，蓝科高新（601798）报收于9.0元，较前一交易日下跌0.33%，...

[视频]被日强征韩籍军人遗属起... 央视网消息（新闻联播）：二战时期被日军强制征兵的部分韩籍军人的遗属23日向韩国首尔中央地方法院提起诉...

镇江经开民警巧妙化解停车纠纷，... 扬子晚报网12月24日讯（通讯员毛润民雷楚楚记者姜天圣）12月20日晚，镇江经开区丁卯派出所...

“国际”清风 | “宪法引领·... 在医院党委的高度重视和支持下，为深入学习宣传宪法、弘扬宪法精神，切实提升全院员工的法治素养，我院于第...