深入理解深度学习——正则化(Regularization):半监督学习

news/2024/6/30 8:27:15

分类目录:《深入理解深度学习》总目录


在半监督学习的框架下, P ( x ) P(x) P(x)产生的未标记样本和 P ( x , y ) P(x, y) P(x,y)中的标记样本都用于估计 P ( y ∣ x ) P(y | x) P(yx)或者根据 x x x预测 y y y。在深度学习的背景下,半监督学习通常指的是学习一个表示 h = f ( x ) h = f(x) h=f(x)。学习表示的目的是使相同类中的样本有类似的表示。无监督学习可以为如何在表示空间聚集样本提供有用线索。在输入空间紧密聚集的样本应该被映射到类似的表示。在许多情况下,新空间上的线性分类器可以达到较好的泛化。这种方法的一个经典变种是使用主成分分析作为分类前(在投影后的数据上分类)的预处理步骤。

我们可以构建这样一个模型,其中生成模型 P ( x ) P(x) P(x) P ( x , y ) P(x, y) P(x,y)与判别模型 P ( y ∣ x ) P(y | x) P(yx)共享参数,而不用分离无监督和监督部分。我们权衡监督模型准则 − log ⁡ P ( y ∣ x ) − \log P(y | x) logP(yx)和无监督或生成模型准则(如 − log ⁡ P ( x ) −\log P(x) logP(x) − log ⁡ P ( x , y ) −\log P(x, y) logP(x,y))。生成模型准则表达了对监督学习问题解的特殊形式的先验知识,即 P ( x ) P(x) P(x)的结构通过某种共享参数的方式连接到 P ( y ∣ x ) P(y | x) P(yx)。通过控制在总准则中的生成准则,我们可以获得比纯生成或纯判别训练准则更好的权衡。Salakhutdinov和Hinton描述了一种学习回归核机器中核函数的方法,其中建模 P ( x ) P(x) P(x)时使用的未标记样本大大提高了 P ( y ∣ x ) P(y | x) P(yx)的效果。

参考文献:
[1] Lecun Y, Bengio Y, Hinton G. Deep learning[J]. Nature, 2015
[2] Aston Zhang, Zack C. Lipton, Mu Li, Alex J. Smola. Dive Into Deep Learning[J]. arXiv preprint arXiv:2106.11342, 2021.


http://lihuaxi.xjx100.cn/news/1178918.html

相关文章

Pyhive——介绍使用举例

介绍 PyHive 是一个 Python 数据库连接工具和 ORM 框架,它提供了一个 Python 接口让用户可以连接多个不同的 Hadoop 数据存储系统,包括 Apache Hive, Apache Impala, Amazon Athena, Apache Spark SQL 等等。 PyHive 的目标是让 Python 开发者能够方便…

关于f-stack转发框架的几点分析思考

使用DPDK收包,想要用到TCP协议栈,可选的方案有linux原生的tun/tap口以及DPDK自带的KNI驱动,这两种都是通过将DPDK收到的报文注入到linux内核来使用TCP协议栈的功能,然后,用户态协议栈可以考虑开源的f-stack&#xff0c…

c# cad二次开发通过获取excel数据 在CAD绘图,将CAD属性导出到excel

c# cad二次开发通过获取excel数据 在CAD绘图,将CAD属性导出到excel using Autodesk.AutoCAD.ApplicationServices; using Autodesk.AutoCAD.EditorInput; using Autodesk.AutoCAD.Runtime; using System; using System.Collections.Generic; using System.Linq; us…

你在项目中是如何使用kafka的?

消息中间件是现代分布式系统中不可或缺的组件之一,它提供了高可靠性、高吞吐量的消息传递机制。Kafka作为一种开源的分布式消息队列系统,广泛应用于各行各业。本篇博客将介绍在实践中使用Kafka的一些技巧和最佳实践,帮助开发人员更好地利用Ka…

如何在华为OD机试中获得满分?Java实现【表示数字】一文详解!

✅创作者:陈书予 🎉个人主页:陈书予的个人主页 🍁陈书予的个人社区,欢迎你的加入: 陈书予的社区 🌟专栏地址: Java华为OD机试真题(2022&2023) 文章目录 1. 题目描述2. 输入描述3. 输出描述…

[元带你学: eMMC协议详解 10] Device 识别流程 与 中断模式

依JEDEC eMMC 5.1及经验辛苦整理,付费内容,禁止转载。 所在专栏 《元带你学: eMMC协议详解》 全文2700字,重点需掌握设备识别过程(CMD1 -> CMD2 -> CMD3), 这很常用, 也是最容易出现异常的地方。其他…

Linux(基础IO详解)

在基础IO这篇博客中,我们将了解到文件系统的构成,以及缓冲区究竟是个什么东东,我们都知道缓冲区,有时也谈论缓冲区,但不一定真的去深入了解过缓冲区。为什么内存和磁盘交互速度如此之慢?为什么都说Linux中一…

【LeetCode热题100】打开第6天:正则表达式匹配

文章目录 正则表达式匹配⛅前言🔒题目🔑题解 正则表达式匹配 ⛅前言 大家好,我是知识汲取者,欢迎来到我的LeetCode热题100刷题专栏! 精选 100 道力扣(LeetCode)上最热门的题目,适合…