自举方法简介

责声明">
注:在本标题的后期,我们将添加一些关于数学、机器学习和深入学习的内容。我们欢迎您的关注。我对数学特别感兴趣。自2008年以来,我一直对数学感兴趣。今天,我总是喜欢在业余时间思考数学。 B...

注:在本标题的后期,我们将添加一些关于数学、机器学习和深入学习的内容。我们欢迎您的关注。我对数学特别感兴趣。自2008年以来,我一直对数学感兴趣。今天,我总是喜欢在业余时间思考数学。

Bootstrap方法最早是由斯坦福大学统计学教授Efron于1977年提出的。

Bootstrap方法作为一种新的增广样本统计方法,为解决小样本测试的评价问题提供了一个很好的思路。

许多人会对Bootstrap这个名字感到困惑。自举在英语中的意思是自举,它来源于这样一个短语:靠自己的自举站起来。18世纪德国作家拉斯穆森的小说《《巴龙历险记》》描述了巴朗掉入湖中,沉入湖底。当他绝望的时候,他用靴子上的带子把自己拉了起来。现在它意味着不依靠别人的力量,而是依靠自己的努力来最终成功。Bootstrap方法在这里指的是使用原始样本自己的数据对新样本和统计数据进行采样。根据它的意思,它现在一般被翻译成自助方法。

在正常情况下,整体情况永远不会为人所知。我们只能用样本。现在的问题是,我们应该如何使用样本?Bootstrap的想法是:既然样本被抽出来了,为什么我不从样本中再取一个样本呢?

Bootstrap的采样方法是“用返回来绘制所有样本”(实际上,样本大小也取决于情况,不一定等于原始样本大小),这意味着Bootstrap的样本大小与原始样本相同,但只用返回来绘制。这种采样可以进行多次,每次可以获得相应的统计/估计,并最终看到该统计的稳定性(用方差表示)。

引导是一种采样方法。例如,我想数一数鱼塘里的鱼的数量。我该怎么做?步骤如下:

(1)收缩鱼塘,防止他人捕鱼(总分布不变)。

(2)捕获100条鱼并贴上标签(结构样品)。

(3)将鱼放回鱼塘休息一夜(与整个鱼群混合,确保事后随机取样)。

(4)开始钓鱼,一次钓100条鱼,数一数你昨天标记了多少条鱼,以及比例(重采样取分布)。

(5)重复步骤3和4 n次。建立分销渠道。

假设你第一次又钓了100条鱼,发现了12条有标记的鱼,记录了12%。把它们放回去,再钓100条鱼。发现9条有标记的鱼,记录9%。重复多次后,假设95%的置信区间,你会发现每条鱼平均有10条标记鱼。因此,我们可以粗略估计大约有1000个鱼塘。

Bootstrap适合小规模样本测试,这解释了为什么当样本很小时Bootstrap工作得更好。如果你这样想,如果我想数一数海里有多少鱼,标记100,000是没有用的,因为实际数字太大,而你采集的样本与你采集的样本相比又太小。最实际的事情是,下次你抓到100,000个,你会发现没有标记,这很尴尬。

  • 发表于 2019-11-20 18:17
  • 阅读 ( 237 )
  • 分类:黑客接单

你可能感兴趣的文章

相关问题

0 条评论

请先 登录 后评论
不写代码的码农
黑客

421 篇文章

作家榜 »

  1. 黑客 421 文章