遇到这个抽样分布的问题,一直不太理解,想请教下:
抽样分布的定义为:设X1,X2, …… ,Xn是来自总体X的一个样本,g(X1, x2, ……,Xn)中不含未知参数,称其为一统计量。。
这里提到,对总体进行抽样出N次样本。我没明白这N次样本中,每次样本的数量都是1个? 还是一组? 也就是说,到底是抽样出N组样本,还是N个样本?
如果是N个,如何提到样本均值?一个样本的均值不就是自身么?如果是一组的话,那有没要求每组的样本容量都相同?
我问过不少人,有些人说是一组样本,样本容量要求相同。而有些人说是一个样本,把我完全搞迷糊了。
样本为一个的答复,截图如下:
而样本为一组的答复,截图如下:
教科书上看到的说明是这样的:
我个人感觉应该是一组,但是又不能肯定,想请教各位指点下迷津~~
这是根据应用场景来的,抽取1个还是1组应该都是可以的。
怎么说应用场景? 教科书上的说法,并没有具体说明什么应用场景啊? 一般情况下是怎样的?
@老笨啊: 抽样不一定都要平均值的。你是没有想明白为什么会抽样1个,是吧?
我举个例子,可能不太恰当,为了说明场景,比如某网站有一群人的数据,希望看看他们生日的大概分布情况,用来做销售的决策。
那么就是从这群人抽取N个人,每个人就是一个样本,然后看N个人生日的分布情况,比如哪个月过生日的人多。
这个情况,每个样本组就是抽样一个人,如果每个组抽样多个人没有意义,总不能把12月生日的人和1月生日的人平均成 6月或7月份生日吧?
@老笨啊: 我说的场景就是要分析的具体内容。
不是每种数据的平均值都有用的,看分析的场景,有时候并不需要平均值,这时可以单个抽样。
比如生日,或者年龄的分布。如果一个抽样组有多个人(比如3个人,2岁,8岁,80岁),这个组平均年龄30岁,但是这个组没有一个人是属于30岁这个年龄段的。并不能通过这个平均年龄来代表这个组的年龄分布情况。
这是分类分析的场景,每个数据有自己的类别属性,而不是仅仅是个值
@wang_yb: 感谢,你举的例子很有说服力。不过,我想搞清楚一点,也就是对于中心极限定理来说,其从总体中抽样出N个样本,如果样本数量较大(一般是大于30),则不论总体服从什么分布,样本均值都会服从正态分布。---从这个定理来说,这N个样本中的每个样本,是一组,还是一个呢?(如果是你前面提到的生日和年龄,感觉均值计算是不合理的?是因为中心极限定理是针对连续型变量而言的吧?)
可以发原题吗?那张图片太小,看不清
没有原题啊。。你说哪张图片太小了? 我这个是我个人的疑问,然后去请教了他人。我把他们的答复,和书上的描述,都贴出来而已,并没有什么题目。。
@老笨啊: 啥手机拍的,太模糊了
@老笨啊: 我也没看明白....
@老笨啊: 要不你去看看别的教材吧,比如陈希孺的书,或者是《概率导论》。也许看看别的书就知道是什么意思了。
@会长: 嗯嗯,好的,谢谢!我再去看看。。这个方面,我感觉好多书都没有说得很明白。。