t检验的方法(t检验的方法和步骤)

还记得大学统计学的知识吗? 作者以最精湛的语言和简单的案例,帮助你迅速将t检验应用于实战。 因为对统计学的理论想得太多了,所以不需要摆脱,所以知道使用方法就行了。

作为产品经理,在经过一系列封锁将需求方案落地后,判断方案效果的好坏是非常重要的步骤。 在产品广泛发表之前,我们通常会进行样本量小范围的测试; 这些测试也可以分为在线和离线。 实体产品通常邀请顾客到店里体验产品,收集用户反馈; 互联网产品大部分公司都设计了简单的在线测试方案,通过观察用户的行为数据来判断方案的效果,在成本允许的情况下,进行在线用户测试也是非常必要的。

那么,对于样本数量少的测试计划,如何判断产品效果的好坏呢? 如果你邀请10个用户体验你的产品,10个用户反馈给你的信息很棒,你的产品一定能满足大部分目标顾客的需求吗? 烦恼的时候,请不要着急。 t检定可以在实战中使用。 这个简单常用的检查方法在线上两者都可以吃。 本系列通过3个例子,使您能够完全理解t检定的实战方式。

如果你几乎忘记了大学统计学的知识,请不要担心。 笔者以最精湛的语言和简单的案例,使t检验能够立即应用于实战。 不要在意很多统计学理论,知道如何运用就行了。

需要知道的两个重要的前知识点:

t检定的升级版实际上是z检定。 虽然t检验只是z检验的替代版,但80%的情况下,我们使用t检验。 因为知道z检定的使用前提是整体的平均值。 但是,这个条件在现在的情况下几乎是不可能的。 请参阅(。 在总体平均值未知、样本量少的情况下(一般样本量为30,这需要取决于样本来源的总体大小),还是使用t检验。 z检定和t检定方法可以使用的最重要的前提是定理中心极限定理。 从总体中提取一定数量的样本,计算该样本的平均值,重复提取100次后,这些样本的平均值分布将被归一化。 得益于这个定理,我们的t检验适用于任何一个母集团。 好的,暂且补充这两个知识点。 但是,我解释了为什么我们可以使用t检验,以及为什么要使用t检验。 如果一直补充前置知识,就会变成无限循环。 (做长椅需要木头,做木头需要斧头,做斧头需要铁。 那么,下一步如果有未知名词或未知概念,谷歌就可以了,接下来具体说明t检验的活用。

t检查分为单检体t检查、独立检体t检查、依赖检体t检查3种,今天就最初的单检体t检查进行说明。

单样本T检验:(One-Sample t-test)

和他的名字一样,单一的样品t检验是我们只有一个样品。

如果样本的平均值为,则样本的平均值为,要知道来源于该样本的样本群体是否与具有该平均值的样本群体明显不同。

一般的单一样品t检查步骤如下。

1. 提出问题,设定0假设和对立假设

0假设是指假设这个样本与整体没有明显不同; 一般来说X=

对立的假设根据实际情况可以分为三种:

假设这个样本与整体明显不同。 假设这个样本高于总体平均值。 假设该样本低于整体的平均值。

2. 确定样本均值和样本标准偏差

其中,是每个样本的值,n是样本数。

不用担心,大多数数据处理工具都可以直接计算出这个值。 (例如,excel,python的编号库的std ) )函数) )

3. 确定均值标准误差SEM

(n为样本数) )。

标准误差用于测量采样误差,标准误差越小,样本统计量和总体参数的值越接近,样本对总体越有代表性,表示利用样本统计量估计总体参数的可靠性越高。

要选择

4. 确定95%/99%置信水平下t临界值

95%或99%的信任等级,必须根据情况进行选择。 一般来说,数值越大精度越高,95%可以满足大多数数据要求。 t阈值的决定需要使用t形式。 指向t表格的链接(参见百度文库https://wenku.Baidu.com/view/c010 CDC 22CC 58BD 63186 BD 84.html )。

如何使用t形式? 需要基于自由度和显性化水平两个值进行研究。 一般自由度df=n1根据第一步设定的对立假设,决定是片尾检查还是双尾检查,根据95%/99%的可靠性水平求出显性化水平。

5. 确定t值

t值的计算公式:

6. 得出结论

将求出的t值与t阈值进行比较,根据有t值的区域判断是否拒绝0假设,接受对立假设。

7. 确定Cohen’s d(可选)

Cohen’SD等于(样本平均(总体平均) ) /样本的标准偏差,它反映了样本平均和总体平均之间有多少个标准偏差。

8. 确定95%/99%置信区间(可选)

置信区间式

置信区间确定了此样本所在的总体均值所在范围。

具体案例

此案例为定性数据定量化的案例之一。

假设我们现在要判断一款产品的用户体验如何,用户体验这个概念比较主观,我们需要将定性的数据进行定量化处理。

我们一般的用户体验分为以下5种:

感官体验:呈现给用户视听上的体验,强调舒适性。交互体验:呈现给用户操作上的体验,强调易用/可用性。情感体验:呈现给用户心理上的体验,强调友好性。浏览体验:呈现给用户浏览上的体验,强调吸引性。信任体验:呈现给用户的信任体验,强调可靠性。

我们针对每一种体验分别给予0-10,10个评分等级,针对每种体验给予自己主观的打分,之后算出五个分数的平均得分。

例如我们的一个目标用户的体验得分如下:

分数段 得分

感官体验 0-10 4

交互体验 0-10 7

浏览体验 0-10 6

情感体验 0-10 7

信任体验 0-10 8

平均得分 6.4

我们邀请28个目标用户,事先与其沟通好每种体验的正确体验方式,得出了28人的体验平均得分样本:

6.2,5.3,8.7,7.4,5.2,6.9,8.3,4.4,7.8,6.5,5.9,5.3,5.4,7.5,7.4,4.3,8.5,6.9,6.4,4.7,8.7,6.4,9.2,6.3,4.7,6.5,5.4,7.1

我们假设用户体验的行业及格平均分的标准为6分。

那么,我们提出的问题是,此产品的用户体验平均得分是否超过行业及格标准分?

1. 提出问题,设定0假设和对立假设

(1)0假设

此产品的用户体验平均得分等于行业及格平均分。

(2)对立假设

此产品的用户体验平均得分大于行业及格平均分。

2. 确定样本的均值和样本标准偏差

根据样本数据我们求得:

3. 确定SEM(均值标准误差)

4. 确定95%的置信水平下t临界值

自由度

因为我们设置的对立假设为,所以此检验为单尾检验,根据95%置信水平查询T表格得:

t临界 = 1.703

5. 确定t值

6. 得出结论

根据t值与t临界值之间的关系,我们拒绝0假设,我们可以判断此产品的用户体验及格,并且此产品的用户体验平均得分大于行业及格平均分。

7. 确定95%置信区间

根据公式:

我们算出95%置信区间为(6.13,6.96),也就是说此产品如果计算所有用户的用户体验平均得分,那么评分的总体均值大概会落在6.13~6.96之间。

至此我们完成了一个定性数据定量化的简单案例,有了这个数据,我们可以更加直观的对产品的用户体验做出判断,这就是单样本T检验的应用案例之一。

下期我们将会讲解接下来的两种检验方法:独立样本T检验,相依样本T检验。

欢迎拍砖。

本文由 @gsdsp 原创发布于人人都是产品经理。未经许可,禁止转载。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注