写于 2017-06-05 01:07:03| 奇幻城国际唯一官网| 娱乐
<p>p值和回归的想法会让你在冷汗中爆发吗</p><p>永远不要害怕 - 继续阅读一些燃烧统计问题的答案,这些问题可以让你保持879%的夜晚你需要两种类型的假设来解决这个问题:零和替代零假设总是说明现状:那里两个种群之间没有差异,没有添加肥料的效果,天气和生长速度之间没有关系基本上没有任何有趣的事情发生一般来说,科学家进行一项试验反驳零假设的实验我们通过数据收集建立证据,对于零,如果证据充足,我们可以用一定程度的概率说零假设不是真的我们接受另类假设这个假设说明与零相反:存在差异,有效果,有一个关系你在统计数据中遇到的最常见数字之一是alpha = 005(或在某些字段001或010)Alpha表示固定s给定假设检验的可疑性水平在开始任何统计分析之前,同时说明假设,您选择您正在测试的显着性水平</p><p>这表示您准备接受I型错误可能性的阈值 - 否则称为误报 - 拒绝实际上为零的零假设我们通常主要关注的是减少类型I错误超过其对应的机会(类型II错误 - 接受假零假设)这一切都取决于任何一个的影响错误将是一家制药公司测试一种新药;如果药物实际上不起作用(一个真正的零假设)然后拒绝这个零并断言药物确实起作用可能会产生巨大的影响 - 特别是如果患者被给予这种药物超过实际有效的药物制药公司将主要关注减少I型错误的可能性有时,II型错误可能更重要环境测试就是这样一个例子;如果检查毒素对水质的影响,并且实际上零假设是假的(即,毒素的存在确实影响水质),则II类错误意味着接受假零假设,并得出结论没有效果毒素的下游问题可能是可怕的,如果毒素水平允许保持高水平,并且对使用水的人有一些健康影响因为p值在像科学五彩纸屑这样的科学中被抛出,重要的是要了解它们的作用和并不意味着p值表示从假设检验中获得给定结果的概率,或者如果零假设为真,则表示更极端的结果</p><p>鉴于我们试图拒绝原假设,这告诉我们的是赔率如果零假设是正确的,那么得到我们的实验数据如果赔率足够低,我们有信心拒绝零并接受替代假设什么是足够低</p><p>如上所述,典型的固定显着性水平是005因此,如果p值描绘的概率小于5%,则拒绝原假设但是固定的显着性水平可能是欺骗:如果5%是显着的,为什么是6%不</p><p>记住这样的概率是连续的,并且任何给定的显着性水平是任意的,这是值得的</p><p>换句话说,不要仅仅因为你获得6-10%的p值而抛弃你的数据</p><p>这可能是它到来时最大的问题实验设计,重点在于确保正确的数据类型,数量足够大,可以尽可能清晰有效地回答给定的问题</p><p>伪复制是指自由度的过度膨胀(数学上的限制因素)当我们计算一个参数 - 例如一个平均值 - 从样本中到位时)这在实践中如何运作</p><p>假设您通过从20名男性参与者中采集血液来研究胆固醇水平每个男性进行两次测试,给出40个测试结果但复制水平不是40,实际上只有20 - 复制的必要条件是每个复制都独立于所有其他在这种情况下,来自同一个人的两次血液测试错综复杂地联系在一起 如果您要分析样本大小为40的数据,那么您将犯下伪复制的罪:夸大您的自由度(这有助于创建一个重要的测试结果)因此,如果您开始实验了解独立复制,你可以避免这个陷阱有一个关键的先验知识,将帮助你确定如何分析你的数据你正在处理什么样的变量</p><p>有两种最常见的变量类型:1)连续变量这些可以取任何值你是否在测量反应完成前的时间,结果可能是30秒,2分13秒,或3分50秒2)分类变量这些适合 - 您猜对了 - 类别例如,您可能有三个不同的现场站点,或四个品牌的肥料所有连续变量都可以转换为分类变量使用上面的示例我们可以将结果分类为小于一分钟,一到三分钟,三分钟以上分类变量无法转换回连续变量,因此通常最好将数据记录为“连续”,尽可能为自己提供更多分析选项决定两者之间使用哪些一旦你知道你有哪些变量,主要的分析类型很容易:ANOVA(方差分析)用于比较分类变量和连续变量我们的变量 - 例如,肥料处理与植物生长在厘米中比较两个连续变量时使用线性回归 - 例如,时间与以厘米为单位的增长尽管有许多分析工具可用,但ANOVA和线性回归将在很长的路要走查看您的数据因此,如果您可以从计算出您拥有的变量开始,那么选择相关分析是第二步很简单</p><p>好吧,也许这不是您需要了解的有关统计数据的所有内容,但这是一个开始前进并分析!

作者:葛贡