AP统计 | 5分必考点梳理,省时又高效!

点击上方“AP考试小帮手”关注我们

AP统计 | 5分必考点梳理,省时又高效! [原文来自:www.11jj.com]

AP统计 | 5分必考点梳理,省时又高效!

[转载出处:www.11jj.com]

概述

统计按照大纲共分为四部分,分别是描述统计、抽样方法、概率论、统计推断。

(1) Exploring Data: Describing patterns anddepartures from patterns

(2) Sampling and Experimentation: Planningand conducting a study

(3) Anticipating Patterns: Exploring randomphenomena using probability and simulation

(4) Statistical Inference: Estimatingpopulation parameters and testing hypotheses

1

描述统计

数据(data)分为定性数据(qualitative or categorical data)与定量数据(quantitativedate)。

定性数据:按照类别进行划分,展示对象的属性;

定量数据:展示对象的数值特征。

图(graph):分为bar chart, pie chart, dotplot, stemplot, histogram, boxplot


Quality

Quantity

Bar chart

YES

NO

Pie chart

YES

NO

Stemplot

NO

YES

Dotplot

YES

YES

Histogram

NO

YES

Boxplot

NO

YES

通过图形可以看出数据的分布特征

(1)对称(symmetric)

(2)偏态(skewed)

          左偏(skewed to the left)

         右偏(skewed to the right)

(3)集中趋势

(4)异常值

AP统计 | 5分必考点梳理,省时又高效!

histogram的画法

(1)以个数作为高度

(2)以百分比作为高度

(3)以百分比作为面积。

概率密度(probability density function, pdf)

描绘以百分比作为面积的histogram的曲线。

累积分布(cumulative distribution function, cdf)

以小于等于该数的数据所占百分比作为该数的纵坐标绘制出的曲线。

数字特征(numerical value)

(1)描述集中趋势

(2)描述离散趋势

(3)描述位置

(4)标准化变量(z-score)

Center

Mode

Mean

Median


Spread

Range

Interquartile range

Variance

Standard deviation

Position

Simple ranking

Percentile ranking



Z-score





众数(mode)

一组数据中出现次数最多的数。

平均数(mean)

数据求和后除以数据个数。

数据的排序方式(从小到大)有两种

(1)简单排序(simple ranking)

第一、第二、第三等等

(2)百分位排序(percentile ranking)

某个数的百分位值等于小于该数的数据个数占整体的百分比。

将一组数据排序后,可得到

a.最小值(minimum)、最大值(maximum)

b.极差(range):最大值与最小值的差,max-min

c.中位数(median):排序后处于中间位置的数

d.四分位数(quartile):

位于25%、75%的数,记为Q1、Q3

(1).四分位差(interquartile range, IQR):两个四分位数的差值,IQR=Q3-Q1

(2).判断某个数是否为异常值(outlier),可用Q1-1.5IQR和Q3+1.5IQR作为标准进行衡量,如果该数超出这个范围则可认定为异常值。

(3)箱线图(boxplot)

剔除异常值后取最小值、Q1、中位数、Q3、最大值这五个数,最小值最大值作为两个端点,Q1、中位数、Q3作为三条线画出的图形。将异常值以散点的形式标注在最小值左侧和最大值右侧。

方差(variance)与标准差(standard deviation):衡量数据与平均值偏离程度平方和的平均值。

AP统计 | 5分必考点梳理,省时又高效!

这里需要注意的是,如果计算的是总体的方差和标准差,用1/n来求平均;如果计算的是样本的方差和标准差,用1/(n-1)来求平均。

标准化变量(z-score):计算方式是将原始数据减去平均数之后再除以标准差,用它可以展示不同度量单位数据的偏离程度。

AP统计 | 5分必考点梳理,省时又高效!

二维数据

二维定量数据

研究两个变量的关系

散点图(scatterplot)

以一个变量作为横坐标、另一个变量作为纵坐标绘制出的图形,以散点的形式表现在坐标轴中。变量选用单位不同,会造成图形有差异。

相关系数(linear correlation coefficient)

衡量两个量之间线性关系的指标,介于-1和1之间,负数代表两个变量之间是反向变化的,正数代表两个变量之间是同向变化的,越靠近0代表线性关系越弱,越靠近-1和1代表线性关系越强。它只能衡量线性关系,不能衡量非线性关系;只反应关系,不代表因果。

回归(regression)

寻找代表变量之间关系的数学表达式。

线性回归

假定变量之间存在一次函数的关系(形如y=kx+b)。此函数在坐标系中图像是一条直线,因此称作线性回归。

残差(residual)

真实值与估计值之间的差。

残差图(residual plot)

以一个变量作为横坐标、该变量所对应的残差为纵坐标绘制出的图形。若两变量之间存在线性关系,则残差图应为无规则的散点。

最小二乘法(least square)

利用残差平方和最小求出直线斜率与截距(k和b)的方法。

线性化(linearity)

将非线性关系转换为线性关系的方法,常用有对数变换、指数变换等。

2

抽样方法

总体(population):

研究对象的全体。


样本(sample):

总体中的一部分。


参数(parameter):

描述总体特征的指标,一般用希腊字母表示。


统计量(statistics):

描述样本特征的指标,一般用拉丁字母表示。


普查(census):

对总体中的每一个个体都进行研究。

抽样(sample):

对总体中的部分个体进行研究。


实验法(experiment):

对目标群体进行干预而得到数据。


观察法(observation):

不对目标群体进行干预而得到数据。


实验组(treatment group):

对该组中的个体进行干预。


对照组(control group):

不对该组中的个体进行干预。


影响因子(factor):
会对实验对象产生影响


变量混淆(confounded):

无法分离因子的影响


协同作用(common response):

多个因子共同造成影响


安慰剂(the placebo effect):

心理作用导致的变化


单盲试验(single blinding):

实验者知晓每一个体是否受到预先设置的干预,而被实验者不知晓。


双盲试验(double blinding):

实验者与被实验者都不知晓每一个体是否受到预先设置的干预。


简单随机抽样(simple random sampling):

随机地从总体中选取个体,每个个体被选到的概率是相等的。


系统抽样(systematic sampling):

首先将总体中的个体编号、排序,而后按照固定步长进行抽样。


分层抽样(stratified sampling):

首先将总体中的个体按照某一特征或标准划分为不同的层(strata),而后从每层中进行抽样。特征是每个层中的个体具有相似性。


整群抽样(cluster sampling):

首先将不同特征的个体划为分一个群(cluster),而后从每个群中进行抽样。特征是每个群具有多样性。

3

概率

频数(frequency):

某一结果出现的次数。


频率(relative frequency):

某一结果出现的次数占实验次数的百分比。


概率(probability):

某一结果出现可能性的大小,介于0和1之间。不可能事件(impossible event)的概率是0,必然事件(certain event)的概率是1,但反之不正确,概率为0的事件不一定是不可能事件,也有可能发生,概率为1的事件也可能不发生。


大数定律(the law of large numbers):

实验次数越大,频率越稳定,且取决于事件本身的概率。


基本公式:

AP统计 | 5分必考点梳理,省时又高效!


条件概率(conditional probability):

给定某一事件发生的条件下,另一事件发生的概率。


随机变量(random variable):

该变量的取值取决于实验的结果。


离散型(discrete):

随机变量的取值是一个一个的。


连续型(continuous):随机变量的取值是连续不间断的。


分布(distribution):

实验结果出现的规律。


均值(mean)与方差(variance):

AP统计 | 5分必考点梳理,省时又高效!
二项分布(binomial distribution):

将具有两个结果的实验重复多次,求其中某一结果出现次数的概率。

AP统计 | 5分必考点梳理,省时又高效!

几何分布(geometric distribution)
将具有两个结果的实验重复多次,求其中某一结果首次出现时实验次数的概率。

AP统计 | 5分必考点梳理,省时又高效!

正态分布(normal distribution):

代表常规现象出现次数多、极端现象出现次数少这样一种规律。


标准正态分布(standard normal distribution):

均值为0、方差为1的正态分布。


抽样分布(sampling distribution):

多次抽样后,样本统计量的分布规律。


标准误(standard error):
统计量的标准差。

AP统计 | 5分必考点梳理,省时又高效!

单总体样本比例的抽样分布

AP统计 | 5分必考点梳理,省时又高效!

AP统计 | 5分必考点梳理,省时又高效!

4

统计推断

参数估计(estimation):

利用统计量去预测参数。


区间估计(interval):

给出参数的范围。


置信水平(confidence level):

对参数多次进行估计得到多个区间,其中区间中包含真实参数的次数占估计次数的比例。


单总体比例区间估计:

AP统计 | 5分必考点梳理,省时又高效!

双总体比例差区间估计:

AP统计 | 5分必考点梳理,省时又高效!

单总体均值区间估计:

此时需考虑总体方差是否已知,(1)若已知则使用正态分布进行估计,(2)若未知则使用t分布进行估计。

AP统计 | 5分必考点梳理,省时又高效!

双总体均值差区间估计:

此时需考虑总体方差是否已知

(1)若已知则使用正态分布进行估计

(2)若未知

a.总体方差不等(pooled=no)

b.总体方差相等(pooled=yes),则使用t分布进行估计,但所用自由度与方差皆不相同。

AP统计 | 5分必考点梳理,省时又高效!

假设检验(hypothesis test):

利用统计量对参数的真伪进行检验。


原假设(null hypothesis):

待检验参数。


备择假设(alternative hypothesis):

当原假设被拒时所接受的假设。

根据备择假设形式的不同,分为双尾检验(two tailed)和单尾检验(one tailed)

AP统计 | 5分必考点梳理,省时又高效!

p值(p-value):

当原假设为真的时候得到此样本结果以及比此样本结果更极端结果的概率。p值越小,拒绝原假设的可能性越大。

第一类错误(type I error):原假设为真时却拒绝原假设。犯此错误的概率为显著性水平(significance level)。

第二类错误(type II error):原假设为假时却没有拒绝原假设。不犯此类错误的概率成为检验的power(power of the test)。

在样本容量(sample size)固定的条件下,两类错误为此消彼长的关系,若想同时降低两类错误,只能提升样本容量。


单总体比例检验:

AP统计 | 5分必考点梳理,省时又高效!

双总体独立样本比例差检验:

AP统计 | 5分必考点梳理,省时又高效!

单总体均值检验:

此时需考虑总体方差是否已知

(1)若已知则使用正态分布进行检验

(2)若未知则使用t分布进行检验。


双总体均值差检验:

此时需考虑总体方差是否已知

(1)若已知则使用正态分布进行检验

(2)若未知

a.总体方差不等(pooled=no)

b.总体方差相等(pooled=yes),则使用t分布进行估计,但所用自由度与方差皆不相同。


卡方检验(Chi-square)

拟合优度检验(goodness of fit):利用样本信息来检验总体是否符合某一分布。

独立性检验(independence):检验某一分类结果是否受另一分类影响。

计算器命令列表

AP统计 | 5分必考点梳理,省时又高效!


版权说明:此篇文章属尚学明德原创,任何..不得擅自选取、整篇搬运,违者必究其法律责任。

如果你有什么能补充的内容

欢迎在本篇文章评论区留言噢

AP统计 | 5分必考点梳理,省时又高效!

推荐阅读

戳链接可读

➔ AP考前读一读,心中全有数!有这么多考试注意事项你真的知道么?

➔ 建议收藏 重磅干货!2016-2017年度AP各科考试成绩分布 及易错点总结、备考建议

史上最全!最全!最全!AP考试的信息汇总,解决你关于AP的所有疑问!!

(2017-2018年度)

AP、SAT2

最新考纲、教材等..

添加尚学小助手可获得。

AP统计 | 5分必考点梳理,省时又高效!尚学小助手 | shangxuemingde

如果你是出国党,想要拯救GPA,求辅导AP、SAT2、honor课程等,那么我就是你的贴心小帮手; 如果你是学生家长,焦虑孩子的美高课程规划,以及GPA成绩,但又不知道该如何选择放心的..机构,那么请添加我,试着了解我们,这里有大牛的老师、专业的服务让您踏实放心。长按..,即可添加微信咨询。




AP统计 | 5分必考点梳理,省时又高效!1分钟之前删除AP统计 | 5分必考点梳理,省时又高效!♡ 学生, 家长, 老师, 老板等学生:老师授课风格专业,细致!家长:孩子在尚学明德学习,我才放心。

老师:继续努力!

美高暑期课程简介

自媒体 微信号:11jj 扫描二维码关注公众号
爱八卦,爱爆料。

小编推荐

  1. 1

    数字易经0到9代表什么卦(数字易经测算)

    大家好,小伟今天来为大家解答数字易经0到9代表什么卦以下问题,数字易经测算很多人还不知道,现在让我们一起来看看吧!1、数字1代表坎水、数

  2. 2

    苹果手机呼叫转移怎么设置(苹果手机呼叫转移怎么设置无法接通)

    大家好,小乐今天来为大家解答苹果手机呼叫转移怎么设置以下问题,苹果手机呼叫转移怎么设置无法接通很多人还不知道,现在让我们一起来看看

  3. 3

    中国红十字会标志简笔画(中国红十字会标志简笔画)

    大家好,小豪今天来为大家解答中国红十字会标志简笔画以下问题,中国红十字会标志简笔画很多人还不知道,现在让我们一起来看看吧!1、保护性

  4. 4

    八年级下册语文书人教版电子书(八年级下册语文书人教版电子书2022)

    大家好,小美今天来为大家解答八年级下册语文书人教版电子书以下问题,八年级下册语文书人教版电子书2022很多人还不知道,现在让我们一起来看

  5. 5

    古伊尔(魔兽古伊尔)

    大家好,小丽今天来为大家解答古伊尔以下问题,魔兽古伊尔很多人还不知道,现在让我们一起来看看吧!1、古伊尔是魔兽世界里面部落的一个酋长

  6. 6

    唯一极值点问题

    在高档数学的进修中,我们经常会碰着独一驻点的问题,在非常宽松的前提下,这个独一的驻点也就是极值点。今天我们稍微改变一下前提,商量如

  7. 7

    三公九卿制是什么(三公九卿制是什么朝代的制度)

    大家好,小乐今天来为大家解答三公九卿制是什么以下问题,三公九卿制是什么朝代的制度很多人还不知道,现在让我们一起来看看吧!1、三公九卿

  8. 8

    订房网哪个平台好(订房什么网最便宜)

    大家好,小娟今天来为大家解答订房网哪个平台好以下问题,订房什么网最便宜很多人还不知道,现在让我们一起来看看吧!1、携程、美团、艺龙、

Copyright 2024.依依自媒体,让大家了解更多图文资讯!