不喜欢广告？去无广告今天 

置信区间计算器

开发人员数学

广告移除？

输入

自动处理

您正在估算什么？

平均值（连续数据——例如重量、时间、分数）

比例（是/否——例如%已转换，%已满意）

示例数据

样本量（n）

您的样本中的观测值数量。

样本均值（x̄）

从样本中计算出的平均值。

标准差（s）

样本标准差（在计算器上使用s键，而不是σ）。

分布

自动选择n小于30时使用t分布样本量小于30时使用Z分布，否则使用Z分布。只有在您知道总体σ时才需要覆盖此设置。

成功次数（x）

在n个响应中，有多少个是“是”/“已转换”/“积极”的。

置信区间方法

威尔逊方法在样本量小或比例接近0/100%时更准确。正态（瓦尔德）方法与大多数教科书一致。

置信水平

自定义（%）

介于50%和99.99%之间。

快速示例 — 成人身高（均值） · 政治民意调查（%） · A/B转化率（%） · 小型实验室样本

输出

客户端

广告移除？

指导

置信区间计算器

置信区间计算器将单个样本转换为对未知总体参数的可辩护范围估计。输入您的样本量、样本均值和样本标准差（或针对调查类数据，输入样本量和“是”的响应数量），它将返回下限、上限、误差范围以及所使用的精确临界值——所有计算均在您的浏览器中完成，使用统计教科书所依赖的Z和学生t分布。

支持两种模式。 均值模式 对于小样本（n < 30）自动选择t分布，对于大样本则选择Z分布，当已知总体σ时可手动覆盖。 比例模式 默认使用 威尔逊分数 区间，在小样本或比例接近0%/100%时表现优于教科书中的瓦尔德公式。

如何使用

选择您正在估算的内容——一个均值（如重量、时间、分数等连续数据）或一个比例（是/否结果）。
对于均值：输入样本量、样本均值和样本标准差。分布选择器默认为“自动”；除非您真正知道总体σ，否则无需更改。
对于比例：输入样本量和成功次数。除非您的统计课程明确要求使用瓦尔德方法，否则请保留威尔逊方法。
选择置信水平（80%、90%、95%、99%、99.9%，或50%到99.99%之间的任意自定义值）。
查看结果——绿色判断框以通俗语言显示区间，下方的分解表格列出所有中间数值（标准误差、临界值、误差范围、边界）。

特征

两种估算模式 ——样本均值（Z或学生t）和单比例（威尔逊分数或瓦尔德）。
自动分布选择 ——对于n < 30选择t分布，对于较大样本选择Z分布，并支持手动覆盖。
精确临界值 ——使用反向正态累积分布函数（Beasley-Springer-Moro）和反向学生t分布（正规化不完整β函数的数值反演），因此任何置信水平和任何自由度均无需查表即可使用。
比例的威尔逊分数 ——默认方法，在p̂ = 0%、p̂ = 100%或样本量极小时表现稳健，此时瓦尔德区间会失效。
自定义置信水平 ——五个常见预设值加上50%到99.99%之间的任意自定义值。
可视区间带 ——在数轴上渲染点估计值和置信区间带，使宽度立即可读。
可复制的摘要 ——一个等宽块，包含所有输入、计算步骤和最终区间，可直接复制到笔记或报告中。
快速示例 ——成人身高、政治民意调查、A/B转化率和小型实验室样本的一键预设。
100% 客户端 ——您的数据始终留在浏览器中；计算即时完成，无需服务器往返。

何时使用置信区间？

当您需要传达一个估计值及其不确定性时，请使用置信区间。仅报告一个数值（如样本均值为4.2，转化率为6.4%）会隐藏另一个样本可能给出不同值的事实。置信区间明确展示了这种变化：“我们有95%的置信度，真实值在3.50到4.90之间”。这种表述对于A/B测试、民意调查、实验室测量、医学研究、制造公差以及任何依赖差异是否真实而非仅由抽样噪声决定的决策至关重要。

广告移除？

均值与比例——选择哪种模式？

使用 均值模式 当您的样本是一系列数值测量时——反应时间、血压读数、月度收入、考试分数。您需要样本均值（x̄）和样本标准差（s）。使用 比例模式 当每个观测值是二元结果时——投票“是/否”、点击/未点击、恢复/未恢复。您只需要样本量和“是”结果的数量；计算器会处理其余部分。

 常问问题

95%置信区间实际上意味着什么？

这意味着在重复抽样中，该方法有95%的概率捕获真实总体参数。它并不意味着这个特定区间内有95%的概率包含真实值——真实值是固定的；只有区间会变化。
何时应使用t分布而不是Z分布？

当总体标准差（σ）未知，使用样本标准差（s）来估计时，应使用t分布。t分布具有更厚的尾部，以补偿从估计σ中产生的额外不确定性。一个常见的经验法则是在n ≥ 30时切换到Z分布，但当σ未知时，t分布始终是合理的。
为什么威尔逊分数区间与瓦尔德（正态）区间不同？

瓦尔德区间以观察到的比例为中心，并使用正态近似来计算标准误差。当样本量小或比例接近0或1时，它表现极差——有时会产生包含不可能值（如-5%或110%）的区间。威尔逊分数区间通过反向得分检验来构建，从而在这些边缘情况中提供更好的覆盖能力。对于大多数单比例问题，推荐使用威尔逊分数区间。
误差范围如何与样本量相关？

误差范围随样本量的平方根而减小。要将误差范围减半，大约需要四倍的样本量。这就是为什么调查人员追求更大的样本以获得更紧的区间，但很快会遇到边际回报——样本量加倍仅能将区间宽度缩小约30%。
置信水平与置信区间之间的区别是什么？

置信水平 (例如95%) 是该方法在重复抽样中的长期可靠性——在多次抽样中，该方法捕获真实参数的比例。置信区间是根据一次样本产生的具体数值范围（例如[4.10, 4.30]）。置信水平越高，区间越宽；水平越低，区间越窄。