當前位置:法律諮詢服務網 - 企業資訊 - 常用的統計方法有哪些?

常用的統計方法有哪些?

平均值、中值、眾數、方差、標準差

常見統計數據

樣本矩

設x1,x2,…,xn為大小為n的樣本,對於自然數k,分別稱為k階樣本的原始統計量。

點矩和k階樣本中心矩統稱為樣本矩。許多最常用的統計數據可以從樣本矩構建。例如,樣本均值(α1)和樣本方差是兩種常用的統計量,前者反映整體中心位置的信息,後者反映整體的離差。還有其他常用的統計量,如樣本標準差、樣本變異系數S/ο、樣本偏度、樣本峰度等,都是樣本矩的函數。If (x1,y1),(x2,y2),...、(xn,Yn)是從二維總體(x,y)中抽取的簡單樣本,那麽樣本協方差和樣本相關系數也是常用的統計量,可以用r來推斷x和y的相關性。

次序統計

將樣本X1,x2,…,xn從小到大排列,得到,稱為樣本x1,x2,…統計量。

訂單統計,xn。其中最小次序統計量x(1)和最大次序統計量x(n)稱為極值,在年枯水量、年最大地震序列、材料斷裂強度等統計問題中非常有用。也有壹些有用的統計量來源於順序統計量,如:中位數樣本是對總體分布中心位置的壹種度量。如果樣本量n是奇數,如果n是偶數,則容易計算,魯棒性好。樣本p分位數ZP (0

u統計

它是由丁於在1948中提出的,在非參數統計中有著廣泛的應用。它的定義是:設X1,X2,...,Xn是簡單樣本,m是不超過N的自然數,並且是m元對稱函數,則稱之為樣本的核U統計量X1,X2,...,Xn。樣本均值和樣本方差是它的特殊統計量。

。自Howding以來,該統計量的大樣本性質被深入研究,主要用於構造非參數量的壹致最小方差無偏估計(見點估計),並在此估計的基礎上,檢驗非參數總體中的相關假設。

等級統計

樣品X1,X2,...,Xn按大小排列,如果叫Ri,就叫xi的秩,所有n秩R1,R2,...,RN構成秩統計量,其值總是1,2的排列,...秩統計量是非參數統計的主要工具統計量。

。也有壹些統計介紹,因為他們與某些統計方法的聯系。如假設檢驗中似然比原理引起的似然比統計量,K. Pearson擬合優度引起的X統計量(見假設檢驗),線性統計模型中最小二乘法引起的壹系列線性和二次統計量等等。

編輯本段適當性和完整性

從樣本中處理統計數據。當用統計量代替樣本進行統計推斷時,樣本中的統計量

其中包含的信息可能會丟失。如果樣本在處理成統計量時沒有信息損失,則稱之為充分統計量。比如從大量的產品中,依次抽取N個產品。如果第I個乘積合格,則xi=0,否則xi=1(i=1,2,…,n)。總體分布取決於整批產品的廢品率P。可以證明,統計量,即樣本中的不合格品數,包含了(x1,x2,…,xn)中關於P的所有信息,是壹個充分統計量。如果m

子分解定理。該定理適用範圍廣,使用方便,可以用來驗證許多常見統計量的充分性。例如,如果正態總體有壹個已知的方差,樣本均值就是足夠的統計量。如果正態總體的均值和方差未知,則樣本均值和樣本方差S共同構成充分統計量(S)。壹個統計量是否充分,與總體分布密切相關。將樣本處理成統計數據需要盡可能簡單。簡單程度主要以統計為主。

測量的維度。簡單來說,如果統計量T2是從統計量T1處理而來的(即T2是T1的函數),那麽T2就比T1簡單。在這個意義上,最簡單的充分統計量稱為微小充分統計量。這是E.L. Lyman和H. Sheffield在1950中提出的。在前面的例子中,足夠的統計數據是最小的。無論如何,樣品X1、X2、...,Xn本身是壹個充分的統計量,但它們壹般不是極小的。關於統計的另壹個重要的基本概念是完整性。設t為均勻度量,θ為總體分布的參數。若θ的任壹函數g(θ)至多有壹個基於T的無偏估計(兩個等概率1的估計量視為相同),則稱T是完備的。

編輯本段的抽樣分布。

統計量的分布稱為抽樣分布。與樣本分布不同,樣本分布是指樣本x1,x2,…,xn的聯合分布。統計學的本質和用統壹的度量來推斷的優越性取決於它的分布。統計的

因此,抽樣分布的研究是數理統計中的壹個重要課題。求統計量的精確抽樣分布屬於所謂的小樣本理論(見大樣本統計),但只有總體分布是正態的,才能得到比較系統的結果。對於壹維正態總體,有三種重要的抽樣分布,即ⅹ分布、t分布和f分布。ⅹ分布設隨機變量x1,x2,…,xn相互獨立,服從標準正態分布N(0,統計量。

1),隨機變量的分布稱為n自由度的X分布(其密度函數見概率分布,下面是T分布和F分布的密度函數表達式)。這個分布是F. Helmet在1875研究正態總體的樣本方差時得到的。如果x1,x2,...,xn是從正態總體N(μ,σ)中抽取的簡單樣本,則變量服從自由度為n-1的ⅹ分布。如果x1,X2、...,Xn服從的不是標準正態分布,而是正態分布n (μ i,1) (I = 1,2,...,n)依次計算,則X1,2的分布、...,n稱為非中心分布,稱為非中心參數。當δ = 0時,就是前面定義的X分布。由於這個原因,它有時被稱為中心X分布。ⅹ中心與非中心分布在正態線性模型的誤差方差估計理論中,在正態總體統計量中

它在體積方差檢驗(見假設檢驗)和壹般正態變量的二次理論中有重要應用。T-分布如果隨機變量ξ和η相互獨立,分別服從正態分布N(δ,1)和自由度N的中心η分布,則變量的分布稱為自由度N和非中心參數δ的非中心T-分布;當δ = 0時,稱為中心t分布。如果x1,x2,...,xn是從正態總體N(μ,σ)中抽取的簡單樣本,用來記錄樣本均值和樣本方差,它服從自由度為n-1的t分布。這個結果是由英國統計學家W.S .戈塞特(又譯珂賽特,筆名“學生”)在1908中提出的。相關統計中的t分布

在正態總體均值的估計和檢驗中,正態線性統計模型對可估函數的推斷具有重要意義。t分布的出現開始了數理統計小樣本理論的發展。f分布是由R.A. Fisher在20世紀20年代提出的。設隨機變量ξ和η相互獨立,ξ服從自由度m和非中心參數δ的非中心η分布,η服從自由度n的中心η分布,則該分布稱為自由度(m,n)和非中心參數δ的非中心f分布,當δ=0時,稱為中心f分布。如果x1,x2,…,xm和Y1,Y2,…,Yn分別來自正態總體N(μ統計量。

,σ)和N(v,σ),分別取S和S為和Yi的樣本方差,方差比S /S服從自由度的中心f(m-1,n-1)。中心和非中心f分布在方差分析理論中有重要的應用。多維正態總體的重要抽樣分布是Wichardt分布和hotelling t分布(見多元統計分析)。如果壹個統計量服從壹個分布,往往以該分布命名,如ⅹ統計量、f統計量、t統計量等。由於很難找到壹個精確的抽樣分布,統計學家轉而研究樣本量為n→∞時統計量的漸近統計量。

近似分布(即極限分布),這壹研究是數理統計大樣本理論的基礎工作。在這項工作的基礎上,提出了許多重要的統計方法。比如K . Pearson的著名結果(1900)擬合優度統計量的極限分布是壹個分布就是壹個代表性的例子。參考書目復旦大學:概率論(第二冊,數理統計),人民教育出版統計學。

她北京1979。費時,王福豹譯:《概率論與數理統計》,上海科學技術出版社,上海,1962。(M. Fisz,VEB·DEU-茨歇爾出版社,柏林,1958。)陳喜儒《數理統計導論》,科學出版社,北京,1981。

  • 上一篇:亳州僑城中學怎麽報名?需要什麽手續?
  • 下一篇:廚房汙水垃圾處理器品牌
  • copyright 2024法律諮詢服務網