諮詢師現代工程諮詢方法概述串講（十一）

第二節因果分析法-1

因果分析法主要包括:

回歸分析法.

彈性係數分析法.

消費係數法等方法。

回歸分析法是分析相關因素相互關係的一種數理統計方法，通過建立一個或一組自變數與相關隨機變數的回歸分析模型，來預測相關隨機變數的未來值。回歸分析法按分析中自變數的個數分為一元回歸與多元回歸；按自變數與因變數的關係分為線性回歸與非線性回歸。不論是一元回歸模型還是多元回歸模型，預測模型的建立要經過嚴格的統計檢驗，否則模型不能成立。
彈性係數法是—種相對簡單易行的定量預測方法，通過計算某兩個變數相對變化彈性關係，彈性是—個相對量，它衡量某—變數的改變所引起的另—變數的相對變化。
消費係數法是按行業、部門、地區、人口、群體等對某產品的消費者進行分析，認識和掌握消費者與產品的數量關係，從而預測產品需求量。

一、一元線性回歸

(一)基本公式

如果預測對象與主要影響因素之間存線上性關係，將預測對象作為因變數y，將主要影響因素作為自變數x，即引起因變數y變化的變數，則它們之間的關係可以用一元回歸模型表示為如下形式：
y=a+bx+e
其中：a和b是揭示x和y之間關係的係數，a為回歸常數，b為回歸係數
e是誤差項或稱回歸餘項。
對於每組可以觀察到的變數x，y的數值xi，yi，滿足下面的關係：
yi =a+bxi+ei
其中ei是誤差項，是用a+bxi去估計因變數yi的值而產生的誤差。
在實際預測中，ei是無法預測的，回歸預測是藉助a+bxi得到預測對象的估計值yi。為了確定a和b，從而揭示變數y與x之間的關係，公式可以表示為：
y=a+bx
公式y=a+bx是式y=a+bx+e的擬合曲線。可以利用普通最小二乘法原理(ols)求出回歸係數。最小二乘法基本原則是對於確定的方程，使觀察值對估算值偏差的平方和最小。由此求得的回歸係數為：
b=[∑xiyi—x∑yi]/∑xi2—x∑xi
a=y’-bx’
式中：xi、yi分別是自變數x和因變數y的觀察值，x-、y-分別為x和y的平均值.
x-=∑xi/ n
y-= ∑yi/ n
對於每一個自變數的數值，都有擬合值：
yi’=a+bxi
yi’與實際觀察值的差，便是殘差項
ei=yi一yi’

(二)一元回歸流程

(三)回歸檢驗

在利用回歸模型進行預測時，需要對回歸係數、回歸方程進行檢驗，以判定預測模型的合理性和適用性。檢驗方法有方差分析、相關檢驗、t檢驗、f檢驗。對於一元回歸，相關檢驗與t檢驗、f檢驗的效果是等同的，因此，在一般情況下，通過其中一項檢驗就可以了。對於多元回歸分析，t檢驗與f檢驗的作用卻有很大的差異。

1．方差分析

通過推導，可以得出：
∑(yi—y-)2= ∑(yi—yi’)2+∑(yi—y-)2
其中：
∑(yi’—y-)2=tss，稱為偏差平方和，
反映了n個y值的分散程度，又稱總變差。
∑(yi—yi’)2=rss,稱為回歸平方和，
反映了x對y線性影響的大小，又稱可解釋變差。
∑(yi—yi’)2=ess，稱為殘差平方和，
根據回歸模型的假設條件，ess是由殘差項e造成的，它反映了除x對y的線性影響之外的一切使y變化的因素，其中包括x對y的非線性影響及觀察誤差。因為它無法用x來解釋，故又稱未解釋變差。
所以，tss=rss+ess
其實際意義是總變差等於可解釋變差與未解釋變差之和。
在進行檢驗時，通常先進行方差分析，一方面可以檢驗在計算上有無錯誤；另一方面，也可以提供其他檢驗所需要的基本數據。
定義可決係數r2，
r2 =rss/tss
r2 的大小表明了y的變化中可以用x來解釋的百分比，因此，r2 是評價兩個變數之間線性關係強弱的一個指標。可以導出，
r2 = rss/tss=∑(yi—yi’)2 /∑(yi—y-)2
=1- ess/ tss=1-∑(yi—y-)2 /∑(yi—y-)2

2．相關係數檢驗

相關係數是描述兩個變數之間的線性相關關係的密切程度的數量指標，用r表示。

r在—1和1之間，
當r=1時，變數x和少完全正相關；
當r=-1時，為完全負相關；
當0<r<1時，為正相關；
當-1<r<0時，為負相關。
當r=0時，變數x和y沒有線性關係。
所以，r的絕對值越接近1，表明其線性關係越好；
反之，r的絕對值越接近0，表明其線性關係越不好。
只有當r的絕對值大到一定程度時，才能採用線性回歸模型進行預測。在計算出r值後，可以查相關係數檢驗表(見書附表1)。
在自由度n—2(n為樣本個數)和顯著性水平a(一般取a=0.05)下，
若r大於臨界值，則變數x和y之間的線性關係成立；
否則，兩個變數不存線上性關係。

3．t檢驗

即回歸係數的顯著性檢驗，以判定預測模型變數x和y之間線性假設是否合理。因為要使用參數t值，故稱為t檢驗。回歸常數a是否為0的意義不大，通常只檢驗參數b。

其中：sb是參數b的標準差，n為樣本個數。
s為回歸標準差，
tb服從t分布，可以通過t分布表(見本書附表2)查得顯著性水平為a，自由度為n—2的數值t(a/2，n—2)。與之比較，若tb的絕對值大於t，表明回歸係數顯著性不為0，參數的t檢驗通過，說明變數x和y之間線性假設合理。若tb的絕對值小於或等於t，表明回歸係數為0的可能性較大，參數的‘檢驗未通過，回歸係數不顯著，說明變數x和y之間線性假設不合理。

4，f檢驗

即回歸方程的顯著性檢驗。是利用方差分析，檢驗預測模型的總體線性關係的顯著性。

統計量f服從f分布，可以通過f分布表(見書附表3)，查找顯著性水平為a，自由度為n=1，n=n—2的f值fa(1，n—2)。
將f與fa(1，n—2)比較:
若f大於fa(1，n—2)，則回歸方程較好地反映了變數x和y之間的線性關係，回歸效果顯著，方程的f檢驗通過，意味著預測模型從整體上是適用的；
若f小於或等於fa(1，n—2)，說明回歸方程不能很好地反映變數x和y之間的關係，回歸效果不顯著，方程的f檢驗未通過，預測模型不能採用。

(四)點預測與區間預測

點預測是在給定了自變數的未來值x。後，利用回歸模型(3—8)求出因變數的回歸估計值yo’。也稱為點估計。
yo’=a+bxo
通常點估計的實際意義並不大，由於現實情況的變化和各種環境因素的影響預測的實際值總會與預測值產生或大或小的偏移，如果僅根據一點的回歸就做出預測結論，則幾乎是荒謬的。因此預測不僅要得出點預測值，還要得出可能偏離的範圍，才能得到預測的可靠程度。於是，以一定的機率1—a預測的y在yo，附近變動的範圍，稱為區間預測。數理統計分析表明，對於預測值yo’而言，在小樣本統計下(樣本數據組n小
於30時)，置信水平為100(1—a)％的預測區間為：

其中：t(a/2，n—2)可以查檢驗表得出。通常取顯著性水平a=0.05。
此外，根據機率論中的3a原則，可以採取簡便的預測區間近似解法，當樣本n很大時，在置信度為68．2％，95．4％，99．7％的條件下，預測區間分別為：
(yo，—sy ,y。’+sy)
(yo，—2sy，yo’+2sy)
(yo，—3sy，yo’+3sy)