導航:首頁 > 匯率傭金 > 關聯分析中的杠桿度和確信度

關聯分析中的杠桿度和確信度

發布時間:2021-12-16 01:35:24

A. 什麼是數據挖掘中的關聯分析

關聯分析是指如果兩個或多個事物之間存在一定的關聯,那麼其中一個事物就能通過其他事物進行預測.它的目的是為了挖掘隱藏在數據間的相互關系 在數據挖掘的基本任務中關聯(association)和順序序貫模型(sequencing)關聯分析是指搜索事務資料庫(trarisactional databases)中的所有細節或事務,從中尋找重復出現概率很高的模式或規則。 其屬於灰色理論中的一種分析方法。

B. 統計分析中的關聯規則的支持度和置信度的閾值有什麼方法計算嗎,不要憑借經驗給定

置信度類似於精確度。無法計算。

C. 分析本實驗(楊氏模)不確定度產生的主要原因 指出實驗中哪個量的測量對不確定度的影響較大 如何改進

測量誤差對結果影響較大的量主要是鋼絲直徑、標尺讀數,因為這些量的測量相對誤差比較大。 提高光杠桿測量微小長度變化的靈敏度,主要需要

D. 灰色關聯分析中絕對、相對、綜合關聯度的區別是什麼

灰色關聯分析理論及方法
對於兩個系統之間的因素,其隨時間或不同對象而變化的關聯性大小的量度,稱為關聯度。在系統發展過程中,若兩個因素變化的趨勢具有一致性,即同步變化程度較高,即可謂二者關聯程度較高;反之,則較低。因此,灰色關聯分析方法,是根據因素之間發展趨勢的相似或相異程度,亦即「灰色關聯度」,作為衡量因素間關聯程度的一種方法[16]。灰色系統理論提出了對各子系統進行灰色關聯度分析的概念,意圖透過一定的方法,去尋求系統中各子系統(或因素)之間的數值關系。因此,灰色關聯度分析對於一個系統發展變化態勢提供了量化的度量,非常適合動態歷程分析。
灰色系統關聯分析的具體計算步驟如下[17]:
(1)確定反映系統行為特徵的參考數列和影響系統行為的比較數列
反映系統行為特徵的數據序列,稱為參考數列。影響系統行為的因素組成的數據序列,稱比較數列。
(2)對參考數列和比較數列進行無量綱化處理
由於系統中各因素的物理意義不同,導致數據的量綱也不一定相同,不便於比較,或在比較時難以得到正確的結論。因此在進行灰色關聯度分析時,一般都要進行無量綱化的數據處理。
(3)求參考數列與比較數列的灰色關聯系數ξ(Xi)
所謂關聯程度,實質上是曲線間幾何形狀的差別程度。因此曲線間差值大小,可作為關聯程度的衡量尺度。對於一個參考數列X0有若干個比較數列X1, X2,…, Xn,各比較數列與參考數列在各個時刻(即曲線中的各點)的關聯系數ξ(Xi)可由下列公式算出:

其中 ζ為分辨系數,0<ζ<1。
是第二級最小差,記為Δmin。 是兩級最大差,記為Δmax。
為各比較數列Xi曲線上的每一個點與參考數列X0曲線上的每一個點的絕對差值。記為Δoi(k)。所以關聯系數ξ(Xi)也可簡化如下列公式:

(4)求關聯度ri
因為關聯系數是比較數列與參考數列在各個時刻(即曲線中的各點)的關聯程度值,所以它的數不止一個,而信息過於分散不便於進行整體性比較。因此有必要將各個時刻(即曲線中的各點)的關聯系數集中為一個值,即求其平均值,作為比較數列與參考數列間關聯程度的數量表示,關聯度ri公式如下:

(5)排關聯序
因素間的關聯程度,主要是用關聯度的大小次序描述,而不僅是關聯度的大小。將m個子序列對同一母序列的關聯度按大小順序排列起來,便組成了關聯序,記為,它反映了對於母序列來說各子序列的「優劣」關系。若r0i>r0j,則稱對於同一母序列優於,記為> ;若r0i表1 代表旗縣參考數列、比較數列特徵值。

E. 主導因子與相關動力因子的關聯度量化分析

內、外動力地質作用是推動斜坡演變的主導因素,但是具體每一動力作用對斜坡變形失穩的貢獻程度是不一樣的,即不同動力作用與斜坡變形破壞的相關性不同。本文將與斜坡變形破壞有關的動力地質作用量化參數稱為相關動力因子,在這些相關動力因子中,哪些與主導因子(這里設立為斜坡變形破壞密度)相關性最好,哪些與主導因子相關性稍差,弄清這些問題對於斜坡變形破壞的地質動力分區及危險性評價非常重要,但也存在一定的難度,因為動力因子與主導因子之間的聯系並非簡單的關聯關系,同時存在交叉性作用,所以,需要藉助一定的數學方法才能較好地回答這個問題。效果測度關聯分析方法(EMA)是一種較好的信息數據處理模型,具有計算簡捷快速、易於操作、普適性強、分析內容全面的優點,能充分利用計算出的關聯度,使關聯度分析定量化,並確定出各相關動力因子的關聯度排序。

3.4.1 計算模型

採用效果測度分析模型進行金沙江虎跳峽河段斜坡變形破壞與相關動力因子的關聯度量化分析,其基本原理是依據比較序列(輔助判據)曲線與參考序列(主判據)曲線的接近程度或偏離程度,比較序列曲線與參考序列曲線接近程度大的關聯程度就大,反之則小。因此,由「曲線接近」思路而進行比較序列與參考序列的效果關系無量綱化,限制了無量綱化的多樣性,使得各數據序列具有可比性,從而保證關聯分析結果的唯一性(鄭永勝等,1998)。具體計算方法如下:

(1)無量綱化

效果測度無量綱化就是根據參考序列與比較序列的效用關系進行無量綱化。無量綱化方法包括以下兩種:

①對於比較序列取值越大,參考序列取值越大的效應關系,按下式進行無量綱化:

內外動力地質作用與斜坡穩定性

式中:N'i(k)為第i個比較序列第k個樣本的無量綱化值;

maxNi(k)為第i個比較序列數據中的最大值。

②對於比較序列取值越小,參考序列取值越大的效應關系,按下式進行無量綱化:

內外動力地質作用與斜坡穩定性

式中:minNi(k)為第i個比較序列數據中的最小值。

參考序列N0(k)均按(3.4.1)式進行無量綱化。

(2)關聯系數與關聯度

以無量綱化後的參考序列作為測度標准,用無量綱化後的比較序列與參考序列的效果測度值,作為關聯系數,其計算公式為:

內外動力地質作用與斜坡穩定性

將各因素比較序列關聯系數的平均值稱為關聯度Ri,反映了各比較序列與參考序列的整體接近程度,即系統相關動力因子對主導因子影響程度的定性量化值。

內外動力地質作用與斜坡穩定性

(3)權重確定

利用計算出來的關聯度可以方便、准確地確定因子權重,即將效果測度關聯度歸一化作為因子權重(張志龍等,2005),權重的確定可以定量地描述若干動力因子對主導因子的影響程度。

內外動力地質作用與斜坡穩定性

3.4.2 樣本區劃分與分區數據選取

鑒於虎跳峽河段河谷變形破壞的地段性差異分布的空間特徵,將研究區劃分為5段,以作為分區樣本的基本單元。綜合考慮影響斜坡變形與破壞的內、外動力作用要素,選取6個樣本參數作為相關動力因子,即地殼抬升速率、斷裂緩沖距離、地震基本烈度、多年平均降雨量、河床縱比降和風化速率。這里需要說明的是實際上每個動力地質作用要素對斜坡變形破壞的影響包括多個方面,如與降雨有關的參數包括降雨歷時、降雨量、降雨強度等,與地震有關的參數包括地震烈度、震級、震中距、震源深度等,本文在選擇相關動力因子時,主要是從空間(或區域)角度來考慮動力因子強度變化與斜坡變形破壞的相關關系,同時保證數據來源的可靠性和方便因子量化,如在區域斜坡變形破壞與降雨的相關性分析中,只能用到年平均降雨量。此外,各因子的取值分別按均值進行處理,其中風化速率以岩性抗風化能力差異劃分很弱、弱、中等和強四個等級,並按對斜坡變形破壞的影響程度按從大到小分別賦值1、2、3和4。各樣本區主導因子和相關動力因子的基礎數據見表3.4.1。

表3.4.1 效果測度分析基礎數據表

3.4.3 關聯度量化分析

相對於主導因子N0而言,除N2(斷裂緩沖距離)以外都是「越大越大」的效用關系,應採用(3.4.1)式進行無量綱化計算,而N2按(3.4.2)式進行計算,各數據序列的效果測度無量綱化值見表3.4.2,關聯系數和關聯度見表3.4.3。

表3.4.3中的相關動力因子關聯排序為R2>R1>R3>R4>R5>R6,因無分辨系數的參與,計算的關聯系數與關聯度確定程度高,又因其計算步驟小,計算精度也高,其關聯排序結果是可信的,各動力因子可作為後文斜坡災害危險性分析的評價指標。

表3.4.2 效果測度分析的無量綱化值

表3.4.3 效果測度分析的關聯系數與關聯度

斷裂緩沖距離關聯度值排在首位,說明研究區斷裂活動對河谷斜坡變形破壞體發育分布的影響是最大的,這與虎跳峽地區深大斷裂發育,河流流向與構造線的一致性,以及斜坡變形破壞體空間分布受控於確定的活動斷裂或構造體系的特徵是相符的。研究區57%的斜坡變形破壞分布在距離主要斷裂帶500m的范圍內,而發生在楚波-白漢場斷裂和中甸-喬後斷裂帶上的斜坡變形破壞體占本區總數的31%,說明斜坡變形破壞體發育分布具有與斷裂帶空間延伸方向的一致性,因而斷裂活動排在首位具有普遍意義,起碼在本例中是如此。

在內動力作用活躍地區,對斜坡失穩破壞來說,地殼抬升一個重要的影響因子,它控制了變形破壞體的發育程度。在虎跳峽河段,地殼抬升速率越大,河流下切速率越快,從而引起河谷側向卸荷作用越強,因卸荷引起環境應力場改變而促使岩土體結構松動甚至形成淺(表)生結構,導致斜坡表層岩土體越容易遭到剝蝕和風化,在抬升速率高的區域斜坡變形破壞體的密度和規模均隨之增大。在地殼隆升過程中,峽谷比寬谷更易引起河谷應力場的分異和調整,其改造程度往往大於寬谷,相應的河谷斜坡變形破壞程度更明顯,研究區峽谷段斜坡變形破壞線密度和線模數是寬谷區的4~5倍。因此,相對於河流動力作用和風化作用而言,本區地殼抬升對斜坡變形破壞的影響程度更大。

地震的活動強度受控於地殼運動和斷裂活動的影響,因此它對斜坡變形破壞的影響應排在二者之後,即地震基本烈度的關聯度小於地殼抬升速率和斷裂緩沖距離的關聯度;研究區地震活動頻繁,年降雨量不是很高,雖然它們都是斜坡變形失穩的觸發因素,但在虎跳峽地區地震造成河谷斜坡失穩的現象非常豐富,相對於降雨而言,其與斜坡變形破壞密度的關聯度略大。風化作用與氣候、結構構造、岩性和地形等因素關系密切,從一個側面反映了風化速率受構造和氣候變化的控制,由於受降雨與斜坡變形破壞密切關聯度較小的緣故,風化速率的關聯度也較小,並且排在所有相關動力因子的末尾,這說明在研究區它對斜坡變形破壞的影響程度是最小的。

3.4.4 確定各動力因子的權重

將表3.4.3中的關聯度值代入式(5),求得各動力因子對河谷斜坡變形破壞密度的因子權重,見表3.4.4。

表3.4.4 各動力因子的因子權重

根據計算出來的因子權重,可以看出各因子對河谷斜坡變形破壞體發育密度的影響程度。其中,斷裂緩沖距離是影響斜坡變形破壞密度的最重要的動力因子,地殼隆升速率次之,地殼基本烈度、多年平均降雨量、河床縱比降和風化速率的影響較差,表明斷裂活動和地殼抬升是影響本區斜坡失穩破壞的主要(或關鍵)因素,同時反映內動力地質作用在虎跳峽河段斜坡演化中起著更加非常顯著的作用。對比該河段內動力系統活躍和斜坡變形破壞體發育狀況的實際,分析結果是比較合理的。關鍵動力因素的確定可作為區域斜坡變形破壞的成因判據。

F. 灰色關聯分析方法中 經過0-1標准變換無量綱處理後 為什麼值越大越優

灰色關聯度分析法是一種多因素統計分析方法,它是以各因素的樣本數據為依據用灰色關聯度來描述因素間關系的強弱、大小和次序,若樣本數據反映出的兩因素變化的態勢(方向、大小和速度等)基本一致,則它們之間的關聯度較大;反之,關聯度較小。此方法的優點在於思路明晰,可以在很大程度上減少由於信息不對稱帶來的損失,並且對數據要求較低,工作量較少;其主要缺點在於要求需要對各項指標的最優值進行現行確定,主觀性過強,同時部分指標最優值難以確定。

G. Excel中數據挖掘的關聯分析問題

最小規則概率為最小置信度,比如,你去街上發傳單,無差別分發,人家要你傳單的概率是50%,你發現女的接受傳單的概率比較高,為60%,也就是說女士的總數為上面的最低支持(你選擇了項數),60%為你的置信度(大於最小規則概率40%,你的excel工具才會輸出這條規則)。
於是規則就生成了:專盯著女的發傳單
也就是把這條規則應用到發傳單的營銷活動中,成功率60%,比你無差別分發成功率提高了1.2倍。

H. 灰色關聯分析中兩組參考數據計算出來的關聯度是否具有可比性

注意:用EXCEL軟體計算組數據灰色關聯度:
1999 2000 2001 20002 2003
1 ... ... ... ... ..
2
3
4 ... ... ... ... ...
計算12、3、4間關聯度矩陣
-

I. 請教一下,如果比較序列有<=4個因素,而參考序列的k=1,可以用灰色關聯分析法來對因素進行關聯度排序嗎

灰色關聯分析理論及方法對於兩個系統之間的因素,其隨時間或不同對象而變化的關聯性大小的量度,稱為關聯度。在系統發展過程中,若兩個因素變化的趨勢具有一致性,即同步變化程度較高,即可謂二者關聯程度較高;反之,則較低。因此,灰色關聯分析方法,是根據因素之間發展趨勢的相似或相異程度,亦即「灰色關聯度」,作為衡量因素間關聯程度的一種方法[16]。灰色系統理論提出了對各子系統進行灰色關聯度分析的概念,意圖透過一定的方法,去尋求系統中各子系統(或因素)之間的數值關系。因此,灰色關聯度分析對於一個系統發展變化態勢提供了量化的度量,非常適合動態歷程分析。灰色系統關聯分析的具體計算步驟如下[17]:(1)確定反映系統行為特徵的參考數列和影響系統行為的比較數列反映系統行為特徵的數據序列,稱為參考數列。影響系統行為的因素組成的數據序列,稱比較數列。(2)對參考數列和比較數列進行無量綱化處理由於系統中各因素的物理意義不同,導致數據的量綱也不一定相同,不便於比較,或在比較時難以得到正確的結論。因此在進行灰色關聯度分析時,一般都要進行無量綱化的數據處理。(3)求參考數列與比較數列的灰色關聯系數ξ(Xi)所謂關聯程度,實質上是曲線間幾何形狀的差別程度。因此曲線間差值大小,可作為關聯程度的衡量尺度。對於一個參考數列X0有若干個比較數列X1,X2,…,Xn,各比較數列與參考數列在各個時刻(即曲線中的各點)的關聯系數ξ(Xi)可由下列公式算出:其中ζ為分辨系數,0<ζ<1。是第二級最小差,記為Δmin。是兩級最大差,記為Δmax。為各比較數列Xi曲線上的每一個點與參考數列X0曲線上的每一個點的絕對差值。記為Δoi(k)。所以關聯系數ξ(Xi)也可簡化如下列公式:(4)求關聯度ri因為關聯系數是比較數列與參考數列在各個時刻(即曲線中的各點)的關聯程度值,所以它的數不止一個,而信息過於分散不便於進行整體性比較。因此有必要將各個時刻(即曲線中的各點)的關聯系數集中為一個值,即求其平均值,作為比較數列與參考數列間關聯程度的數量表示,關聯度ri公式如下:(5)排關聯序因素間的關聯程度,主要是用關聯度的大小次序描述,而不僅是關聯度的大小。將m個子序列對同一母序列的關聯度按大小順序排列起來,便組成了關聯序,記為,它反映了對於母序列來說各子序列的「優劣」關系。若r0i>r0j,則稱對於同一母序列優於,記為>;若r0i表1代表旗縣參考數列、比較數列特徵值。

閱讀全文

與關聯分析中的杠桿度和確信度相關的資料

熱點內容
融資租賃宣傳語 瀏覽:157
2009房地產信託產品平均收益率 瀏覽:931
2017深圳瓶裝煤氣價格 瀏覽:646
招商證券調整傭金 瀏覽:115
期貨沽空是什麼意思 瀏覽:616
中國銀行理財收益率有保證嗎 瀏覽:490
理財產品對客戶好處 瀏覽:244
外幣對人民幣匯率中間價形成 瀏覽:141
安邦理財產品收益率 瀏覽:657
什麼叫金融資產與金銀資產 瀏覽:50
藍光地產信託 瀏覽:403
封閉式理財產品的回購 瀏覽:477
金融機構抽貸壓貸如何解決 瀏覽:564
華鑫證券龍頭 瀏覽:32
世界上第一家以銀行命名的金融機構是 瀏覽:191
新疆金鑰匙集團合規嗎 瀏覽:31
蘇州抵押貸款 瀏覽:309
7萬多傭金一次性拿交多少稅 瀏覽:449
交易性金融資產應交稅率 瀏覽:534
融資性擔保公司屬於金融機構 瀏覽:423