您的位置: > 交換鏈接吧 > 禮品 > 擺掛飾禮品 > 研究生2.0

研究生2.0

URL : newgenerationresearcher.blogspot.com 這是您的網站?
更新日期:2011/3/19 19:21:47
所屬分類: 禮品 > 擺掛飾禮品
網站快照:
網站摘要:

記錄研究生需要具備的知識與工具,並介紹研究相關的觀念與軟體skip to main | skip to sidebar2011年3月10日星期四Stata: 探索性因素分析 (一)寫了這麼多關於因素分析的文章 (詳見統計觀念整理) ,接下來當然就是在 Stata 上實作因素分析了。Stata 的 factor 指令就是作探索性因素分析的,如果要作驗證性因素分析,Stata 沒有內建功能,要另外安裝 cfa 這個套件才行。factor 這個指令提供幾種因素分析的方式,包括:pf, pcf, ipf, 與 ml。ML 的優點可參考探索性因素分析的設計與使用 (一)。pcf (principal-component factor) 通常使用在你想要儘可能地在一個 dimension 上解釋 items 的 variance。如果你覺得這些 items 都是 load 在同一個因素上,那 pcf 是你應該使用的。相對地,pf (principal factor) 通常使用在你有兩個或以上的因素。

如果可以跑 ml,就試著跑 ml。我通常會先跑 ml,如果有 Heywood Cases 的話再跑 pf (這不是很好的建議,應該要先看看為什麼有 Heywood cases)。另外,我一開始通常不會限制因素的個數,先看看特徵值與 scree plot。factor item1-item24, ml

factor item1-item24, pf接下來就是要先看看特徵值 (eigenvalue) 與 scree test 來判斷因素個數了。依我這個不漂亮的數據跑 pf 的結果,特徵值大於 1 的有兩個。接著是用 scree plot 來檢驗,在指令列直接輸入 screeplot 即可。上圖其實有點難解讀,如果是要看 deep drop 的話,我會說有兩個。如果是要看哪個因素之後趨於平坦,我可能會說有4個因素。

如果你要用 parallel analysis,得先安裝套件 fapara。net describe fapara, from(http://www.ats.ucla.edu/stat/stata/ado/analysis)net install fapara.pkg

跑完 factor analysis 之後,輸入下方指令:fapara, reps(10)結果會以圖型的方式表示。如果依下圖看來,是有六個因素的。張貼者: Chin-Hsi Lin 於 上午7:35 1 意見2011年3月6日星期日R-squared 不代表一切在許多心理學的研究都特別強調 R-squared (或 R2)的重要,這無可厚非也可以理解,因為從定義上來說,R2 告訴你在你的模型裡,有多少的 variance 是可以被你的自變數解釋的。然而,事情並不是那麼簡單,journal reviewers 並不會看到你有很高的 R2 就欣然地收下你的文章,不要求你作任何修改。我有一個老師更是直接說:R2 is (almost) nothing。有什麼例子可以證明這個觀點呢?綠角財經筆記有一篇文章 Stupid Data Miner Tricks讀後感----不斷尋求相關性的危害,提到了個有趣的例子:孟加拉的奶油產量與美國股市指數呈現高度相關,R2高達0.75。很驚訝,是不是?還有更驚訝的!美國與孟加拉的奶油總產量,美國的起司產量與美國和孟加拉的羊隻總數,這三個數字與標普500做迴歸,發現 R2 高達0.99。這樣,你還相信 R2 嗎?

我不是要大家不相信這個數據,而是別被很高的R2 嚇著了。還需要具體一點的例子嗎?假設你有前、後測,實驗組與控制組,如果你跑第一個模型:用迴歸分析,前測與treatment dummy為自變量;與第二個模型:用迴歸分析,依變量是後測減前測,自變量是treatment dummy,你會發現第一個模型的 R2 比第二個模型高許多。你可以說第一個模型比第二個模型好嗎?那到底什麼才重要呢?準確地預測 (precise estimation) 才是最重要的。至於如何準確地預測,這就是另外一個問題了。如何讓你的p value significant?? 用隔壁老王的麵來預測台股超準 by u402053

張貼者: Chin-Hsi Lin 於 上午6:27 4 意見2011年3月5日星期六Stata: 快速檢視 missing data在初期處理資料,經常要處理 missing data。如果你要作 multiple imputation 或比較進階的統計,你更會想要在作這些之前,看看每個變數有多少 missing。UCLA 製作了兩個 stata 的 addon,可以很輕易地看出 missing data。可以用findit nmissing 或是要下方指令安裝:

net install dm67_3.pkg安裝完之後,只要輸入 nmissing,就可以列出所有變數有多少 missing了。簡單的指令,卻可以省下不少時間。張貼者: Chin-Hsi Lin 於 上午7:37 0 意見2011年3月3日星期四探索性因素分析的設計與使用 (二)

(承前文 探索性因素分析的設計與使用 (一) )這點作者說的很好,要決定因素個數,就是在最精簡模型 (也就是最少的因素) 與有理 (也就是有足夠的因素能解釋這些因子) 之間作平衡。傳統上來說,方法學家認為指明過少的因素個數比指明過多的因素個數還要來得嚴重,因為當因素過少時,本應該 load 在 B 因素的因子,因為模型並沒有納入 B 因素,變成錯誤地 load 在包含在模型的 A 因素。這當然會造成扭曲的結果,並影響到後來的轉軸與解讀。相對地,選擇過多的因素會導致在轉軸時,主要因素正確呈現出來,但一些次要因素並沒有因子 load 在其上或是僅有單一因子。然而,選擇過多的因素仍是要避免的。

因為這些原因,許多方法學家就在探討如何找出最適合的因素數,其中一個非常有名的方法是 Kaiser criterion,這個準則就是看有幾個特徵值 (eigenvalues) 是否大於 1,並用這個數值來決定因素的數量。雖然這個方法看似簡單、客觀,但其實存在著一些問題 (詳細討論請見原文章),特別是經常會採取過多的因素數 (有時候是採取過少的因素數)。第二種方法就是 scree test,也就是畫出相關矩陣的特徵值,並看在哪一個點之後有明顯的下降。在這個下降前有幾個特徵值決定了因素數。這種方式也受到不少批評,特別是它的主觀性。此外,有時候得到的圖並沒有明顯的下降。

第三種方法是平行分析 (parallel analysis),簡單地說,就是比較你從樣本裡得到的特徵值與從隨機資料產生的特徵值 (詳情請讀文章),模擬分析的結果認為平行分析所提供的結果還不錯,雖然統計軟體並未列入這種分析法。註:parallel analysis 在 SAS 和 SPSS 中的使用,可參考:https://people.ok.ubc.ca/brioconn/nfactors/nfactors.html

因素轉軸 factor rotation只要你的結果有兩個以上的因素,就有無數種方式可以同樣呈現你的資料結構。也就是說,只要有兩個或以上的因素,就沒有唯一的模型 (unique solution),所以研究者就要在眾多模型裡選擇一個。一般來說,許多人在選擇模型的時候都會採用 simple structure,因為易於解釋、心理學上有意義並可以複製。雖然轉軸的方式有很多種,但基本就是兩大類:正交 (orthogonal) 與斜交 (oblique rotation)。轉軸的目的是讓因素更有意義,並同時看看因素之間的關係。更詳細一點來說,如果是正交轉軸的話,那就是假設因素之間沒有關連;相對地,斜交假設因素之間有一定的關連。正交轉軸有許多方式,最普遍使用的是 varimax;斜交轉軸常見的誤區是:許多人都認為因素之間必定要存在相關性,但事實並非如此。如果實際的結果是兩個因子並沒有相關性,斜交轉軸所提供的結果會與正交轉軸非常相近,因素之間的相關性會很小並接近於 0。然而,斜交轉軸的各種方法,並沒有哪一個是特別常用的主流。有不少是常用的方法,而且產生的結果也令人滿意,這些方法包括 direct quartimin rotation、promax rotation 與 Harris-Kaiser orthoblique rotation。要作探索性因素分析之前,研究者要作許多決定。這五個方面的建議簡列如下:

1. 研究設計:因子要是因素的四倍以上,甚至到達六倍,特別是在不確定的情況下。如果因子之間共同性高,樣本僅100人即可;否則的話,樣本則要200人或更多。2. 探索性因素分析的適切性:想想研究的目標/目的是什麼。3. 如何fit model:三種方法(ML、principal factors、iterative principal factors) 各有所長,主要先看看資料是否有常態性。4. 決定因素個數:用多重方式決定因素個數。principal factors 可以用 scree plot 和 parallel analysis,ML 則可加上 RMSEA 與 ECVI 來決定因素個數。5. 轉軸:斜交轉軸是主流。

此篇文章後面還有不少篇幅是關於這些決定所造成的影響,有興趣的請自行閱讀。Fabrigar, L. R., Wegener, D. T., MacCallum, R. C., & Strahan, E. J. (1999). Evaluating the use of exploratory factor analysis in psychological research. Psychological Methods, 4(3), 272-299. doi: 10.1037/1082-989x.4.3.272張貼者: Chin-Hsi Lin 於 上午8:45 3 意見

2011年2月27日星期日探索性因素分析的設計與使用 (一)許多人的研究通常都會用問卷,而使用問卷時,常常為了要減少變數的數量,而會採用因素分析 (不懂的請參考:因素分析(Factor Analysis) ),特別是探索性因素分析 (請參考探索性與驗證性因素分析)。探索性因素分析有其本身的限制,有的研究利用模擬數據質疑探索性因素分析並不能正確地表現出資料之間的結構,有的研究則著重於分析探索性因素分析適合與不適合使用的情形。Fabrigar, Wegener, MacCallm, and Strahan (1999) 這篇在心理學上非常有名的文章,就是在討論探索性因素分析的適用情形。我在閱讀之後收獲不少,因此就將這篇文章的重點節錄下來跟大家分享。

作者提到,在進行探素性因分析前,有五個需要考慮到的地方。1) 什麼變數要納入,sample的大小與特性;2) 要決定探索性因素分析是不是最適合的分析方式;3) 如果探索性因素分析是適合的,那接下來要決定有什麼方式來 fit the model. 4) 決定要有幾個因素 (factors). 5) 要決定要用什麼方式轉軸 (rotate),以便於解讀。這五個重要決定對結果有極大的影響,但研究者往往忽略。以下就針對各方面要注意的作說明。要作探索性因素分析,每個因素最好有多個因子,建議是至少三至五個。在設計的時候,研究者要先預期有幾個因素,然後設計問卷時,因子要至少是因素的三至五倍。

研究者還必須決定樣本大小。樣本大小有一部分是取決於有多少變數的。如果每個因素都有超過三個因子,而且因子之間的 communalities 都在 .7 以上,有可能 100 個人就夠了。但是如果 communalities 沒那麼高,則可能需要 200 或者更多。但這只是決定樣本大小的一個因素。如果在分析裡要測試 model fit 或用 maximum likelihood,power (統計考驗力) 亦得列入考量。探索性因素分析是否合適

此外,研究者還必須決定探索性因素分析是否適合。使用探索性因素分析的目的是在眾多變數中,找出潛在性的因素。所以在進行探索性因素分析前,研究者必須先判斷這是否為研究目的。但很重要的一點是:找出潛在性的因素與 data reduction (資料精簡) 並不完全相同。資料精簡是將一些變數的數值組合成一個單一的分數,並儘可能保留原來變數的資訊。資料精簡並未嘗試著去作一個變數之間的模型。反之,如果目的是在變數之間,找出一個 parsimonious model (精簡模型),那探索性因素分析是適合你的。如果研究目的只是資料精簡,那用主成份分析 (principal component analysis) 即可 (註:這部分可參考之前寫的主成份分析與因素分析)。接著就是決定要用探索性因素分析或是驗證性因素分析,這部分可參考我以前寫的文章:探索性與驗證性因素分析。

模型契合方式的選擇 Choice of model-fitting procedure決定要用探索性因素分析後,接下來就是決定要如何 fit 這個 model 了,常用的方法有 maximum likelihood (簡稱ML), pricipal factors with prior estimation of communalities, 和 iterative principal factors。ML 的優點是可以得到較廣的模型適合度指標 (a wide rage of indexes of the goodness of fit of the model)。此外,ML 還允許測試 factor loadings 與因素之間的相關度是否為顯著。然而,ML 的限制是假設了多變量的常態性 (normality)。如果嚴重違反常態性,得出的結果將是扭曲的。

principal factor methods (包含 iterated 與 noniterated的。注意:principal factor methods 與主成份分析是不一樣的) 的優點則是沒有常態性分佈的假設。此外,principal factor methods 也較不會得到扭曲的結果。然而,此種方法的缺點是提供較少範圍的 goodness of fit indexes (適合度指標)。此外,一般來說也不提供 confidence intervals 和顯著測試。雖然這兩種各有優點,但如果沒有違反常態性,兩者所得到的結果應該非常相近。

張貼者: Chin-Hsi Lin 於 下午2:02 0 意見研究生2.0 on FacebookJavascript not supported here!Blog Archive▼ 2011 (22)

Hotels.com 返款折扣定期檢測硬碟狀況與備份Stata: 更改 esttab 的顯著水準新年新希望:不再忘記密碼了!NVivo: 內容與memo無法編輯?Kindle: 其它人畫的重點是什麼?練習學術英文聽力/口語的網站 (4)Stata: 如何作層次迴歸分析(hierarchical regression)?

什麼是層次迴歸分析 (hierarchical regression)?什麼是階層線性模式 (hierarchical linear modeling)?讀書心得:英文論文寫作不求人NVivo 教學:資料編碼 (coding)

質化研究分析技巧(一):Pattern matching► 2010 (67)NVivo 教學: 匯入資料 (更新)【講座與贈書活動】英文論文寫作為什麼要寫論文大綱(proposal)?利用 Ebates 替你省機票與旅館費英文寫作句型資料庫:OWriteStata: 顯示完整變數值,而非使用科學記號

徵文第一名:我在研究所學到的事 –做中學、學中做 by 蔡如雅免費逐字稿軟體:Express scribe徵文第二名:我在台灣唸博士班學到的事 by 黃佳欣

如何寫 Cover Letter?徵文第三名 by 林佳慧因素負荷量 (factor loadings) 與特徵值 (eigenvalues)我在研究所學到的事(未畢業) by Jian-Hang, Wang

探索性與驗證性因素分析徵文佳作:我在研究所學到的事 (未畢業) by Berial如何修改自己的英文文章?之三讀書心得:How to attend, speak or present a poster at a...如何修改自己的英文文章?之二如何修改自己的英文文章?之一如何尋找國際研討會訊息?

► 2009 (94)► 十一月 (12)► 2008 (50)Powered by Stuff-a-Blog(c) 研究生2.0. Some Rights Reserved.Blogger Templates created by Deluxe Templates. CSS by Arcsin. Blogger Showcase

擺掛飾禮品 最新收錄網站
擺掛飾禮品 最新的標籤
相關網站