網站首頁 健康小知識 母嬰教育 起名 運動知識 職場理財 情感生活 綠色生活 遊戲數碼 美容 特色美食 愛好

如何在stata中生成虛擬變量(各種情況)?

欄目: 學習交流 / 發佈於: / 人氣:3.12W

雙類別虛擬變量

(01)雙類別虛擬變量,顧明思議就是將變量分成兩類進行虛擬變量的生成。如性別等等。我們還是打開我們的老朋友ysuse autogen d=(length>200)聰明的大家一看就知道,這樣就可以生成一個雙分類虛擬變量,也就是>200的是一個小於等於200的是一個。圖片是原始數據和生成的虛擬變量的截圖

如何在stata中生成虛擬變量(各種情況)?
如何在stata中生成虛擬變量(各種情況)? 第2張

多類別單分類虛擬變量生成

(01)什麼是多類別虛擬變量?就是把一個變量的每一個數都分成一類類,我們在生成分類變量時也就是做這一種最容易出現問題。通常需要分類的變量時,季度變量還有不同的廠商,等等。

如何在stata中生成虛擬變量(各種情況)? 第3張

(02)觀察步驟1中的圖片,我們現在相對不同廠商進行分類,這就很難受了。如果,我們想對每一個廠商都進行分類,我們需要使用上面教的gen命令很多次。這個樣本的數量級別還好,如果數量級別更大,我們將很難處理這類問題。這時我們可以使用:tab命令help tab我們查看tabulate命令的help,可以發現有一個生成虛擬變量的方法。

如何在stata中生成虛擬變量(各種情況)? 第4張

(03)使用tab make,gen(m)即可生成按照make不同生成虛擬變量

如何在stata中生成虛擬變量(各種情況)? 第5張
如何在stata中生成虛擬變量(各種情況)? 第6張

單變量多分類虛擬變量生成

(01)什麼意思呢?就是對單一變量進行劃分,將多個不同的數據劃分成一類。這其實是非常常用的掌握了對大家都很有好處。其實,生成虛擬變量,如果你是個愣頭青,你直接看着數據挨個輸入就好。但是,還是希望大家都能靈活掌握stata的技巧,快人一大步。觀察下面的數據表,是筆者我自己下載的數據,這個是一個時間的數據。這種數據是非常非常常用的,你從數據庫下載的季度數據都是這個格式的數據。有時候你會遇到這樣的問題。如果我想按季節分類怎麼辦呢?

如何在stata中生成虛擬變量(各種情況)? 第7張

(02)我在這裏教大家一種我用的辦法,是我自己在實踐中總結,可能有更簡單的命令,如果你知道可以和我聯繫,我會加一補充。第一步 生成分類變量:gen group=0replace group=1 if regexm(t,"-03-")replace group=2 if regexm(t,"-06-")replace group=3 if regexm(t,"-09-")replace group=4 if regexm(t,"-12-")

如何在stata中生成虛擬變量(各種情況)? 第8張

(03)tab group,gen(season)

如何在stata中生成虛擬變量(各種情況)? 第9張
如何在stata中生成虛擬變量(各種情況)? 第10張

特別提示

虛擬變量的生成無非是這幾類,靈活思考一般可以解決問題

有任何疑問都可以向我提問