1. Reviews về Stata

Stata là ứng dụng thống kê mạnh mẽ với những phương tiện thống trị dữ liệu thông minh. Mục đích rất có thể sử dụng làm nghiên cứu trong quá trình có tác dụng luận văn, học những khoá học về định lượng cùng làm bài bác tập hoặc làm tiểu luận. Trong hướng dẫn này, hocthue.net sẽ bước đầu với phần trình làng nhanh với tổng quan, sau đó trình làng 1 bài tập mẫu mã và bài bác giải về stata để bạn nắm rõ hơn.

Bạn đang xem: Tài liệu hướng dẫn sử dụng stata

Giao diện của Stata cơ bản như sau:

*
Giao diện Stata phiên phiên bản 15

Ở bên trái gồm cửa sổ mang tên "Command" là nơi bạn nhập lệnh cho Stata. 

Ở thân có hành lang cửa số Stata hiển thị hiệu quả trong cửa sổ lớn nhất được điện thoại tư vấn là của sổ Kết quả.

Ở bên phải tất cả cửa số Biến(variables) liệt kê các biến vào tập dữ liệu của bạn. Hành lang cửa số Thuộc tính (Properties) ở dưới hiển thị các thuộc tính của các biến với tập dữ liệu của bạn.

2. Một số trong những bài tập về stata

*
Bài tập stata

Bài giải tham khảo

Câu 1: trả sử phân tích tỷ lệ tội phạm tại việt nam thì mô về phạm tội có thể nghiên cứu vớt bằng các yếu tố tác động như sau:

Theo những nhà tù túng học đã xác định được không ít yếu tố ảnh hưởng đến xác suất tội phạm như yếu ớt tố buôn bản hội, khiếp tế, cá nhân. Một vài yếu tố đặc biệt nhất được xác minh bao gồm:

Tuổi: Theo những nhà tù túng học, người cừ khôi không phạm tội nhiều so cùng với thanh thiếu niên. Họ (các bên tội phạm học) do đó cho rằng dân số thiếu niên có xác suất tội phạm khôn cùng cao.Nên ghê tê: một vài nhà tội phạm có niềm tin rằng một nền kinh tế nghèo nàn, GDP thấp là nguyên nhân gây ra tỷ lệ thất nghiệp cao và vì vậy gây ra tội phạm.Vấn đề làng mạc hội: lúc mức độ của các vấn đề làng mạc hội tăng thêm như con số các gia đình phụ huynh độc thân, học viên bỏ học rất có thể gây ảnh hưởng đến tư tưởng tội phạm.

Mô hình hoàn toàn có thể là:

*
 

Câu 2:

a) Đồ thị trung tung sắt tức là giá thành thức ăn và trục tung TE là tổng ngân sách chi tiêu như bên dưới.

*

*

Gọi fe (food Expenditure) là biến nhờ vào và TE (Total Expenditure) là biến độc lập ta được tác dụng mô bên cạnh đó sau:

Source

SS df

MS

Number of obs =

55

 

F( 1, 53)

= 31.10

  

Model

139022.82

1 139022.82

Prob > F

= 0.0000

Residual

236893.616

53 4469.69087

R-squared

= 0.3698

 

Adj R-squared

= 0.3579

  

Total

375916.436

54 6961.41549

Root MSE

= 66.856

     

fe

Coef.

Std. Err. T

P>t <95% Conf.

Interval>

     

te

.4368088

0.000 .2797135

.593904

_cons

94.20878

50.85635 1.85

0.070 -7.796134

196.2137

 

Ta được quy mô hồi quy tổng thể đó là

FE= 94.20878+ 0.436809FE +u

Do thông số TE dương yêu cầu ta tóm lại rằng ngân sách chi tiêu mua hoa màu tăng đường tính cùng với tổng chi tiêu.

Câu 3:

a)

Kết qua quy mô giữa ln(wage) và educ như sau:

*

*

Ta thấy hệ số tương xứng R-squared là 0.1858 ta thấy ý nghĩa rằng giáo dục phân tích và lý giải 22% của đổi mới lnwage

Hệ số p-value =0 minh chứng nếu kiểm tra R2 ≠0 . Thường thì nếu p-value =0 rất có thể kết luận quy mô là có ý nghĩa quan hệ giữa ln(wage) cùng edu tức là giáo dục có mối quan hệ với logarit chi phí lương.

Ta rất có thể viết lại mô hình hồi quy như sau:

Ln(wage)= 0.5837727 + 0.082744 educ +u

b)

Ta bao gồm mô bên cạnh đó sau:

wage= -0.9048516 + 0.5413593*educ +u

Ta được tác dụng và đồ vật thị sau:

Trong kia hệ đường cao hơn nữa là mặt đường wage cùng thấp rộng là ln(wage). Ta thấy hệ số thấp hơn bởi vì mô hình hổi quy ln trong một quy mô hồi quy là 1 trong cách rất thịnh hành để xử trí các trường hợp mà một mối quan hệ phi tuyến đường tồn tại giữa những biến tự do và phụ thuộc. Sử dụng logarit để reviews cho mọt quan hệ kết quả phi tuyến đường tính.. Cho nên vì thế hệ số góc của quy mô ln đã thấp hơn mô hình tuyến tính chưa phải logarit.

Câu 4.

/* thiết lập cấu hình 100 quan tiếp giáp */

set obs =100

/* tùy chỉnh x từ 1 đến 100 */

 

gen x=_n

/* chế tác u với hàm phân phối chuẩn có độ lệch tiêu chuẩn là 9 cùng trung bình là 0 */

gen u= rnormal(0,9)

/* tạo y */

gen y= 25+ 0.5*x+u

regress y x

/*Sau đó tái diễn để xem sự biến hóa */

. Replace u=rnormal(0,9)

(100 real changes made)

. Replace y=25+0.5*x+u

(100 real changes made)

. Regress y x

*

Bảng 50 biến hệ số và hằng số của quy mô bên dưới:

STT

Hệ số

Hằng số

1

0.559146

22.01877

2

0.496917

24.47293

3

0.559421

23.08086

4

0.477793

25.17664

5

0.634216

24.43563

6

0.531187

23.03467

7

0.579003

25.34174

8

0.434642

24.59241

9

0.425048

23.10669

10

0.655447

25.23225

11

0.545225

24.72915

12

0.440208

23.00782

13

0.462175

25.05967

14

0.534416

24.75997

15

0.486741

23.10199

16

0.583187

25.22057

17

0.503988

24.88844

18

0.407302

22.9527

19

0.701233

25.26039

20

0.528918

24.92657

21

0.428679

22.97768

22

0.775209

25.26597

23

0.680537

25.00867

24

0.499697

22.91682

25

0.579524

25.30272

26

0.505199

25.14032

27

0.437763

22.79972

28

0.458293

25.18758

29

0.510882

25.21255

30

0.412656

22.6339

31

0.415013

25.35426

32

0.655899

25.30749

33

0.437684

22.78882

34

0.401382

25.34872

35

0.656958

25.31893

36

0.419503

22.88048

37

0.426417

25.42346

38

0.425212

25.30239

39

0.401355

22.73032

40

0.484928

25.43568

41

0.436463

25.40308

42

0.412919

22.8271

43

0.414379

25.30417

44

0.499664

25.22376

45

0.401093

22.83304

46

0.440595

25.42079

47

0.445569

25.30174

48

0.440272

22.91587

49

0.488007

25.24615

50

0.472239

25.20093


 

Câu 5:

Trị số P, dù cực kì thông dụng trong nghiên cứu và phân tích khoa học, không phải là một trong phán xét sau cuối của một dự án công trình nghiên cứu hay như là 1 giả thuyết.

Thông thường xuyên khi nhà khoa học mong muốn kiểm tra xem liệu phụ gia thực phẩm có gây ung thư giỏi thuốc chữa bệnh, đơn vị khoa học nhận định rằng nó ko - mang thuyết không - và sau đó thực hiện tại thử nghiệm so sánh thuốc hoặc thuốc với giả dược hoặc một phương thuốc khá. Nếu có không ít người sinh tồn hơn với thuốc so với giả dược, thì nhà khoa học sẽ kết luận thuốc sẽ hoạt động tốt. Điều này cũng hoàn toàn có thể xảy ra để xem rằng các kết quả này cũng rất có thể mang tính may mắn.

Trị số P có nhiều vấn đề, và việc phụ thuộc vào vào nó trong thừa khứ (cũng như hiện tại nay) đã trở nên rất đa số người phê phán gay gắt. Loại khiếm khuyết số 1 của trị số p. Là nó thiếu thốn tính logic.

Thật vậy, nếu họ chịu cực nhọc xem xét lại lấy một ví dụ trên, chúng ta có thể khái quát quá trình của một nghiên cứu khoa học (dựa vào trị số P) như sau:

• Đề ra một trả thuyết bao gồm (H)

• Từ đưa thuyết chính, đề ra một đưa thuyết đảo (Ho)

• Tiến hành thu thập dữ khiếu nại (D)

• so với dữ kiện: đo lường xác suất D xảy ra nếu Ho là sự thật. Nói theo ngữ điệu toán xác suất, bước này xác định P(D | Ho).

Vì thế, số lượng P tức là xác suất của dữ kiện D xẩy ra nếu (nhấn mạnh: “nếu”) giả thuyết đảo Ho là việc thật. Như vậy, số lượng P không trực tiếp cho bọn họ một ý niệm gì về sự thật của trả thuyết thiết yếu H; nó chỉ gián tiếp hỗ trợ bằng hội chứng để họ chấp nhận giả thuyết bao gồm và chưng bỏ đưa thuyết đảo

Tài liệu cơ phiên bản về Stata bao hàm Help của Stata với Hướng dẫn tham khảo cơ sở ( Base Reference Manual) về từng mục béo của Stata từ quản lý dữ liệu, Đồ họa với Chức năng... Các chúng ta cũng có thể tham khảo các sách như Acock - A Gentle Introduction khổng lồ Stata
Lawrence Hamilton- Statistics with Stata
Scott Long & Jeremy Freese- Regression Models for Categorical Dependent Variables Using Stata (3rd edition); 

*
Bên cạnh những phần mềm giúp giải pháp xử lý số liệu thống kê thường xuyên gặp hiện nay như SPSS, Excel, ứng dụng xử lý số liệu những thống kê STATA xuất hiện một cánh cửa mới cho người có nhu cầu làm việc với dữ liệu định lượng vì chưng những nhân tài nổi trội như: vận tốc cao, năng lực xử lý linh hoạt, giúp tín đồ sử dụng quản lý số liệu và nhất là khả năng so sánh thống kê chủ yếu xác. Với ước muốn được cung ứng giới nghiên cứu tài chính xã hội Việt Nam rất có thể làm việc tiện lợi hơn, cửa hàng chúng tôi xin trình làng khóa học tập "Xử lý tài liệu định lượng bằng phần mềm thống kê STATA".

Phần mượt Stata lí giải sử dụng

Bên cạnh những ứng dụng giúp xử lý số liệu thống kê thường gặp hiện nay như SPSS, Excel, phần mềm xử lý số liệu thống kê STATA xuất hiện một cửa nhà mới cho người có nhu cầu thao tác làm việc với dữ liệu định lượng vì những chức năng nổi trội như: tốc độ cao, năng lực xử lý linh hoạt, giúp fan sử dụng làm chủ số liệu và nhất là khả năng so với thống kê chính xác. Với mong muốn được cung cấp giới nghiên cứu kinh tế xã hội Việt Nam rất có thể làm việc thuận lợi hơn, shop chúng tôi xin reviews khóa học tập "Xử lý tài liệu định lượng bằng ứng dụng thống kê STATA".

Khóa học tập này sẽ:

Cung cung cấp những kim chỉ nan cơ bản về thống kê và reviews một số kỹ thuật phân tích dữ liệu hay sử dụng nhất trong STATAGiới thiệu những vận dụng giúp người tiêu dùng có thể: nhập, sửa đổi, biểu thị, cách xử lý và cai quản dữ liệu.

Nội dung khóa học:

Khóa học hỗ trợ 4 cấu phần giúp fan học từng bước làm thân quen với STATA. Học viên đã lần lượt được tiếp cận với giáo trình, những ví dụ và bài tập thực hành.

Xem thêm: Hướng Dẫn Sử Dụng Gel Titan Gel, Titan Gel Gold: Công Dụng, Cách Dùng Và Giá Bán

Bài giảng 1: bắt đầu với STATA

Bài giảng 1 sẽ ra mắt cho học tập viên rất nhiều khái niệm cơ bạn dạng trong STATA như: cấu tạo của phần mềm, loại hình dữ liệu hoàn toàn có thể sử dụng trong STATA cũng như những quy cầu khi làm việc với ứng dụng này

Cấu trúc của Stata
Loại dữ liệu
Tài liệu hướng dẫn thực hiện Stata
Quy cầu và những thư mục làm cho việc

Download bài xích giảng 1

Bài giảng 2: cai quản dữ liệu trong STATA

Mục đích bao gồm trong bài giảng 2 là phía dẫn người sử dụng thành thạo quá trình quản lý tài liệu trong STATA như: tạo tài liệu mới, cai quản bộ nhớ, đổi khác các định hình dữ liệu....

Sử dụng tệp tin log
Tạo một tập tài liệu mới
Nhập dữ liệu từ các chương trình khác
Tạo và sửa chữa các biến
Chuyển đổi giữa các định dạng Numeric với String
Sử dụng những chức năng
Xác định những tập nhỏ của dữ liệu: lệnh “and” với “if”Lệnh Egen với Recode
Kết phù hợp hai hay những tập tin STATAQuản lý cỗ nhớ
Tạo tài liệu ngẫu nhiên và các mẫu ngẫu nhiên
Sử dụng Subscripts với những biến số (_n, _N)

Download bài xích giảng 2

Bài giảng 3: Thống kê miêu tả trong STATA

Trong bài xích giảng 3, học viên sẽ được hướng dẫn cách thực hiện các phép thống kê diễn đạt như tính tần suất, tính cực hiếm trung bình, giá bán trị bự nhất/nhỏ duy nhất trong STATA

Một số những lệnh được thực hiện trong bài giảng: summarize, tabulate, tabstat, tab1, tab2, table
Summarize và tabulating
Xử lý những giá trị khuyết thiếu (missing values)Chuyển xuất dữ liệu

Download bài giảng 3

Bài giảng 4: giới thiệu về đồ gia dụng thị cùng lập trình trong STATA

Các loại hình biểu đồ/đồ thị như đồ gia dụng thị nhì chiều, đồ vật thị ma trận, đồ gia dụng thị dạng hộp/tròn đang được giới thiệu trong phần này. Bên cạnh ra, fan học còn được gợi ý những bước cơ bản về lập trình các phép xử liệu số liệu thống kê trong STATA trong bài giảng 4 này:

Biểu đồ
Sử dụng vật dụng thị hai phía (biểu đồ vật phân tán, biểu đồ mặt đường thẳng, biểu thứ cột) và đồ thị kết hợp
Đồ thị ma trận
Đồ thị hộp
Đồ thị tròn
Tổng quan lại về xây dựng (dofile, macro, các vòng lặp)

Download bài bác giảng 4

Download bài xích tập thực hành

Tài liệu tham khảo:

Các bạn cũng có thể tham khảo những tài liệu sau đây để xem thêm về nội dung bài xích học:

Hướng dẫn sử dụng STATA 9, STATA, 2005Thống kê cùng với STATA, Lawrence C. Hamilton, Curt Hinrichs bên xuất bản, 2006Bắt đầu với STATA, STATA, 2005