1. THU THẬP DỮ LIỆU
`-` Có nhiều cách để thu thập dữ liệu: quan sát, lập phiếu điều tra (phiếu hỏi), tiến hành phỏng vấn,... hoặc thu thập từ những nguồn có sẵn như sách, báo, trang web, các phương tiện thông tin đại chúng,...
VD: Lớp trưởng lớp `8A` muốn thu thập thông tin về môn học yêu thích của các bạn trong lớp. Bạn lớp trưởng có thể thu thập thông tin đó bằng cách lập phiếu hỏi theo mẫu dưới đây:
Môn học |
Ưa thích |
Toán |
|
Lý |
|
Hóa |
|
Văn |
|
Tiếng Anh |
|
... |
|
2. PHÂN LOẠI DỮ LIỆU THEO CÁC TIÊU CHÍ
Dữ liệu định tính được chia thành hai loại:
`-` Dữ liệu định danh là dữ liệu thể hiện cách gọi tên.
Ví dụ: giới tính, màu sắc, nơi ở, nơi sinh,...
`-` Dữ liệu biểu thị thứ bậc là dữ liệu thể hiện sự hơn kém.
Ví dụ: mức độ hài lòng, trình độ tay nghề, khối lớp,...
Dữ liệu định lượng nhận giá trị thực và được chia thành hai loại:
`-` Loại rời rạc là dữ liệu chỉ nhận hữu hạn giá trị hoặc biểu thị số đếm.
Ví dụ: cỡ giày, số học sinh, số ngày công, số vật nuôi,...
`-` Loại liên tục là dữ liệu có thể nhận mọi giá trị trong một khoảng nào đó.
Ví dụ: chiều dài, khối lượng, thu nhập, thời gian,...
VD: Cho các loại dữ liệu sau đây:
`-` Môn thể thao yêu thích của một số bạn học sinh lớp `8A`: bóng đá, cầu ông, bóng chuyền,...
`-` Chiều cao (tính theo cm) của một số bạn học sinh lớp `8A`: `154,8; 149,5; 163,1;...`
`-` Xếp loại học tập của một số bạn học sinh lớp `8A`: tốt, chưa đạt, khá,...
`-` Điểm kiểm tra môn Toán của một số bạn học sinh lớp `8A`: `5; 10; 8; 4;....`
`-` Trình độ tay nghề của các công nhân trong phân xưởng `A` gồm các bậc: `1;2;3;4;5;6;7`
a) Tìm dữ liệu định tính và dữ liệu định lượng trong các dữ liệu trên.
b) Trong số các dữ liệu định tính tìm được, dữ liệu nào có thể so sánh hơn kém?
c) Trong số các dữ liệu định lượng tìm đươc, dữ liệu nào là rời rạc? Vì sao?
Giải
a) Môn thể thao yêu thích và xếp loại học tập là các dữ liệu định tính.
Chiều cao, điểm kiểm tra môn Toán và trình độ tay nghề là các dữ liệu định lượng.
b) Trong số các dữ liệu định tính tìm được, chỉ dữ liệu xếp loại học tập có thể so sánh hơn kém.
c) Trong số các dữ liệu định lượng tìm được thì điểm kiểm tra môn Toán của học sinh là rời rạc vì nó chỉ nhận hữu hạn giá trị.
3. TÍNH HỢP LÍ CỦA DỮ LIỆU
`-` Có thể kiểm tra định dạng của dữ liệu hoặc mối liên hệ toán học đơn giản giữa các số liệu thống kê để nhận biết tính hợp lí của dữ liệu và các kết luận dựa trên các dữ liệu thống kê đó.
VD: Một cửa hàng có `16` nhân viên (mỗi nhân viên chỉ làm một ca). Quản lí cửa hàng thống kê như sau:
Ca `1`: gồm `6` nhân viên
Ca `2`: gồm `6` nhân viên
Ca `3` gồm `5` nhân viên
Hỏi những số liệu mà quản lí cửa hàng nêu ra đã chính xác chưa? Vì sao?
Giải
Vì cửa hàng đó có tổng `16` nhân viên và mỗi nhân viên chỉ làm một ca. Nhưng theo thống kê của quản lí cửa hàng chỉ là `15` nhân viên `(6+6+5)`.
Vì thế, số liệu này là không hợp lý.