I. THU THẬP DỮ LIỆU
`-` Có nhiều cách để thu thập dữ liệu: quan sát, lập phiếu điều tra (phiếu hỏi), tiến hành phỏng vấn,... hoặc thu thập từ những nguồn có sẵn như sách, báo, trang wed, các phương tiện thông tin đại chúng,...
VD: Lớp trưởng lớp `8A` muốn thu thập thông tin về môn học yêu thích của các bạn trong lớp. Bạn lớp trưởng có thể thu thập thông tin đó bằng cách lập phiếu hỏi theo mẫu dưới đây:
Môn học |
Ưa thích |
Toán |
|
Lý |
|
Hóa |
|
Văn |
|
Tiếng Anh |
|
... |
|
II. PHÂN LOẠI VÀ TỔ CHỨC DỮ LIỆU
`-` Việc sắp xếp thông tin theo những tiêu chí nhất định gọi là phân loại dữ liệu.
`+` Dữ liệu định lượng (hay còn gọi là số liệu) được biểu diễn bằng số thực.
`+` Dữ liệu định tính (không phải là số) được biểu diễn bằng từ, chữ cái, kí hiệu,...
`-` Nhận xét: Việc phân loại dữ liệu thống kê phụ thuộc vào những tiêu chí đưa ra, hay nói cách khác, phụ thuộc vào mục đích phân loại.
II. TÍNH HỢP LÍ CỦA DỮ LIỆU
`-` Nhận xét: Để đánh giá dữ liệu có hợp lí không, cần đưa ra các tiêu chí đánh giá:
`+` Đúng định dạng;
`+` Nằm trong phạm vi dự kiến;
`+` Phải có tính đại diện đối với vấn đề cần thống kê.
`-` Để đánh giá tính hợp lí của dữ liệu, ta có thể dựa vào mối liên hệ toán học đơn giản giữa các số liệu.
`+` Tổng tất cả các số liệu thành phần phải bằng số liệu của toàn thể;
`+` Số lượng của bộ phận phải nhỏ hơn số lượng của toàn thể.
VD: Một cửa hàng có `16` nhân viên (mỗi nhân viên chỉ làm một ca). Quản lí cửa hàng thống kê như sau:
Ca `1`: gồm `6` nhân viên
Ca `2`: gồm `6` nhân viên
Ca `3` gồm `5` nhân viên
Hỏi những số liệu mà quản lí cửa hàng nêu ra đã chính xác chưa? Vì sao?
Giải:
Vì cửa hàng đó có tổng `16` nhân viên và mỗi nhân viên chỉ làm một ca. Nhưng theo thống kê của quản lí cửa hàng là `17` nhân viên `(6+6+5)`.
Vì thế, số liệu này là không hợp lý.