1. Thu thập dữ liệu
`-` Ta có thể thu thập dữ liệu từ những nguồn: văn bản, bảng biểu, hình ảnh trong thực tiễn.
2. Phân loại dữ liệu theo các tiêu chí
`-` Để thuận tiện mô tả và xử lí, người ta thường phải phân loại dữ liệu.
`-` Dữ liệu thu thập được có thể được phân loại theo các tiêu chí để sử dụng cho các mục đích khác nhau.
`-` Dữ liệu định tính được biểu diễn bởi: kí hiệu, chữ cái, tên gọi.
Ví dụ: màu sắc, giới tính, loài hoa,...
`-` Dữ liệu định lượng được biểu diễn bởi số thực.
Ví dụ: chiều cao, cân nặng, giá tiền,...
3. Tính hợp lí của dữ liệu
`-` Để đảm bảo tính hợp lí, dữ liệu cần phải đáp ứng đúng các tiêu chí toán học đơn giản, chẳng hạn như:
- Tổng tỉ lệ phần trăm của tất cả các thành phần phải bằng 100%
- Số lượng của bộ phận phải nhỏ hơn số lượng của toàn thể, ...
- Phải có tính đại diện đối với vấn đề cần thống kê.