1. Thu thập và phân loại dữ liệu
`-` Dữ liệu được phân thành các loại: Dữ liệu là số (số liệu) và dữ liệu không là số
Trong đó:
`+` Dữ liệu là số còn gọi là dữ liệu định lượng
`+` Dữ liệu không là số còn gọi là dữ liệu định tính
Chú ý:
Dữ liệu không là số có thể phân hai loại là loại không thể sắp thứ tự (Chẳng hạn dữ liệu về tên các tỉnh: Nam Định, Hòa Bình, ...) và loại có thể sắp thứ tự (Chẳng hạn đánh giá về chất lượng dịch vụ khách sạn với các mức Rất tốt, Tốt, Trung bình, Kém).
2. Tính đại diện của dữ liệu
`-` Để có thể đưa ra các kết luận hợp lí, dữ liệu thu được phải đảm bảo tính đại diện cho toàn bộ đối tượng đang được quan tâm.
Chẳng hạn, khi đối tượng quan tâm là toàn thể học sinh thì không thể chỉ lấy ý kiến các bạn nam hoặc các bạn nữ, ... mà phải lấy ý kiến của các học sinh được chọn một cách ngẫu nhiên.