1. Thu thập và phân loại dữ liệu
`-` Dữ liệu được phân thành các loại: Dữ liệu là số (số liệu) và dữ liệu không là số.
Trong đó:
`+` Dữ liệu là số còn gọi là dữ liệu định lượng
`+` Dữ liệu không là số còn gọi là dữ liệu định tính
Chú ý:
Dữ liệu không là số có thể phân hai loại là loại không thể sắp thứ tự (Chẳng hạn dữ liệu về tên các tỉnh: Nam Định, Hòa Bình, ...) và loại có thể sắp thứ tự (Chẳng hạn đánh giá về chất lượng dịch vụ khách sạn với các mức Rất tốt, Tốt, Trung bình, Kém).
2. Mô tả và biểu diễn dữ liệu
Sau khi thu thập và phân loại dữ liệu, ta cần đọc hiểu và rút ra những thông tin cần thiết từ những dạng biểu diễn dữ liệu đã học và nhận biết những dạng biểu diễn khác nhau cho một tập dữ liệu.
3. Phân tích và xử lí dữ liệu
`-` Sau khi thu thập, tổ chức, phân loại, biểu diễn dữ liệu bằng bảng hoặc biểu đồ, ta cần phân tích và xử lí các dữ liệu đó để tìm ra những thông tin hữu ích và rút ra kết luận.
`-` Quá trình phân tích và xử lí dữ liệu dựa trên tính toán và suy luận logic.
4. Tính hợp lý của dữ liệu
`-` Để có thể đưa ra các kết luận hợp lí, dữ liệu thu được phải đảm bảo tính đại diện cho toàn bộ đối tượng đang được quan tâm.
Chẳng hạn, khi đối tượng quan tâm là toàn thể học sinh thì không thể chỉ lấy ý kiến các bạn nam hoặc các bạn nữ, ... mà phải lấy ý kiến của các học sinh được chọn một cách ngẫu nhiên.