I. Thu thập dữ liệu
* Khái niệm
- Những thông tin thu thập được như: số, chữ, hình ảnh,… được gọi là dữ liệu. Dữ liệu dưới dạng số được gọi là số liệu.
- Số liệu là một loại dữ liệu nhưng dữ liệu chưa chắc là số liệu.
- Các cách thu thập dữ liệu: Quan sát, lập phiếu điều tra (phiếu hỏi), thu thập từ những nguồn có sẵn (sách, báo, trang web,…)
II. Phân loại dữ liệu
1. Khái niệm
- Phân loại dữ liệu là ta đi sắp xếp các thông tin theo những tiêu chí nhất định.
2. Ví dụ
Hình dưới đây là các bình ga của một cửa hàng đang bán.
a) Cửa hàng đang bán tất cả bao nhiêu bình ga?
b) Cửa hàng bán mấu loại bình ga?
Hãy cho biết số lượng bình ga mỗi loại.
Giải:
a) Cửa hàng bán tất cả `10` bình ga
b) Quan sát hình ta thấy các bình ga có ba màu vàng; màu cam và hồng.
Có hai kích thước: lớn và nhỏ
Nếu lấy tiêu chí là kích thước thì có hai loại ga là:
- Bình cỡ nhỏ: `8` bình
- Bình vỡ lớn: `2` bình
Nếu lấy tiêu chí là màu sắc để phân loại thì có `3` loại bình là:
- Màu hồng: `6` bình
- Màu vàng: `2` bình
- Màu cam: `2` bình
III. Tính hợp lí của dữ liệu
1. Các kiến thức cần nhớ
- Để đánh giá tính hợp lí của dữ liệu, ta cần đưa ra các tiêu chí đánh giá, chẳng hạn như dữ liệu phải:
+ Đúng định dạng: Họ và tên phải là chữ, số tuổi phải là số, email thì phải có kí hiệu @,…
+ Nằm trong phạm vi dự kiến: Số người thì phải là số tự nhiên, cân nặng của người Việt Nam thì phải dưới `200kg`, số tuổi của người nguyên dương,…
2. Ví dụ:
a)Danh sách đội học sinh dự thi văn nghệ của lớp `6A` được ghi lại trong bảng sau:
STT
|
Họ và tên
|
`1`
|
Đinh Trung Hiếu
|
`2`
|
Đỗ Ngọc Hà
|
`3`
|
Phạm Văn Vũ
|
`4`
|
`0384` `888` `586`
|
`5`
|
Trần Nhật Minh
|
`6`
|
Cầm Minh Trí
|
Dữ liệu không hợp lí ở đây là `0384` `888` `586` trong cột Họ và tên vì đây không phải là tên người.
b) Điều tra điểm Toán của `20` bạn trong kì khảo sát đầu năm của lớp `6B`:
`5`
|
`2`
|
`8`
|
`9`
|
`4`
|
`6`
|
`7`
|
`5`,`5`
|
`6`
|
`-1`
|
`5`
|
`10`
|
`6`
|
`7`
|
`-3`
|
`8`
|
`9`
|
`6`
|
`3`
|
`8`
|
Dữ liệu không hợp lí là `-1` và `-3` vì số điểm kiểm tra không thể là số âm được.