Nhận thức về công nghệ thu thập dữ liệu

Hiện nay, Tổng cục Thống kê đang triển khai các công việc để hoạt động điều tra được thực hiện trung thực, chính xác, khách quan.
Ông Phạm Đình Thúy, Vụ trưởng Vụ Thống kê Công nghiệp (Tổng cục Thống kê) cho biết: Thông tin thu thập được từ kết quả điều tra doanh nghiệp năm 2020 được sử dụng phục vụ công tác quản lý, hoạch định chính sách, kế hoạch phát triển kinh tế-xã hội, phát triển doanh nghiệp của quốc gia, từng địa phương, các nhà đầu tư và các doanh nghiệp, hợp tác xã.

Điều tra doanh nghiệp là hoạt động quan trọng để hoạch định chính sách. Kết quả này còn được dùng trong tổng hợp và biên soạn các chỉ tiêu trong Hệ thống chỉ tiêu thống kê quốc gia, các chỉ tiêu trong báo cáo chính thức hàng năm của ngành Thống kê; tổng hợp và biên soạn ấn phẩm "Sách trắng doanh nghiệp Việt Nam năm 2021" và “Sách Trắng Hợp tác xã Việt Nam năm 2021”. Kết quả này cũng được sử dụng để đánh giá mức độ sẵn sàng ứng dụng công nghệ trong doanh nghiệp trong thời đại công nghiệp 4.0 và chi phí dịch vụ logistic… Điều tra doanh nghiệp hàng năm có hàng chục loại phiếu khác nhau áp dụng cho nhiều đối tượng khác nhau. Các câu hỏi trong điều tra doanh nghiệp liên quan đến các nội dung về lao động, tài sản, vốn, doanh thu, …liên quan đến nhiều phòng ban chức năng của doanh nghiệp, đến thông tin bảo mật, có tính nhạy cảm cao. Do vậy, điều tra viên tiếp cận doanh nghiệp để thu thập được thông tin luôn gặp nhiều khó khăn. Những năm trước đây, điều tra doanh nghiệp được thực hiện theo hình thức điều tra gián tiếp hoặc trực tiếp bằng bảng hỏi giấy; điều tra viên liên hệ trực tiếp với doanh nghiệp để thu thập thông tin tại chỗ hoặc gửi bảng hỏi bằng giấy đến để doanh nghiệp trả lời. Song từ năm 2020, phương án điều tra doanh nghiệp đã có sự thay đổi để phù hợp với tình hình mới. Đó là ứng dụng triệt để công nghệ thông tin vào công tác thu thập, xử lý, tổng hợp, phân tích dữ liệu điều tra doanh nghiệp. Theo đó, khâu điều tra thu thập thông tin được thực hiện bằng phương pháp điều tra trực tuyến, có nghĩa là doanh nghiệp sẽ cung cấp thông tin bằng bảng hỏi điều tra trực tuyến (webform). Điều này tạo ra một số thuận lợi là doanh nghiệp có thể chủ động cung cấp thông tin bằng hình thức trực tuyến, tiết kiệm nguồn lực, thông tin được cập nhật sẽ nhanh hơn, từ đó ngành Thống kê có thể  xử lý, tổng hợp  và công bố sớm kết quả điều tra… Kết quả thu thập từ cuộc điều tra là căn cứ xác thực để các nhà quản lý, điều hành xây dựng chính sách, chiến lược phát triển kinh tế địa phương, vùng kinh tế và cả nước.  Tuy nhiên, theo ông Phạm Đình Thúy, điều tra bằng hình thức trực tuyến cũng gặp một số bất cập, đó là ngành Thống kê phải xây dựng bài toán kỹ thuật về công nghệ thông tin và tiếp cận doanh nghiệp phức tạp hơn, phải đảm bảo tốc độ đường truyền, tính bảo mật, lưu trữ thông tin, tính khả dụng, đặc biệt công tác rà soát doanh nghiệp cần được coi trọng...  Theo phương án điều tra năm 2020, các doanh nghiệp sẽ phải tự điền thông tin khai trên bảng hỏi trực tuyến. Để thu thập đầy đủ về số lượng và chất lượng thông tin từ doanh nghiệp theo nội dung của bảng hỏi trực tuyến là thách thức không nhỏ đối với các điều tra viên của ngành Thống kê. "Như vậy, thành công của điều tra doanh nghiệp lần này phụ thuộc khá nhiều vào sự hợp tác, đồng hành thực hiện cung cấp thông tin của doanh nghiệp theo Luật định", ông Thúy chia sẻ. Theo phương án điều tra doanh nghiệp năm 2020, có 18 loại phiếu điều tra dành cho các loại hình doanh nghiệp khác nhau. Hiện, Tổng cục Thống kê đang hoàn thiện các khâu thực hiện trong phương án nhằm triển khai phù hợp với các đối tượng doanh nghiệp theo luật định, bảo đảm tính bảo mật, kết nối thông tin thông suốt, đảm bảo các doanh nghiệp được hướng dẫn sẽ kê khai đầy đủ thông tin.

Thực hiện phương án, Điều tra viên sẽ tiếp cận doanh nghiệp để hướng dẫn, hỗ trợ về nghiệp vụ, cấp tên truy cập, mật khẩu để đăng nhập vào trang điều tra trực tuyến và tự cung cấp thông tin trực tuyến theo bảng hỏi điện tử (web-form) phù hợp với ngành sản xuất kinh doanh của doanh nghiệp hoặc doanh nghiệp truy cập vào trang Thống kê doanh nghiệp trực tuyến để tải mẫu phiếu điều tra (Excel-Form) điền thông tin phù hợp với ngành sản xuất kinh doanh của doanh nghiệp và gửi lại cho ngành Thống kê trên trang điều tra trực tuyến.

Thu thập dữ liệu trong quá trình nghiên cứu các hiện tượng kinh tế xã hội là một giai đoạn có ý nghĩa rất quan trọng. Việc thu thập dữ liệu mất nhiều thời gian, chi phí và cả công sức do đó việc lựa chọn được phương pháp thu thập dữ liệu thích hợp để đạt được hiệu quả cao nhất.Trong bài viết này, Tri Thức Cộng Đồng chủ yếu đề cập đến các khái niệm về dữ liệu thứ cấp, dữ liệu sơ cấp, các phương pháp thu thập dữ liệu.

Mục lục

Dữ liệu sơ cấp là gì? ( Primary data)

Dữ liệu sơ cấp là những dữ liệu mới được thu thập lần đầu tiên phục vụ cho cuộc nghiên cứu này. Những thông tin cần thu thập bao gồm: thông tin về tình hình sử dụng sản phẩm của khách hàng, kỳ vọng của họ với sản phẩm, sự đánh giá của họ về những thuộc tính của sản phẩm cà dịch vụ đi kèm, …

Theo Wikipedia định nghĩa: “Dữ liệu sơ cấp là những dữ liệu chưa có sẵn, được thu thập lần đầu, do chính người nghiên cứu thu thập. Trong thực tế, khi dữ liệu thứ cấp không đáp ứng được yêu cầu nghiên cứu, hoặc không tìm được dữ liệu thứ cấp phù hợp thì các nhà nghiên cứu sẽ phải tiến hành thu thập dữ liệu sơ cấp.”  ( Trích nguồn: https://vi.wikipedia.org )

1.1 Thiết kế mẫu

Ví dụ về dữ liệu sơ cấp:

Tổng thể là một nhóm cụ thể người, doanh nghiệp, điều kiện và các hoạt động…là trung tâm của sự nghiên cứu. Tổng thể của cuộc nghiên cứu này là những khách hàng đã, đang sử dụng xe máy Air Blade.

Phương pháp chọn mẫu: lấy mẫu phi xác suất tiện lợi. Đây là phương pháp lấy mẫu mà theo đó các thành viên mẫu được chọn một cách tiện lợi và kinh tế. Bảng hỏi được gửi đến những người bạn, người quen,… đã từng hoặc đang đi xe Air Blade của Honda Việt Nam. Pham vi nghiên cứu là khu vực Hà Nội. Tuy nhiên với thời gian không dài của cuộc nghiên nên tập trung tiến hành phỏng vấn tại các khu vực: Quận Cầu Giấy, Huyện Từ Liêm, Huyện Thanh Trì.

Kích thước mẫu dự tính cho nghiên cứu khoảng 100. Thông thường với sản phẩm và tổng thể đã chọn thì mẫu khoảng 100 phần tử là phù hợp. Để đạt được khoảng 100 phần tử đã có 100  phiếu được phát đến khách hàng bằng cách gửi trực tiếp. Tuy nhiên với 100 phiếu đã phát chỉ thu về được 96 phiếu đạt yêu cầu, có thể sử dụng cho phân tích. Thông tin về mẫu được tổng hợp trong bảng sau:

Nhận thức về công nghệ thu thập dữ liệu
Phương pháp thu thập dữ liệu sơ cấp

(Ảnh: Phương pháp thu thập dữ liệu sơ cấp)

1.2 Xây dựng bảng hỏi

Nội dung bảng hỏi gồm 4 phần chính như sau:

– Giới thiệu: Người tiến hành điều tra, lý do và mục đích tiến hành điều tra, cam kết giữ bí mật thông tin.

– Phần lấy thông tin cá nhân: họ và tên, tuổi, giới tính, địa chỉ của người được phỏng vấn.

– Phần gạn lọc: nhằm loại bỏ những cá nhân không phù hợp với cuộc điều tra. Ví dụ: những người chưa từng đi xe máy, những người chưa tùng đi xe Air Blade, những người (người thân) đang làm việc trong lĩnh vực truyền thông/ quảng cáo/ nghiên cứu thị trường/ sản xuât, cung cấp xe máy …

– Phần câu hỏi chính: đưa ra những câu hỏi nhằm thu thập những thông tin cần thiết. Phần này bao gồm 14 câu hỏi đóng – câu  hỏi bao gồm cả 2 phần: phần câu hỏi và phần câu trả lời đều được thiết kế sẵn, trong đó có 7 câu hỏi có nhiều sự lựa chọn, 4 câu hỏi phân đôi, 2 câu hỏi bậc thang và 1 câu hỏi sắp xếp thứ tự.

Cụ thể, câu hỏi phân đôi là dạng câu hỏi mà chỉ cho phép 2 khả năng trả lời. Dạng câu hỏi này thường cung cấp thông tin không đầy đủ chi tiết. Để thu được thông tin chi tiết hơn ở 4 câu hỏi dạng này, trong bảng hỏi yêu cầu người được hỏi cung cấp lý do lựa chọn đáp án tương ứng của họ. Thứ hai, câu hỏi có nhiều sự lựa chọn là dạng câu hỏi đưa ra nhiều đáp án cho người được hỏi chọn lựa.

Những câu hỏi dạng này được sử dụng trong bảng hỏi nhằm thu thập thông tin về tình hình sử dụng sản phẩm, đánh giá khái quát của khách hàng về sản phẩm và một vài thông tin cần thiết khác. Trong 2 câu hỏi bậc thang được dùng, một câu dùng để đánh giá sự quan tâm của khách hàng đối với các yếu tố cụ thể bằng thang điểm chia từng khoảng, một câu dùng để hỏi về sự đánh giá của khách hàng sau khi sử dụng xe bằng thang điểm sắp xếp theo thứ bậc.

Cuối cùng, câu hỏi sắp xếp thứ tự cung cấp quan điểm của người hỏi về thứ tự ưu tiên của từng yếu tố. Kết thúc bảng hỏi, cảm ơn người được hỏi một lần nữa.

Nếu bạn gặp khó khăn khi viết luận văn chất lượng hãy liên hệ với đội ngũ Tri Thức Cộng Đồng để được hỗ trợ sử dụng dịch vụ VIẾT THUÊ LUẬN VĂN THẠC SĨ của chúng tôi.

– Chuẩn bị:

Đây là giai đoạn rất quan trọng trong tiến trình điều tra bởi vậy chuẩn bị kỹ lưỡng trước khi tiến hành là điều cần được đầu tư nhiều công sức. Giai đoạn này gồm:

+ Chuẩn bị trước khi tiếp xúc với khách hàng: nắm rõ nội dung, yêu cầu của việc điều tra; trau dồi các kỹ năng giao tiếp, kỹ năng phỏng vấn ( tiếp xúc ban đầu, đặt câu hỏi, ghi chép câu trả lời, thăm dò…)

+ Chuẩn bị tốt các tài liệu, dụng cụ cần thiết để tiến hành phỏng vấn.

– Tiến hành:

+ Đến địa điểm dự định phỏng vấn (nhà dân trong khu vực Cầu Giấy, Từ Liêm, Thanh Trì  TP Hà Nội ) vào:

  • Buổi tối (19 giờ – 21 giờ) các ngày từ thứ 2 đến thứ 6 .
  • Cả ngày thứ 7 và chủ nhật.

+ Người phỏng vấn tiếp xúc với đối tượng phỏng vấn. Nếu đối tượng được hỏi  đồng ý phỏng vấn thì phát cho họ 1 bảng hói và tiến hành phỏng vấn. Thời gian phỏng vấn chỉ nên kéo dài khoảng 10-15 phút.

+ Cảm ơn người được hỏi khi kết thúc..

1.4 Xử lý dữ liệu

Việc xử lý dữ liệu được tiến hành theo 1 trình tự như sau:

– Đánh giá giá trị dữ liệu: để đảm bảo dữ liệu đã được thu thập đúng cách, khách quan và theo đúng thiết kế ban đầu.

– Biên tập dữ liệu: kiểm tra tính hoàn thiên, tính nhất quán, tính rõ ràng của dữ liệu để dữ liệu sẵn sàng cho mã hóa và xử lý dữ liệu.

– Mã hóa dữ liệu: các câu trả lời đã được biên tập sẽ được xác định và phân loại bằng các con số hay kí hiệu.

– Phân tích dữ liệu: sử dụng các phương pháp phân tích thông kê rút ra những kết luận về hiện tượng đang nghiên cứu.

– Giải thích dữ liệu: quá trình chuyển đổi dữ liệu có được thành những thông tin hay chuyển những thông tin mới có được từ sự phân tích thành thông tin phù hợp với cuộc nghiên cứu. Kết quả của quá trình này là cơ sở để rút ra được những kết luận về vấn đề đang nghiên cứu cũng như hướng hay cách thức giải quyết vấn đề đó.

2. Phương pháp thu thập dữ liệu thứ cấp

Dữ liệu thứ cấp là gì? ( Secondary data) 

Dữ liệu thứ cấp là dữ liệu được thu thập do một mục đích nào đó, đã có sẵn ở đâu đó và có thể được sử dụng cho cuộc nghiên cứu này.

Theo Wikipedia định nghĩa: Dữ liệu thứ cấp là dữ liệu đã có sẵn, không phải do mình thu thập, đã công bố nên dễ thu thập, ít tốn thời gian, tiền bạc trong quá trình thu thập nhưng là loại tài liệu quan trọng trong việc nghiên cứu tiếp thị cũng như các ngành khoa học xã hội khác.

Ví dụ thu thập dữ liệu thứ cấp

Nhận thức về công nghệ thu thập dữ liệu
Phương pháp thu thập dữ liệu sơ cấp

Để thu thập được những dữ liệu thứ cấp cần thiết cho cuộc nghiên cứu ta tiến hành như sau:

– Thứ nhất, xác định những thông tin cần thiết cho cuộc nghiên cứu. Những thông tin đó bao gồm:

+ Đặc điểm của thị trường xe máy gần đây.

+ Doanh thu, thị phần, đối thủ cạnh tranh của Honda Việt Nam đặc biệt là dòng xe máy tay ga.

– Thứ hai, tìm nguồn dữ liệu. Những thông tin ở trên được thu thập qua báo, tạp chí, mạng Internet…

– Thứ ba, tiến hành thu thập các thông tin. Thông qua các nguồn dữ liệu, tiến hành sưu tập những thông tin mong muốn. Những thông tin thu thập được đều phải sắp xếp một cách khoa học, có tính hệ thống và ghi rõ nguồn, tên tác giả, ngày đăng tin… điều này là vô cùng quan trọng bởi nó là sự đảm bảo cho khả năng kiểm tra lại thông tin cũng như tính chân thực của thông tin.

– Cuối cùng, trên cơ sở thông tin tìm kiếm được ta đánh giá và lọc lấy những thông tin tốt để đưa vào bài viết của mình.

Phương pháp thu thập dữ liệu sơ cấp và dữ liệu thứ cấp là 2 phương pháp vô cùng quan trọng và được sử dụng rất nhiều trong nghiên cứu khoa học. Hi vọng những kiến thức trên là cái bạn đang cần. Chúc bạn học tập tốt!