Vì MongoDB có một lược đồ linh hoạt và không bị ràng buộc cứng nhắc, nên mọi nhà phát triển hoặc quản trị viên cơ sở dữ liệu đều cần một công cụ mạnh mẽ để làm việc với dữ liệu một cách hiệu quả và phân tích dữ liệu một cách dễ dàng Show Một trong những công cụ giúp hiểu dữ liệu cơ bản được lưu trữ trong các bộ sưu tập là MongoDB Compass — một ứng dụng GUI giúp loại bỏ nhu cầu kết nối với trình bao Mongo hoặc tìm hiểu cú pháp truy vấn MongoDB. Nó đi kèm với một bộ sưu tập phong phú các tính năng. bạn có thể khám phá/chỉnh sửa/thêm/xóa dữ liệu của mình, xây dựng các đường dẫn tổng hợp một cách tương tác, triển khai xác thực dữ liệu và đánh giá hiệu suất của một bộ sưu tập hoặc cơ sở dữ liệu cụ thể Công cụ này có ba phiên bản — Cộng đồng, Doanh nghiệp và Chỉ đọc dành cho doanh nghiệp. Chọn một cái phù hợp với bạn nhất. Tất cả các phiên bản chạy trơn tru trên Windows và Mac OS X Bạn có thể tải xuống và cài đặt ứng dụng này bằng cách làm theo các bước từ hướng dẫn này Kiểm tra công cụHãy xem Compass xử lý trực quan hóa dữ liệu tốt như thế nào. Chúng ta sẽ làm quen với chức năng chính và thực hiện một số nhiệm vụ phân tích khám phá cơ bản Tổng quan về các thành phần giao diệnKhi bạn chạy Compass, bạn sẽ thấy mình ở trang đích Ở đây bạn cần chỉ định tất cả các cấu hình kết nối. tên máy chủ, cổng, loại xác thực, SSL, Đường hầm SSH, v.v. Bảng điều khiển bên trái sẽ nhắc bạn về các kết nối gần đây — bạn có thể chọn một trong số chúng để tự động điền vào các trường và bắt đầu nhanh chóng Ở giữa trang, bạn sẽ thấy danh sách cơ sở dữ liệu. Tại đây bạn có thể chọn một trong số chúng, kiểm tra kích thước bộ nhớ, số lượng bộ sưu tập và chỉ mục của chúng Nếu bạn nhấp vào tab Hiệu suất, bạn sẽ thấy phân tích máy chủ thời gian thực. Nó minh họa những gì đang xảy ra trong cụm của bạn. các hoạt động được thực hiện là gì, phân tích lưu lượng mạng, kết nối và mức tiêu thụ bộ nhớ. Xem nhanh và chuyển sang tạo bộ sưu tập — bạn có thể quay lại để đánh giá hiệu suất sau Đang tải dữ liệuĐể làm cho tổng quan này thú vị hơn, tôi đã quyết định kiểm tra bộ dữ liệu Kaggle, dành cho 120 năm lịch sử Olympic. Chúng tôi sẽ thử trích xuất bất kỳ thông tin chi tiết nào từ nó Có tính đến việc các tài liệu trong MongoDB được lưu trữ dưới dạng JSON, chúng ta cần chuyển đổi tệp CSV thành tệp JSON Trước khi tạo một bộ sưu tập trong cơ sở dữ liệu, hãy cân nhắc rằng MongoDB yêu cầu một định dạng dữ liệu JSON đặc biệt { Nhưng tập dữ liệu của chúng tôi có cấu trúc sau [{ Vì vậy, hãy nhập một mảng JSON truyền thống vào MongoDB bằng cách chạy lệnh sau trong CLI mongoimport --db <db-name> --collection athletes --type json --file athletes.json thì đấy. Bây giờ bạn đã có một bộ sưu tập mới có tên là các vận động viên và nó chứa đầy dữ liệu, bạn có thể xem trước tất cả các tài liệu, được trình bày trong Dạng xem Bảng/Danh sách Kiểm tra tất cả các số liệu thống kê cơ bản về tổng số tài liệu trong bộ sưu tập, kích thước tổng và kích thước trung bình của tài liệu, chỉ mục và trường Ngay tại đây, bạn có thể thử chỉnh sửa dữ liệu một cách tương tác, thực hiện các truy vấn đơn giản và phức tạp Lý tưởng nhất là bạn không cần phải biết ngôn ngữ truy vấn MongoDB để áp dụng các tập hợp và lọc. Đó là điều rất tiện lợi về công cụ GUI này Hiểu cấu trúcĐiều tiếp theo tôi muốn tận dụng là công cụ trực quan Schema — nó giúp hiểu cấu trúc dữ liệu của bạn Trình hiển thị này hoạt động như thế nào? Nó chọn ngẫu nhiên một tập hợp con dữ liệu từ bộ sưu tập và tạo báo cáo dựa trên mẫu này. Lấy mẫu là một kỹ thuật quan trọng để phân tích thống kê vì nó giúp tiết kiệm đáng kể tài nguyên tính toán, loại bỏ nhu cầu quét toàn bộ bộ sưu tập. Do đó, có tác động thấp đến hiệu suất của cơ sở dữ liệu của bạn. Trên hết, bạn có thể chỉ định một truy vấn tùy chỉnh để truy xuất tập hợp con các tài liệu đáp ứng một điều kiện nhất định Trong mẫu của chúng tôi, báo cáo được tạo dựa trên 13. 6% tài liệu Đi sâu vào những hiểu biết sâu sắcSau khi truy vấn một mẫu tài liệu, bạn sẽ thấy một bản tóm tắt nhanh bao gồm các khía cạnh sau Bạn có thể phân tích những ngày phổ biến nhất khi tài liệu được chèn vào. Điều này đạt được bằng cách biểu thị phân phối ngày bằng biểu đồ. Ngoài ra, có một mã vạch hiển thị thời gian các nhóm tài liệu được đưa vào bộ sưu tập Làm thế nào để chúng tôi có được thông tin này? Mọi tài liệu trong MongoDB đều có trường _id với một giá trị mặc định duy nhất. Nó được tạo tự động khi chèn tài liệu. Loại của nó là ObjectID, phiên bản nào chứa thông tin có dấu thời gian. Do đó, bạn có thể truy cập vào thời điểm tạo bất kỳ tài liệu nào Hãy chuyển sang xem số liệu thống kê mô tả cho các lĩnh vực khác Tại đây, bạn có thể nhận thấy rằng có một mẫu giá trị được hiển thị cho trường chứa nhiều chuỗi duy nhất. Bạn có thể cập nhật nó để xem một tập hợp con ngẫu nhiên mỗi khi bạn cần. Chỉ cần nhấp vào dấu mũi tên để làm mới danh sách Để tìm chuỗi trùng lặp trên các tài liệu, bạn có thể sử dụng biểu đồ được hiển thị gần trường. Nó cho thấy sự phân phối các giá trị của trường. Trong ví dụ này, bạn có thể đi đến kết luận rằng môn thể thao phổ biến nhất trong bộ dữ liệu là Điền kinh, môn phổ biến thứ hai là Bơi lội, môn thứ ba là - Đấu vật Nếu trường có một số lượng nhỏ các giá trị chuỗi có thể có, chẳng hạn như hai, thì phân phối các giá trị được biểu thị bằng một thanh Một trường hợp thú vị khác mà bạn có thể sử dụng biểu đồ là khi cố gắng tìm giá trị tối thiểu và tối đa của trường (điều này chỉ áp dụng cho các giá trị số) Hãy kiểm tra phạm vi dữ liệu của chúng tôi. Độ tuổi tối thiểu và tối đa của các vận động viên lần lượt là 4 và 54. Hầu hết các vận động viên có độ tuổi 22–24 Bạn có thể nhận thông tin chi tiết về phạm vi chiều cao theo cách tương tự Bạn có thể nhận thấy rằng một phần giá trị của trường 'Chiều cao' có kiểu số, phần còn lại - kiểu chuỗi. Nhờ hình dung này mà bạn biết được kiểu dữ liệu của trường là không đồng nhất Biểu đồ các năm được nhóm theo khoảng thời gian Một chức năng mạnh khác của Compass là Giải thích kế hoạch. Nó cực kỳ hữu ích trong việc phân tích hiệu suất truy vấn. Tại đây, bạn có thể đánh giá thời gian thực hiện truy vấn và nắm bắt mọi truy vấn chưa được lập chỉ mục Ngoài ra, bạn có thể chọn biểu diễn kết quả — dưới dạng cây trực quan hoặc JSON thô Chọn cái phù hợp nhất với bạn Trên tab Chỉ mục, bạn có thể kiểm tra các chỉ mục cho bộ sưu tập này là gì, tìm hiểu thêm về loại, kích cỡ, thuộc tính của chúng Với Xác thực dữ liệu, bạn có thể thêm quy tắc xác thực bằng cách sử dụng Trình tạo quy tắc để thực thi cấu trúc dữ liệu của tài liệu khi chúng được cập nhật hoặc chèn. Tính năng này giúp giữ sạch dữ liệu của bạn Từ cuối cùng Theo suy nghĩ của tôi, MongoDB và Mongo Compass phối hợp với nhau rất ăn ý. Theo tôi, Compass là cách tự nhiên nhất để làm việc với dữ liệu MongoDB của bạn vì nó cải thiện đáng kể năng suất. Nó cũng đối phó tốt với các tác vụ quản trị cơ sở dữ liệu và trực quan hóa và phân tích dữ liệu khám phá ban đầu, loại bỏ nhu cầu sử dụng trình bao MongoDB. Tất nhiên, bạn không thể gọi Compass là giải pháp BI đầy đủ tính năng vì nó xử lý các nhiệm vụ hoàn toàn khác nhau, cụ thể là
Ngoài ra, tôi muốn đề cập rằng bạn có thể mở rộng chức năng của nó bằng cách tạo hoặc cài đặt một plugin tùy chỉnh Tôi khuyên mọi người nên thử trải nghiệm với dữ liệu, tận dụng các công cụ và cách tiếp cận khác nhau. Trong bài viết tiếp theo, tôi sẽ đề cập đến việc sử dụng Biểu đồ MongoDB như một giải pháp cho kinh doanh thông minh Làm cách nào để xem dữ liệu trong MongoDB Compass?Trong La bàn, sử dụng bảng điều hướng bên trái để chọn cơ sở dữ liệu và bộ sưu tập bạn muốn nhập dữ liệu vào Nhấp vào tab Tài liệu Nhấp vào Thêm dữ liệu và chọn Chèn tài liệu Đảm bảo rằng Chế độ xem được đặt thành JSON hoặc {} và dán tài liệu JSON đã sao chép vào trường Nhấp vào Chèn La bàn MongoDB có phải là GUI không?MongoDB Compass là một GUI mạnh mẽ để truy vấn, tổng hợp và phân tích dữ liệu MongoDB của bạn trong môi trường trực quan. La bàn miễn phí sử dụng và có sẵn nguồn và có thể chạy trên macOS, Windows và Linux.
Biểu đồ MongoDB có miễn phí không?MongoDB cung cấp cho mỗi phiên bản Biểu đồ 1 GB dữ liệu truyền miễn phí mỗi tháng . Bạn có thể xem mức sử dụng dữ liệu hàng tháng của phiên bản Biểu đồ của mình trong trang Sử dụng dữ liệu. Bậc sử dụng miễn phí cung cấp khoảng 500.000 kết xuất biểu đồ trong hơn một tháng. |