Biểu đồ la bàn MongoDB

Vì MongoDB có một lược đồ linh hoạt và không bị ràng buộc cứng nhắc, nên mọi nhà phát triển hoặc quản trị viên cơ sở dữ liệu đều cần một công cụ mạnh mẽ để làm việc với dữ liệu một cách hiệu quả và phân tích dữ liệu một cách dễ dàng

Một trong những công cụ giúp hiểu dữ liệu cơ bản được lưu trữ trong các bộ sưu tập là MongoDB Compass — một ứng dụng GUI giúp loại bỏ nhu cầu kết nối với trình bao Mongo hoặc tìm hiểu cú pháp truy vấn MongoDB. Nó đi kèm với một bộ sưu tập phong phú các tính năng. bạn có thể khám phá/chỉnh sửa/thêm/xóa dữ liệu của mình, xây dựng các đường dẫn tổng hợp một cách tương tác, triển khai xác thực dữ liệu và đánh giá hiệu suất của một bộ sưu tập hoặc cơ sở dữ liệu cụ thể

Công cụ này có ba phiên bản — Cộng đồng, Doanh nghiệp và Chỉ đọc dành cho doanh nghiệp. Chọn một cái phù hợp với bạn nhất. Tất cả các phiên bản chạy trơn tru trên Windows và Mac OS X

Bạn có thể tải xuống và cài đặt ứng dụng này bằng cách làm theo các bước từ hướng dẫn này

Kiểm tra công cụ

Hãy xem Compass xử lý trực quan hóa dữ liệu tốt như thế nào. Chúng ta sẽ làm quen với chức năng chính và thực hiện một số nhiệm vụ phân tích khám phá cơ bản

Tổng quan về các thành phần giao diện

Khi bạn chạy Compass, bạn sẽ thấy mình ở trang đích

Ở đây bạn cần chỉ định tất cả các cấu hình kết nối. tên máy chủ, cổng, loại xác thực, SSL, Đường hầm SSH, v.v.

Bảng điều khiển bên trái sẽ nhắc bạn về các kết nối gần đây — bạn có thể chọn một trong số chúng để tự động điền vào các trường và bắt đầu nhanh chóng

Ở giữa trang, bạn sẽ thấy danh sách cơ sở dữ liệu. Tại đây bạn có thể chọn một trong số chúng, kiểm tra kích thước bộ nhớ, số lượng bộ sưu tập và chỉ mục của chúng

Nếu bạn nhấp vào tab Hiệu suất, bạn sẽ thấy phân tích máy chủ thời gian thực. Nó minh họa những gì đang xảy ra trong cụm của bạn. các hoạt động được thực hiện là gì, phân tích lưu lượng mạng, kết nối và mức tiêu thụ bộ nhớ. Xem nhanh và chuyển sang tạo bộ sưu tập — bạn có thể quay lại để đánh giá hiệu suất sau

Đang tải dữ liệu

Để làm cho tổng quan này thú vị hơn, tôi đã quyết định kiểm tra bộ dữ liệu Kaggle, dành cho 120 năm lịch sử Olympic. Chúng tôi sẽ thử trích xuất bất kỳ thông tin chi tiết nào từ nó

Có tính đến việc các tài liệu trong MongoDB được lưu trữ dưới dạng JSON, chúng ta cần chuyển đổi tệp CSV thành tệp JSON

Trước khi tạo một bộ sưu tập trong cơ sở dữ liệu, hãy cân nhắc rằng MongoDB yêu cầu một định dạng dữ liệu JSON đặc biệt

{
"Name": "Gunn Margit Aas Andreassen",
"Sex": "F",
"Age": 24,
"Height": 177
} {
"Name": "Monica Aksamit",
"Sex": "F",
"Age": 26,
"Height": 183
}

Nhưng tập dữ liệu của chúng tôi có cấu trúc sau

[{
"Name": "Gunn Margit Aas Andreassen",
"Sex": "F",
"Age": 24,
"Height": 177
}, {
"Name": "Monica Aksamit",
"Sex": "F",
"Age": 26,
"Height": 183
}]

Vì vậy, hãy nhập một mảng JSON truyền thống vào MongoDB bằng cách chạy lệnh sau trong CLI

mongoimport --db <db-name> --collection athletes --type json --file athletes.json
--jsonArray

thì đấy. Bây giờ bạn đã có một bộ sưu tập mới có tên là các vận động viên và nó chứa đầy dữ liệu, bạn có thể xem trước tất cả các tài liệu, được trình bày trong Dạng xem Bảng/Danh sách

Kiểm tra tất cả các số liệu thống kê cơ bản về tổng số tài liệu trong bộ sưu tập, kích thước tổng và kích thước trung bình của tài liệu, chỉ mục và trường

Ngay tại đây, bạn có thể thử chỉnh sửa dữ liệu một cách tương tác, thực hiện các truy vấn đơn giản và phức tạp

Lý tưởng nhất là bạn không cần phải biết ngôn ngữ truy vấn MongoDB để áp dụng các tập hợp và lọc. Đó là điều rất tiện lợi về công cụ GUI này

Hiểu cấu trúc

Điều tiếp theo tôi muốn tận dụng là công cụ trực quan Schema — nó giúp hiểu cấu trúc dữ liệu của bạn

Trình hiển thị này hoạt động như thế nào?

Nó chọn ngẫu nhiên một tập hợp con dữ liệu từ bộ sưu tập và tạo báo cáo dựa trên mẫu này. Lấy mẫu là một kỹ thuật quan trọng để phân tích thống kê vì nó giúp tiết kiệm đáng kể tài nguyên tính toán, loại bỏ nhu cầu quét toàn bộ bộ sưu tập. Do đó, có tác động thấp đến hiệu suất của cơ sở dữ liệu của bạn. Trên hết, bạn có thể chỉ định một truy vấn tùy chỉnh để truy xuất tập hợp con các tài liệu đáp ứng một điều kiện nhất định

Trong mẫu của chúng tôi, báo cáo được tạo dựa trên 13. 6% tài liệu

Đi sâu vào những hiểu biết sâu sắc

Sau khi truy vấn một mẫu tài liệu, bạn sẽ thấy một bản tóm tắt nhanh bao gồm các khía cạnh sau

Bạn có thể phân tích những ngày phổ biến nhất khi tài liệu được chèn vào. Điều này đạt được bằng cách biểu thị phân phối ngày bằng biểu đồ. Ngoài ra, có một mã vạch hiển thị thời gian các nhóm tài liệu được đưa vào bộ sưu tập

Làm thế nào để chúng tôi có được thông tin này?

Mọi tài liệu trong MongoDB đều có trường _id với một giá trị mặc định duy nhất. Nó được tạo tự động khi chèn tài liệu. Loại của nó là ObjectID, phiên bản nào chứa thông tin có dấu thời gian. Do đó, bạn có thể truy cập vào thời điểm tạo bất kỳ tài liệu nào

Hãy chuyển sang xem số liệu thống kê mô tả cho các lĩnh vực khác

Tại đây, bạn có thể nhận thấy rằng có một mẫu giá trị được hiển thị cho trường chứa nhiều chuỗi duy nhất. Bạn có thể cập nhật nó để xem một tập hợp con ngẫu nhiên mỗi khi bạn cần. Chỉ cần nhấp vào dấu mũi tên để làm mới danh sách

Để tìm chuỗi trùng lặp trên các tài liệu, bạn có thể sử dụng biểu đồ được hiển thị gần trường. Nó cho thấy sự phân phối các giá trị của trường. Trong ví dụ này, bạn có thể đi đến kết luận rằng môn thể thao phổ biến nhất trong bộ dữ liệu là Điền kinh, môn phổ biến thứ hai là Bơi lội, môn thứ ba là - Đấu vật

Nếu trường có một số lượng nhỏ các giá trị chuỗi có thể có, chẳng hạn như hai, thì phân phối các giá trị được biểu thị bằng một thanh

Một trường hợp thú vị khác mà bạn có thể sử dụng biểu đồ là khi cố gắng tìm giá trị tối thiểu và tối đa của trường (điều này chỉ áp dụng cho các giá trị số)

Hãy kiểm tra phạm vi dữ liệu của chúng tôi. Độ tuổi tối thiểu và tối đa của các vận động viên lần lượt là 4 và 54. Hầu hết các vận động viên có độ tuổi 22–24

Bạn có thể nhận thông tin chi tiết về phạm vi chiều cao theo cách tương tự

Bạn có thể nhận thấy rằng một phần giá trị của trường 'Chiều cao' có kiểu số, phần còn lại - kiểu chuỗi. Nhờ hình dung này mà bạn biết được kiểu dữ liệu của trường là không đồng nhất

Biểu đồ các năm được nhóm theo khoảng thời gian

Một chức năng mạnh khác của Compass là Giải thích kế hoạch. Nó cực kỳ hữu ích trong việc phân tích hiệu suất truy vấn. Tại đây, bạn có thể đánh giá thời gian thực hiện truy vấn và nắm bắt mọi truy vấn chưa được lập chỉ mục

Ngoài ra, bạn có thể chọn biểu diễn kết quả — dưới dạng cây trực quan hoặc JSON thô

Chọn cái phù hợp nhất với bạn

Trên tab Chỉ mục, bạn có thể kiểm tra các chỉ mục cho bộ sưu tập này là gì, tìm hiểu thêm về loại, kích cỡ, thuộc tính của chúng

Với Xác thực dữ liệu, bạn có thể thêm quy tắc xác thực bằng cách sử dụng Trình tạo quy tắc để thực thi cấu trúc dữ liệu của tài liệu khi chúng được cập nhật hoặc chèn. Tính năng này giúp giữ sạch dữ liệu của bạn

Từ cuối cùng

Theo suy nghĩ của tôi, MongoDB và Mongo Compass phối hợp với nhau rất ăn ý. Theo tôi, Compass là cách tự nhiên nhất để làm việc với dữ liệu MongoDB của bạn vì nó cải thiện đáng kể năng suất. Nó cũng đối phó tốt với các tác vụ quản trị cơ sở dữ liệu và trực quan hóa và phân tích dữ liệu khám phá ban đầu, loại bỏ nhu cầu sử dụng trình bao MongoDB. Tất nhiên, bạn không thể gọi Compass là giải pháp BI đầy đủ tính năng vì nó xử lý các nhiệm vụ hoàn toàn khác nhau, cụ thể là

  • Trực quan hóa và khám phá lược đồ một cách tương tác. Bạn có thể dễ dàng xem cấu trúc của bộ sưu tập và kiểm tra kiểu dữ liệu của từng trường trong tài liệu
  • Xây dựng đường ống tổng hợp bằng cách sử dụng Trình tạo truy vấn trực quan
  • Sửa đổi/xóa/chèn tài liệu bằng Visual Editor
  • Giải thích các vấn đề về hiệu suất
  • Quản lý chỉ mục
  • Phân tích số liệu thống kê máy chủ trong thời gian thực bao gồm thông tin về hoạt động, truy vấn, lưu lượng mạng, v.v. Với nó, bạn có thể theo dõi những gì đang diễn ra trong cụm của mình
  • Xác nhận tài liệu. Bạn có thể thêm các quy tắc để đảm bảo rằng tất cả các tài liệu đến đều được kiểm tra trước khi chèn khi tuân theo các quy tắc này

Ngoài ra, tôi muốn đề cập rằng bạn có thể mở rộng chức năng của nó bằng cách tạo hoặc cài đặt một plugin tùy chỉnh

Tôi khuyên mọi người nên thử trải nghiệm với dữ liệu, tận dụng các công cụ và cách tiếp cận khác nhau. Trong bài viết tiếp theo, tôi sẽ đề cập đến việc sử dụng Biểu đồ MongoDB như một giải pháp cho kinh doanh thông minh

Làm cách nào để xem dữ liệu trong MongoDB Compass?

Trong La bàn, sử dụng bảng điều hướng bên trái để chọn cơ sở dữ liệu và bộ sưu tập bạn muốn nhập dữ liệu vào
Nhấp vào tab Tài liệu
Nhấp vào Thêm dữ liệu và chọn Chèn tài liệu
Đảm bảo rằng Chế độ xem được đặt thành JSON hoặc {} và dán tài liệu JSON đã sao chép vào trường
Nhấp vào Chèn

La bàn MongoDB có phải là GUI không?

MongoDB Compass là một GUI mạnh mẽ để truy vấn, tổng hợp và phân tích dữ liệu MongoDB của bạn trong môi trường trực quan. La bàn miễn phí sử dụng và có sẵn nguồn và có thể chạy trên macOS, Windows và Linux.

Biểu đồ MongoDB có miễn phí không?

MongoDB cung cấp cho mỗi phiên bản Biểu đồ 1 GB dữ liệu truyền miễn phí mỗi tháng . Bạn có thể xem mức sử dụng dữ liệu hàng tháng của phiên bản Biểu đồ của mình trong trang Sử dụng dữ liệu. Bậc sử dụng miễn phí cung cấp khoảng 500.000 kết xuất biểu đồ trong hơn một tháng.