Làm cách nào để xuất dữ liệu từ tập bản đồ mongodb?

Bắt đầu với việc thiết lập xuất sang S3 với dữ liệu bạn muốn đưa vào, hãy đọc thêm trong bài viết trợ giúp này

đảm bảo

  • Bao gồm hàng tiêu đề (không chọn "Không" cho định dạng tiêu đề)

  • Sử dụng "Xuất" làm định dạng số liệu

  • Chọn CSV làm định dạng tệp

2. Trong MongoDB

2. 1 Tạo Hồ dữ liệu

Làm theo hướng dẫn của họ để tạo Hồ dữ liệu

Khi nhấp vào kết nối dữ liệu, bạn sẽ được nhắc kết nối Kho lưu trữ dữ liệu để bạn có thể kết nối với S3. Làm theo các bước và tạo vai trò IAM cho MongoDB để sử dụng trong tài khoản AWS của bạn

Làm cách nào để xuất dữ liệu từ tập bản đồ mongodb?

2. 2 Xác định đường dẫn Lưu trữ Dữ liệu

Sao chép đường dẫn đến một trong các tệp của bạn đã xuất từ ​​bước 1 và nhập đường dẫn đó vào "Đường dẫn S3 mẫu". Đảm bảo chọn bất kỳ giá trị (*) nào cho tên tệp và chọn tĩnh cho bất kỳ thư mục nào khác mà bạn có thể có (Tôi có thư mục testPath nhưng nó đã được chọn làm tiền tố trong thiết lập nhóm ở bước trước nên nó không được hiển thị

Làm cách nào để xuất dữ liệu từ tập bản đồ mongodb?

Xong

Bây giờ quá trình thiết lập đã hoàn tất và bạn có thể vẽ biểu đồ hoặc truy vấn tất cả dữ liệu có trong thư mục S3 đã định cấu hình từ bản xuất S3. Đường ống sẽ tự động cập nhật dữ liệu và thêm các trường mới

MongoDB cho phép bạn xuất dữ liệu của nó sang các định dạng tệp khác như JSON hoặc CSV để dữ liệu có thể được sử dụng bên ngoài bởi các ứng dụng khác. Vì vậy, để xuất dữ liệu từ cơ sở dữ liệu MongoDB, MongoDB cung cấp một công cụ dòng lệnh được gọi là mongoexport. Sử dụng công cụ này, bạn có thể xuất dữ liệu của bộ sưu tập ở định dạng JSON hoặc CSV (giá trị được phân tách bằng dấu phẩy). Hơn nữa, chúng tôi cũng có thể sử dụng các tính năng như giới hạn và sắp xếp trên bộ sưu tập trong khi xuất dữ liệu

Ghi chú. mongoexport không chạy trong vỏ mongo. Vì vậy, khi bạn sử dụng công cụ mongoexport, bạn phải thoát khỏi mongo shell

cú pháp

Để xuất dữ liệu ở định dạng JSON

mongoexport –db database_name –collection collection_name –out path_or_name_of_the_file

Để xuất dữ liệu ở định dạng CSV

mongoexport –db database_name –collection collection_name –type=csv –fields field_names –out path_or_name_of_the_file

Điểm quan trọng.  

  • Ở đây, lệnh out chỉ định thư mục và tệp lưu trữ dữ liệu đã xuất. Trong trường hợp chúng tôi không sử dụng –out, tệp sẽ được tạo tại đường dẫn mà chúng tôi đang ở thời điểm chạy cmd
  • Nếu tệp được chỉ định không được tạo thì công cụ mongoexport sẽ tự động tạo tệp và lưu trữ dữ liệu trong đó
  • Nếu công cụ mongoexport không có trong hệ thống của bạn thì bạn có thể cài đặt nó từ đây
  • Công cụ mongoexport cũng cung cấp các tùy chọn. Một số tùy chọn thường được sử dụng là
Quyền mua

Sự mô tả

–helpIt sẽ trả về thông tin về tùy chọn và việc sử dụng mongoexport –version Nó sẽ trả về phiên bản của mongoexport–dbIt sẽ chỉ định tên của cơ sở dữ liệu mà mongoexport sẽ chạy. –collectionNó sẽ chỉ định bộ sưu tập để xuất. –fieldsNó sẽ chỉ định các trường sẽ bao gồm trong quá trình xuất. Nếu bạn đang chỉ định nhiều trường, hãy sử dụng dấu phẩy ở giữa chúng. e. g. –fields name, class–typeNó sẽ chỉ định loại tệp sẽ xuất. Đối với định dạng JSON, hãy sử dụng json và đối với định dạng CSV, hãy sử dụng csv. –outIt sẽ chỉ định một tệp mà dữ liệu sẽ được lưu trữ. –skipSử dụng tùy chọn này, bạn có thể kiểm soát nơi mongoexport bắt đầu xuất tệp. –sortSử dụng tùy chọn này, bạn có thể sắp xếp dữ liệu xuất. –limitSử dụng tùy chọn này, bạn có thể giới hạn số lượng tài liệu cần xuất.  

ví dụ

Trong các ví dụ sau, chúng tôi đang làm việc với

cơ sở dữ liệu. GeekforGeek

Bộ sưu tập. sinh viên

Các tài liệu. năm tài liệu chứa thông tin chi tiết về sinh viên ở dạng cặp trường-giá trị

Làm cách nào để xuất dữ liệu từ tập bản đồ mongodb?

  • Xuất toàn bộ bộ sưu tập ở định dạng JSON

Trong ví dụ này, chúng tôi sẽ xuất tất cả các tài liệu có trong bộ sưu tập sinh viên sang tệp JSON (có tên là exporttudents. json) bằng công cụ mongoexport

mongoexport –db GeeksForGeeks –collection students –type=csv –fields name,age –out C. \Users\Darksider\students. csv

Bảng sau đây thảo luận cách chọn giữa các công cụ khác nhau để di chuyển và nhập dữ liệu cho các cấu hình cụm phổ biến

Cấu hình cụm nguồn

Chiến lược nhập khẩu

Triển khai MongoDB được quản lý bởi Cloud Manager hoặc Ops Manager

Sử dụng khi Trình quản lý đám mây hoặc Trình quản lý hoạt động đẩy dữ liệu lên Atlas bằng cách sử dụng bảo mật mà không yêu cầu quyền truy cập vào cụm nguồn thông qua tường lửa của cụm

Triển khai MongoDB không được quản lý bởi Cloud Manager hoặc Ops Manager

Sử dụng khi Atlas lấy dữ liệu từ triển khai nguồn và yêu cầu quyền truy cập vào triển khai nguồn thông qua tường lửa của triển khai

Cụm nhiều bên thuê được chia sẻ hoặc cụm mà bạn không có quyền truy cập vào oplog hoặc cụm chạy phiên bản MongoDB không còn được hỗ trợ

Sử dụng mongorestore

Triển khai MongoDB "đơn" tiêu chuẩn trong Compose

Di chuyển từ Compose sang MongoDB Atlas

Bản sao được đặt trong AWS .

Di chuyển Bộ bản sao MongoDB từ AWS sang MongoDB Atlas

Tham khảo thêm

  • Để di chuyển dữ liệu sang phiên bản không có máy chủ, hãy sử dụng La bàn để xuất và nhập dữ liệu hoặc di chuyển dữ liệu bằng các công cụ tự quản lý. Để tìm hiểu thêm, hãy xem Giới hạn của Serverless Instance.

  • Để tải dữ liệu vào một cụm mới trong Atlas, hãy xem

  • Để tạo một bản sao cụm của bạn cho mục đích thử nghiệm, hãy xem Phương pháp sao lưu MongoDB.

  • Nếu ứng dụng mà bạn muốn di chuyển yêu cầu thời gian hoạt động gần như liên tục, hãy liên hệ và chia sẻ các yêu cầu về thời gian hoạt động cũng như cấu hình cụm của bạn

    Dữ liệu MongoDB Atlas được lưu trữ ở đâu?

    MongoDB Atlas sao lưu dữ liệu của bạn bằng khả năng chụp nhanh gốc của nhà cung cấp đám mây. Các bản sao lưu của bạn được lưu trữ trong cùng một vùng đám mây với cơ sở dữ liệu được quản lý của bạn .

    Tôi có thể sử dụng MongoDB Atlas để sản xuất không?

    Bạn có thể tạo vai trò và người dùng Atlas cấp dự án với quyền truy cập thích hợp vào các môi trường ứng dụng sản xuất và phát triển khác nhau .

    Truyền dữ liệu Atlas là gì?

    " Atlas AWS Data Transfer (Same Region) " dành cho truyền dữ liệu và lưu lượng giữa các nút cụm và dữ liệu được truyền giữa một ứng dụng nằm trong cùng khu vực với cụm của bạn. The traffic between the nodes in your Atlas cluster includes heartbeats and data replication between nodes.