Cách lưu trữ dữ liệu trong mongodb bằng python

MongoDB là cơ sở dữ liệu dựa trên tài liệu với lược đồ dữ liệu động. Ký hiệu đối tượng JavaScript (JSON) mà nó hỗ trợ rất phù hợp để làm việc với các đối tượng trong các ngôn ngữ lập trình hiện đại như JavaScript, Python và các ngôn ngữ khác. Điều này cung cấp một giải pháp thay thế cho các Hệ thống quản lý cơ sở dữ liệu quan hệ (RDBMS) truyền thống hơn như SQL. MongoDB là một ví dụ về cơ sở dữ liệu NoSQL. Các cơ sở dữ liệu này thường sử dụng các bộ sưu tập tài liệu thay vì các bảng được sử dụng trong RDBMS. Các cơ sở dữ liệu này hỗ trợ các lược đồ cơ sở dữ liệu động giúp chúng phản ứng nhanh với những thay đổi trong cấu trúc dữ liệu

Đoạn mồi ngắn này đưa ra một số ví dụ về cách sử dụng MongoDB với Python bằng thư viện pymongo. Điều này kết thúc bằng cách giới thiệu mongoengine để làm việc với cơ sở dữ liệu Mongo trong các dự án phần mềm hiện đại cũng như cách chuyển đổi chúng thành các đối tượng khung dữ liệu để phân tích thêm. Giả sử rằng người đọc cảm thấy thoải mái khi tải xuống và thiết lập MongoDB và có một số kinh nghiệm cơ bản về sử dụng Python

Kết cấu

Cấu trúc của cơ sở dữ liệu tài liệu khác với cấu trúc của cơ sở dữ liệu quan hệ lưu trữ dữ liệu theo hàng (bản ghi) và cột (trường)

Hình ảnh hiển thị một bảng chứng khoán ví dụ tạo thành một cơ sở dữ liệu quan hệ (Ảnh của tác giả)

Trong cấu trúc này, mỗi cột chỉ nên chứa dữ liệu cùng loại. Ví dụ: chúng tôi chỉ mong muốn xem dữ liệu mặt hàng trong kho trong cột mặt hàng trong kho. Mọi dữ liệu mới sẽ yêu cầu tạo một cột mới hoặc một bảng mới, sau đó xác định mối quan hệ giữa các bảng bằng mã định danh duy nhất (khóa chính) được gọi là khóa ngoại trong các bảng tiếp theo. Việc thay đổi cấu trúc của dữ liệu này, đặc biệt là khi nó đã chứa dữ liệu, có thể phức tạp hơn và có thể yêu cầu sử dụng các công cụ di chuyển

Trái ngược với điều này, MongoDB lưu trữ dữ liệu dưới dạng tập hợp các tài liệu bằng cách sử dụng các cặp khóa/giá trị

Một bộ tài liệu chứa dữ liệu (Ảnh của tác giả)

Không giống như cơ sở dữ liệu quan hệ nơi chúng ta sẽ phải tạo một cột mới trong bảng để lưu trữ thông tin, dữ liệu có thể được nhúng. Điều này có nghĩa là chúng tôi chỉ cần lưu trữ những gì có liên quan hơn là tạo ra sự dư thừa

Bắt đầu

Pymongo là trình điều khiển Python cho MongoDB cho phép bạn tương tác với cơ sở dữ liệu Mongo bằng Python. Trước tiên, bạn cần cài đặt MongoDB trên hệ thống của mình. Nếu bạn chưa làm như vậy, bạn có thể đọc cách làm điều đó ở đây. https. // tài liệu. mongodb. com/manual/installation/

Để sử dụng pymongo, trước tiên bạn cần cài đặt thư viện, ví dụ với pip trong dấu nhắc Python

pip install pymongo

Tiếp theo, chúng ta cần nhập thư viện pymongo vào tệp Python hoặc sổ ghi chép Jupyter

import pymongo

Và sau đó kết nối với ứng dụng khách Mongo. Điều này kết nối trên máy chủ và cổng mặc định

client = pymongo.MongoClient(“mongodb://localhost:27017/”)

Sau đó chúng ta có thể tạo một cơ sở dữ liệu để lưu trữ một số dữ liệu. Trong ví dụ này, nó sẽ lưu trữ một số thông tin chi tiết về bệnh nhân cho một hệ thống y tế

db = client[“med_data”]

Tiếp theo, chúng ta có thể thêm một bộ sưu tập vào cơ sở dữ liệu đó. Mỗi cơ sở dữ liệu có thể chứa nhiều bộ sưu tập. Bộ sưu tập này sẽ được gọi là bệnh nhân_data và chúng tôi sẽ tham chiếu bộ sưu tập trong Python bằng cách sử dụng biến my_collection

my_collection = db["patient_data"]
Chèn dữ liệu

Sau đó, chúng tôi có thể thêm một số dữ liệu (tài liệu) vào bộ sưu tập. Giả sử chúng ta muốn lưu trữ một số chi tiết cơ bản về một bệnh nhân. Điều này có thể bao gồm tên, tuổi, giới tính sinh học và nhịp tim của họ. Chúng tôi cũng sẽ lưu trữ huyết áp của họ. Huyết áp này thường được hiển thị bằng hai số đại diện cho huyết áp tâm thu và tâm trương và thường được đo bằng milimét thủy ngân (mmHg), ví dụ 156/82. Trong MongoDB, các trường (mục dữ liệu) được gói gọn trong dấu ngoặc nhọn ({}) bằng cách sử dụng ký hiệu đối tượng JavaScript. Mỗi trường bao gồm một cặp khóa/giá trị. Tên trường (khóa) được đặt trong dấu ngoặc kép, sau đó là dấu hai chấm và sau đó là giá trị liên quan. Giá trị văn bản (dữ liệu văn bản) cũng được gói gọn trong dấu ngoặc kép, số (dữ liệu số) thì không. Các giá trị cũng có thể chứa các đối tượng và mảng khác. Mảng có thể lưu trữ danh sách dữ liệu và các cặp giá trị khóa khác và được biểu thị bằng dấu ngoặc vuông ([]). Tại đây, chúng tôi có thể lưu trữ các khóa và giá trị cho huyết áp tâm thu (sys) và tâm trương (dia) cùng với các giá trị dữ liệu

patient_record = {
"Name": "Maureen Skinner",
"Age": 87,
"Sex": "F",
"Blood pressure": [{"sys": 156}, {"dia": 82}],
"Heart rate": 82
}

Có thể thêm nhiều tài liệu bằng cách thêm dấu phẩy sau dấu ngoặc nhọn và thêm các đối tượng bổ sung. Các đối tượng khác nhau cũng có thể chứa các trường dữ liệu hoàn toàn khác nhau theo yêu cầu

Khi chúng tôi đã tạo (các) tài liệu, chúng tôi có thể thêm nó vào bộ sưu tập. Để thêm một tài liệu, trước tiên, chúng tôi chỉ định bộ sưu tập mà chúng tôi muốn thêm vào, sau đó là dấu chấm, sau đó chúng tôi có thể sử dụng hàm insert_one (đối với nhiều tài liệu, chúng tôi sử dụng insert_many) chuyển vào biến đối tượng tài liệu

my_collection.insert_one(patient_record)

Để xem nội dung của bộ sưu tập, chúng ta có thể lặp qua từng mục của bộ sưu tập và in nó

for item in my_collection.find():
print(item)

Điều này sẽ xuất dữ liệu như vậy

Hình ảnh của tác giả

Xem dữ liệu theo cách này khiến nó khá khó đọc, đặc biệt nếu bạn có nhiều trường và tài liệu cần xuất. May mắn thay, Python có một thư viện in đẹp cho mục đích như vậy. Nếu chúng tôi sửa đổi mã để nhập thư viện và sử dụng chức năng (lưu ý chữ 'p' kép trong bản in)

________số 8

Bạn có thể thấy rằng nó xuất dữ liệu ở định dạng dễ đọc hơn nhiều

Hình ảnh của tác giả

Lưu ý rằng MongoDB tự động thêm một ObjectId để nhận dạng duy nhất từng tài liệu. Đây là chuỗi thập lục phân 12 byte bao gồm dấu thời gian, giá trị được tạo ngẫu nhiên và bộ đếm tăng dần. Các id này được hiển thị khi xuất dữ liệu. Bạn cũng có thể ghi đè điều này bằng cách cung cấp các giá trị của riêng bạn cho trường “_id” nếu được yêu cầu

Chúng ta có thể thêm nhiều bản ghi cùng một lúc bằng cách sử dụng hàm insert_many

patient_records = [
{
"Name": "Adam Blythe",
"Age": 55,
"Sex": "M",
"Blood pressure": [{"sys": 132}, {"dia": 73}],
"Heart rate": 73
},
{
"Name": "Darren Sanders",
"Age": 34,
"Sex": "M",
"Blood pressure": [{"sys": 120}, {"dia": 70}],
"Heart rate": 67
},
{
"Name": "Sally-Ann Joyce",
"Age": 19,
"Sex": "F",
"Blood pressure": [{"sys": 121}, {"dia": 72}],
"Heart rate": 67
}
]
my_collection.insert_many(patient_records)
Đang cập nhật dữ liệu

Chúng tôi cũng có thể muốn cập nhật dữ liệu mà trước đây chúng tôi đã thêm vào bộ sưu tập. Một lần nữa, chúng tôi có thể cập nhật một hoặc nhiều bản ghi. Giả sử chúng ta vô tình thêm cùng một nhịp tim cho Darren Sanders và Sally-Ann Joyce. Darren's được cho là 88. Tại đây, chúng tôi có thể sử dụng hàm update_one chuyển vào trường mà chúng tôi muốn cập nhật để tìm kiếm cặp khóa/giá trị “tên” và “Darren Sanders”, sau đó chúng tôi sử dụng tùy chọn $set (đứng trước ký hiệu đô la) chỉ định khóa (nhịp tim . Điều này sẽ ghi đè giá trị ban đầu bằng giá trị mới

import pymongo
0

Như bạn đã thấy, chúng ta có thể lồng nhiều lớp đối tượng và mảng vào nhau để nhúng dữ liệu. Một tùy chọn khác là tách dữ liệu trong một bộ sưu tập riêng biệt và liên kết với nó. Chúng tôi sẽ xem xét cả nhúng và liên kết cũng như các câu hỏi để giúp bạn xác định cái nào là tốt nhất để sử dụng

Nhúng hoặc liên kết dữ liệu

Chúng ta có thể lồng dữ liệu bằng cách nhúng nó. Hãy xem xét rằng chúng tôi muốn lưu trữ một số kết quả xét nghiệm y tế cho bệnh nhân. Điều này có thể bao gồm một số kết quả xét nghiệm máu và hình ảnh Điện tâm đồ/Điện tâm đồ cho một số cuộc điều tra về cơn đau tim và một số xét nghiệm máu, bao gồm

  • Creatine Kinase (CK)
  • Troponin I (TROP)
  • Aspartate aminotransferase (AST)

Chúng ta có thể bắt đầu bằng cách tạo một trường có tên là “kết quả kiểm tra” chứa một mảng

import pymongo
1

Bên trong mảng này, chúng ta có thể lưu trữ các đối tượng cho ECG (đường dẫn đến tệp hình ảnh) và một mảng khác để lưu trữ kết quả sinh hóa

import pymongo
2

Cuối cùng, chúng ta có thể thêm kết quả máu dưới dạng cặp khóa/giá trị

import pymongo
3

Chúng ta có thể viết những điều này trên cùng một dòng như đã làm với huyết áp hoặc trên các dòng riêng biệt để dễ đọc

Thay vào đó, một cách khác để nhúng dữ liệu theo cách này là liên kết với nó. Liên kết dữ liệu còn được gọi là tham chiếu. Điều này liên quan đến việc lưu trữ dữ liệu trong một bộ sưu tập khác và tham chiếu nó theo id. Việc quyết định có liên kết hoặc nhúng dữ liệu hay không phụ thuộc vào một số cân nhắc nhất định, chẳng hạn như

  • Tần suất bạn cần truy cập thông tin được nhúng?
  • Dữ liệu có được truy vấn bằng thông tin được nhúng không?
  • Dữ liệu được nhúng có thay đổi thường xuyên không?
  • Tần suất bạn cần truy cập vào dữ liệu được nhúng mà không có thông tin khác mà dữ liệu được nhúng vào là bao lâu?

Tùy thuộc vào câu trả lời cho những câu hỏi này, thay vào đó, bạn có thể muốn liên kết đến dữ liệu. Xem xét ví dụ sau. Bạn có thể muốn lưu trữ một số thông tin về những loại thuốc đã được kê đơn cho một bệnh nhân nhất định. Bạn có thể nhúng thông tin này, nhưng nếu bạn cũng muốn lưu trữ thêm thông tin chung chung về thuốc thì sao?. Ở đây bạn có thể có một bộ sưu tập riêng với những thông tin như vậy mà bạn có thể liên kết đến

import pymongo
4

Chúng ta có thể sử dụng id và hàm DBRef để tham chiếu dữ liệu này trong một bộ sưu tập khác. Ví dụ

import pymongo
5Truy vấn dữ liệu

Có một số phương pháp để truy vấn dữ liệu. Tất cả các phương thức đều sử dụng hàm find(). Một truy vấn có thể được cung cấp theo sau là trường hoặc các trường bạn muốn trả về trong biểu mẫu

import pymongo
6

Để tìm một mục duy nhất, ví dụ bệnh nhân có tên “Darren Sanders”, chúng ta có thể sử dụng chức năng tìm và in mục đầu tiên trong danh sách

import pymongo
7

Chúng tôi cũng có thể sử dụng một vòng lặp để xuất kết quả. Chúng tôi cũng có thể lưu trữ truy vấn trong một biến riêng biệt mà trước tiên chúng tôi chuyển vào hàm tìm kiếm. Điều này hữu ích khi truy vấn có thể phức tạp vì nó giúp dễ đọc mã

import pymongo
8

Cuối cùng, nếu chúng ta chỉ muốn một kết quả duy nhất, chúng ta có thể sử dụng hàm find_one()

import pymongo
9

Một điều phổ biến cần làm với cơ sở dữ liệu là truy vấn một tập hợp con dữ liệu tùy thuộc vào tiêu chí nhất định. Chúng ta có thể sử dụng các toán tử so sánh để truy xuất các tập hợp con của dữ liệu. Ví dụ: chúng ta có thể sử dụng toán tử lớn hơn ($gt) để tìm kiếm tất cả tên bệnh nhân có nhịp tim > 70 nhịp mỗi phút

client = pymongo.MongoClient(“mongodb://localhost:27017/”)
0

Có nhiều toán tử so sánh như vậy có sẵn, bao gồm

(Ảnh của tác giả)

Chức năng này có thể được tăng cường hơn nữa bằng cách sử dụng các toán tử logic. Ví dụ: chúng tôi có thể tìm kiếm những bệnh nhân có nhịp tim < 70 nhịp mỗi phút và những người trên 20 tuổi

client = pymongo.MongoClient(“mongodb://localhost:27017/”)
1

Toán tử logic bao gồm

(Ảnh của tác giả)

Bạn có thể thắc mắc làm thế nào chúng tôi tìm thấy dữ liệu chứa trong mảng. Điều này có thể được thực hiện bằng cách sử dụng dấu chấm (dấu chấm). Ví dụ, bạn có thể nhớ lại rằng chúng tôi đã lưu trữ huyết áp tâm thu và tâm trương của bệnh nhân như sau

client = pymongo.MongoClient(“mongodb://localhost:27017/”)
2

Chúng tôi có thể truy vấn bệnh nhân có huyết áp tâm thu (sys) dưới 140 mmHG (mm thủy ngân) như sau

client = pymongo.MongoClient(“mongodb://localhost:27017/”)
3

Lưu ý rằng chúng tôi tham chiếu khóa "huyết áp" thêm dấu chấm (dấu chấm) và sau đó là khóa bên trong mảng, ví dụ: sys cho tâm thu

Làm việc với dữ liệu hiện có

Một trong những điều tuyệt vời về MongoDB là nó thực sự dễ dàng tải các tệp JSON và thêm chúng vào các bộ sưu tập. Ví dụ: nếu chúng tôi có một số dữ liệu JSON được lưu trữ trong tệp JSON, chúng tôi có thể sử dụng thư viện json để đọc dữ liệu này và thêm nó vào bộ sưu tập MongoDB

client = pymongo.MongoClient(“mongodb://localhost:27017/”)
4

Bạn sẽ không muốn xuất toàn bộ nội dung của cơ sở dữ liệu với hàng trăm nghìn tài liệu. Để xem tệp và xem cấu trúc của dữ liệu, thay vào đó, bạn có thể xuất n tài liệu đầu tiên. Ví dụ 10 tài liệu đầu tiên. Điều này có thể đạt được bằng cách sử dụng hàm limit()

client = pymongo.MongoClient(“mongodb://localhost:27017/”)
5

Để kiểm tra số lượng tài liệu trong một bộ sưu tập, chúng ta có thể sử dụng hàm count_documents như vậy

client = pymongo.MongoClient(“mongodb://localhost:27017/”)
6

Một lần nữa, chúng tôi có thể thêm một truy vấn ở đây để đếm tất cả các tài liệu đáp ứng một số tiêu chí quan tâm

tổng hợp

Thông thường, khi làm việc với dữ liệu, chúng tôi không chỉ muốn trích xuất các tập hợp con dữ liệu bằng truy vấn, thay vào đó, chúng tôi muốn tạo thông tin mới từ dữ liệu hiện có. Điều này thường liên quan đến việc thực hiện các phép tính khác nhau như tìm giá trị trung bình hoặc tổng của một số giá trị. Ví dụ tiền lương trung bình của nhân viên

Hãy xem một ví dụ ngắn gọn bằng cách sử dụng tập dữ liệu mẫu chứa thông tin chi tiết về dữ liệu nhà hàng (có thể tìm thấy dữ liệu tại đây. https. // tài liệu. bản đồ. mongodb. com/sample-data/available-sample-datasets/)

Một tài liệu ví dụ có thể được nhìn thấy dưới đây

(Ảnh của tác giả)

Bạn có thể xem chi tiết về địa chỉ nhà hàng, quận của nó, loại món ăn, tên, id và chi tiết về điểm được trao với điểm số liên quan. Giả sử chúng ta muốn tính điểm trung bình của các nhà hàng. Để đạt được điều này, chúng ta có thể sử dụng hàm tổng hợp

client = pymongo.MongoClient(“mongodb://localhost:27017/”)
7

Chúng tôi chuyển một mảng cho hàm tổng hợp. Tham số $unwind được sử dụng để giải cấu trúc mảng điểm để xuất tài liệu cho từng phần tử. Tiếp theo, chúng tôi sử dụng tham số $match bao gồm mọi thứ (bằng cách sử dụng dấu ngoặc nhọn mở và đóng). Chúng tôi có thể lọc thêm ở đây bằng cách cung cấp các tiêu chí bổ sung. Tiếp theo, chúng tôi sử dụng tham số $group để nhóm dữ liệu mà chúng tôi muốn áp dụng tính toán cho. Cuối cùng, chúng tôi tạo khóa mới gọi là “Điểm trung bình” và áp dụng tham số $avg (trung bình) cho các điểm tham chiếu điểm theo sau là dấu chấm và khóa điểm

Tạo đầu ra sau (rút ngắn cho ngắn gọn)

client = pymongo.MongoClient(“mongodb://localhost:27017/”)
8

Có nhiều tham số khác có thể được sử dụng cho các tính toán phổ biến như $sum, $min, $max, v.v.

Chúng tôi cũng có thể thêm chức năng bổ sung theo yêu cầu. Ví dụ: chúng tôi có thể muốn sắp xếp trả về theo thứ tự tăng dần hoặc giảm dần. Chúng ta có thể chỉ cần thêm một dòng khác với tham số sắp xếp chỉ định trường nào sẽ sắp xếp theo. 1 (tăng dần) hoặc -1 (giảm dần)

client = pymongo.MongoClient(“mongodb://localhost:27017/”)
9

Một tùy chọn khác để sắp xếp mà không sử dụng hàm tổng hợp là sử dụng hàm sắp xếp chuyển trực tiếp vào tên trường, ví dụ: sắp xếp theo tên

db = client[“med_data”]
0

Chúng ta có thể chọn tăng dần/giảm dần bằng cách thêm 1 hoặc -1 sau trường để sắp xếp

db = client[“med_data”]
1

Sử dụng MongoDB trong các dự án phần mềm và khoa học dữ liệu

Một trong những ưu điểm chính của MongoDB khi sử dụng định dạng JSON là khả năng tương tác mà định dạng này cung cấp với các ngôn ngữ lập trình sử dụng định dạng tương tự. Điều này giúp làm việc với dữ liệu trong ứng dụng và lưu trữ/truy xuất dữ liệu từ cơ sở dữ liệu gần như liền mạch

Một cách tốt hơn để tích hợp cơ sở dữ liệu vào mã là sử dụng một phương pháp như Ánh xạ quan hệ đối tượng (ORM) hoặc trong trường hợp của MongoDB là Trình ánh xạ tài liệu đối tượng (ODM). Điều này hoạt động bằng cách dịch mã Python (hoặc một số ngôn ngữ khác) thành các câu lệnh MongoDB để truy xuất dữ liệu. Dữ liệu này sau đó được chuyển trở lại vào các đối tượng Python. Điều này có lợi thế là đảm bảo rằng bạn chỉ cần sử dụng một ngôn ngữ (e. g. Python) để truy cập và sử dụng cơ sở dữ liệu

(Ảnh của tác giả)

Một thư viện tốt để làm điều này là mongoengine. Ở đây chúng tôi nhập thư viện và kết nối với ứng dụng khách Mongodb mà chúng tôi sẽ gọi là bệnh nhân odm

db = client[“med_data”]
2

Ví dụ sau đây cho thấy cách chúng ta có thể tạo một lớp Python để mô hình hóa một số dữ liệu, tạo một vài phiên bản của lớp đó và ghi lớp này vào cơ sở dữ liệu. Tiếp theo ví dụ trước chúng ta sẽ tạo một lớp để lưu trữ dữ liệu về bệnh nhân

db = client[“med_data”]
3

Chúng ta có thể sử dụng một lớp Python để tạo một đối tượng để thao tác với cơ sở dữ liệu. Ở đây chúng tôi tạo các mục dữ liệu bằng cách chỉ định loại trường nào. Ví dụ: dữ liệu văn bản/chuỗi có thể được tạo bằng hàm StringField() và số nguyên với IntField(). Các tham số bổ sung cũng có thể được thêm vào, chẳng hạn như số lượng ký tự trong một chuỗi và nếu một trường không thể rỗng/trống

Bây giờ chúng ta có thể tạo các thể hiện của lớp này theo cách tiêu chuẩn trong Python. Ở đây chúng ta có thể tạo một vài bệnh nhân tên là Maxine và Hamza. Lưu ý rằng chúng ta thêm hàm save() vào cuối dòng để ghi dữ liệu này vào cơ sở dữ liệu

db = client[“med_data”]
4

Chúng ta có thể xuất các đối tượng này bằng một vòng lặp. Để truy cập các trường cụ thể, chúng tôi có thể sử dụng trình vòng lặp, dấu chấm và sau đó là trường chúng tôi muốn xuất. Ví dụ: tên, id và tuổi của bệnh nhân

db = client[“med_data”]
5

Cái nào tạo ra đầu ra sau

db = client[“med_data”]
6

Ngoài việc tích hợp cơ sở dữ liệu Mongo vào các dự án phần mềm, chúng ta cũng có thể sử dụng cơ sở dữ liệu này cho các nhiệm vụ nghiên cứu/phân tích dữ liệu và khoa học dữ liệu. Có một cách dễ dàng để chuyển đổi dữ liệu từ cơ sở dữ liệu Mongo thành dạng bảng dưới dạng đối tượng khung dữ liệu của Panda. Đầu tiên chúng tôi nhập thư viện gấu trúc

db = client[“med_data”]
7

Tiếp theo, chúng tôi chọn dữ liệu cần thiết bằng truy vấn tiêu chuẩn, ví dụ: chúng tôi sẽ truy xuất tất cả tên của các tiệm bánh ở Bronx. Tiếp theo, chúng tôi chuyển đổi kết quả thành cấu trúc dữ liệu danh sách

db = client[“med_data”]
8

Cuối cùng, chúng tôi tạo một khung dữ liệu bằng hàm from_dict để chuyển đổi từ điển thành khung dữ liệu dạng bảng

db = client[“med_data”]
9

Điều này tạo ra đầu ra sau

(Ảnh của tác giả)

Tóm lại, MongoDB là một cơ sở dữ liệu mạnh mẽ và có khả năng mở rộng, rất hữu ích khi lược đồ dữ liệu dễ bị thay đổi thường xuyên. Điều này cho phép tích hợp với các hệ thống phần mềm hiện đại một cách dễ dàng và cũng có thể được sử dụng như một phần của quy trình phân tích dữ liệu khi phân tích dữ liệu ở định dạng JSON, chẳng hạn như một số dữ liệu ứng dụng di động hoặc dữ liệu Twitter. MongoDB là một trong những cơ sở dữ liệu NoSQL phổ biến nhất và nhận thức về nó là gì và cách thức hoạt động của nó là điều bắt buộc đối với các kỹ sư phần mềm và nhà khoa học dữ liệu

Python lưu trữ dữ liệu trong MongoDB như thế nào?

Để chèn một bản ghi hoặc tài liệu như cách gọi của nó trong MongoDB, vào một bộ sưu tập, chúng ta sử dụng phương thức insert_one() . Tham số đầu tiên của phương thức insert_one() là một từ điển chứa (các) tên và (các) giá trị của từng trường trong tài liệu mà bạn muốn chèn.

Chúng tôi có thể lưu trữ dữ liệu trong MongoDB không?

Công cụ lưu trữ là thành phần chính của MongoDB chịu trách nhiệm quản lý dữ liệu . MongoDB cung cấp nhiều công cụ lưu trữ, cho phép bạn chọn một công cụ phù hợp nhất với ứng dụng của mình.

Bạn có thể sử dụng Python cho MongoDB không?

Python có thể được sử dụng trong các ứng dụng cơ sở dữ liệu . Một trong những cơ sở dữ liệu NoSQL phổ biến nhất là MongoDB.

MongoDB có thể lưu trữ các đối tượng Python không?

Giới thiệu về MongoDB với PyMongo . Ký hiệu đối tượng JavaScript (JSON) mà nó hỗ trợ rất phù hợp để làm việc với các đối tượng trong các ngôn ngữ lập trình hiện đại như JavaScript, Python và các ngôn ngữ khác .