Trình tự đồng thuận trong python

Tạo ra một chuỗi đồng thuận chức năng là một nhiệm vụ tin sinh học sơ bộ, là một điều cần thiết cho nhiều mục đích nghiên cứu. Tuy nhiên, sự tồn tại của các vùng siêu biến trong tệp căn chỉnh nhiều trình tự đầu vào gây ra sự phức tạp trong việc tạo trình tự đồng thuận hữu ích. Các phương pháp hiện tại để tạo sự đồng thuận, Ngưỡng và thuật toán đa số, có một số vấn đề, loại trừ chúng dưới dạng thuật toán áp dụng cho các cụm trình tự biến đổi cao như vậy. Do đó, chúng tôi đã thiết kế một thuật toán thay thế mới cho cùng một mục đích. Thuật toán được giải thích bằng cả công thức toán học và triển khai thực tế bằng ngôn ngữ lập trình Python. Một bộ trình tự từ protein HCV genotype 1b E2 đã được sử dụng làm ví dụ thực tế để đánh giá hiệu suất của thuật toán. Một số thử nghiệm in silico đã được thực hiện trên chuỗi đầu ra và kết quả đã được so sánh với kết quả từ các thuật toán khác. Phân tích ánh xạ epitope chỉ ra chức năng của thuật toán này, bằng cách bảo tồn dư lượng điểm nóng trong trình tự đồng thuận và chỉ số tính kháng nguyên cho thấy tính kháng nguyên đáng kể của trình tự đồng thuận. Hơn nữa, phân tích phát sinh loài cho thấy không có thay đổi đáng kể nào trong vị trí của trình tự đồng thuận mới trên cây phát sinh gen so với các thuật toán khác. Cách tiếp cận này sẽ có một số ý nghĩa trong việc thiết kế một loại vắc-xin mới cho các loại vi-rút có khả năng biến đổi cao như vi-rút HIV-1, Cúm và Viêm gan C (HCV)

Giới thiệu

Tìm một trình tự trung bình, đồng thuận, bằng cách tính toán các gốc thường xuyên nhất ở mỗi vị trí, cho cả axit nucleic và trình tự polypeptide, là một nhiệm vụ tin sinh học phổ biến(1). Tìm các họa tiết cấu trúc chung giữa trình tự DNA và protein(2,3), thiết kế một bộ mồi sẽ gắn vào một bộ trình tự nucleotide(4) hoặc xác định các điểm nóng cho tương tác kháng thể-epitop trong một bộ trình tự liên quan đến . Nhưng lý do chính để tạo ra trình tự đồng thuận là giảm thiểu khoảng cách di truyền của các vùng có khả năng biến đổi cao hoặc siêu biến đổi của trình tự nucleotide hoặc polypeptide, có mức độ không đồng nhất cao nhất trong số các trình tự liên quan (5–9). Trong nhiều trường hợp, tính biến đổi của các vùng này là một lợi thế tiến hóa cho trình tự chứa chúng. Tuy nhiên, nếu trình tự đó nằm trong các protein chiếm ưu thế miễn dịch của mầm bệnh, thì đó sẽ là một trở ngại lớn cho việc thiết kế vắc-xin có độ bao phủ rộng hiệu quả chống lại hầu hết các chủng của mầm bệnh đó. Vì vậy, các trình tự đồng thuận được sử dụng để khắc phục sự đa dạng di truyền của các trình tự biến đổi. Cuối cùng, một số gói phần mềm tin sinh học khác nhau đã được thiết kế để tạo ra một chuỗi đồng thuận từ một tập hợp các chuỗi đầu vào. Hầu hết các gói phần mềm này sử dụng phương pháp lựa chọn dựa trên Đa số hoặc Ngưỡng (10–12) làm thuật toán cơ bản của chúng. Trong phương pháp dựa trên ngưỡng, thuật toán chọn phần dư có tần suất cao hơn ngưỡng đã chọn của người dùng trong khi phương pháp lựa chọn đa số chọn phần dư phổ biến nhất ở mỗi vị trí bất kể ngưỡng được chỉ định nào. Mặc dù hai thuật toán này đã được sử dụng hiệu quả trong nhiều ứng dụng, nhưng độ chính xác lựa chọn của chúng đối với các cụm trình tự biến đổi cao vẫn còn gây tranh cãi. Ví dụ: tính cứng nhắc của thuật toán lựa chọn dựa trên ngưỡng trên một điểm ngưỡng cụ thể có thể dẫn đến việc bỏ qua một số dư lượng có tần số rất gần, nhưng thấp hơn một chút so với ngưỡng đã chọn. Ngoài ra, các chuỗi đồng thuận được tạo thông qua thuật toán dựa trên ngưỡng có thể không có chức năng sử dụng do các khoảng trống được tạo trong phần dư có tần số thấp hơn ngưỡng đã chọn. Chọn lọc dựa trên đa số cũng có một số nhược điểm như chọn lọc hoàn toàn dựa trên sự khác biệt về tần số mà không xem xét trọng lượng quần thể và tạo ra một polypeptide với các dạng cấu trúc và chức năng rất khác nhau

Vì vậy, cần phải thiết kế một thuật toán mới giải quyết các vấn đề của phương pháp dựa trên ngưỡng bằng cách sử dụng tính linh hoạt của thuật toán lựa chọn đa số và mang lại độ tin cậy cho quá trình lựa chọn bằng cách đưa vào lựa chọn tự nhiên và mức độ ưu tiên tự nhiên của từng dư lượng trong một . Thuật toán đưa ra thước đo định lượng về mức độ phù hợp của dư lượng axit amin đối với vị trí tương ứng của nó. Ngoài ra, một cụm trình tự biến đổi từ glycoprotein E2 của Virus viêm gan C, trình tự protein của phân nhóm 1b từ kiểu gen 1, đã được xem xét để đánh giá độ chính xác của thuật toán mới. Việc so sánh thuật toán mới với các thuật toán đồng thuận trước đó cũng đã được nghiên cứu

phương pháp

1 Điểm Thể lực

Cơ sở của thuật toán mới này là tính toán điểm phù hợp cho từng dư lượng ở một vị trí và chọn dư lượng phù hợp nhất cho vị trí đó. Quy trình sẽ được giải thích cho một vị trí và nó có thể được lặp lại cho các vị trí còn lại với bất kỳ độ dài trình tự nào

Điểm thích nghi được tính bằng cách coi mỗi dư lượng là ứng cử viên có thể cho vị trí đó và sau đó tính toán xu hướng chọn lọc tự nhiên để giữ axit amin đó ở vị trí đó. Xu hướng này là một chức năng của tần số dư lượng và điểm số thay thế của nó, sẽ được lấy từ BLOSUM (Ma trận thay thế khối). BLOSUM, ma trận thay thế axit amin, chứa mọi cặp axit amin có thể có với thước đo định lượng về khả năng thay thế của chúng. Ngoài ra, dựa trên khoảng cách tiến hóa của các chuỗi đầu vào, ma trận phù hợp nhất sẽ được chọn, ví dụ: BLOSUM 30 cho các chuỗi rất xa và BLOSUM 80 cho các chuỗi rất gần. Thuật toán nhân mỗi điểm cặp thay thế có thể có, bao gồm cả sự thay thế của axit amin với chính nó, với tần số của axit amin cơ bản. Sau đó, tổng điểm thể lực sẽ được tính bằng cách cộng điểm tương ứng của từng dư lượng. Cuối cùng, phần còn lại có điểm số phù hợp cao nhất sẽ được chọn

Quá trình cho một vị trí tưởng tượng sẽ như sau

  1. Ma trận BLOSUM62 sẽ được chọn để thuận tiện nhưng có thể sử dụng BLOSUM 30, 45, 60 và 80

  2. Vị trí này có bốn gốc axit amin khác nhau theo các trình tự khác nhau, bao gồm 'G', 'W', 'T' và 'A'

  3. Tần số xuất hiện của mỗi dư là. 'G'. 0. 142, ‘W’. 0. 142, ‘T’. 0. 428, ‘A’. 0. 285

  4. Một bảng sẽ được tạo bằng cách sử dụng tên chữ cái làm tên hàng và tên cột. Bằng cách đó, mỗi ô của bảng này sẽ là một cặp kết hợp có thể có bao gồm cả các cặp tự (Hình 1-A)

  5. Điểm thay thế của mỗi cặp sẽ được lấy từ ma trận BLOSUM62 và được đặt vào (các) ô tương ứng của nó, một ô dành cho các cặp tự ghép theo đường chéo và hai ô dành cho các cặp khác (Hình 1-B)

  6. Tần suất của dư lượng của mỗi hàng sẽ được nhân với điểm thay thế tương ứng trong hàng đó. Ví dụ, số 0. 14 tần số của dư lượng G sẽ được nhân lên trong mỗi ô trong hàng đó (Hình 1-C)

  7. Tính tổng điểm phù hợp cho mỗi axit amin trong mỗi cột bằng cách cộng các ô tương ứng của cột đó lại với nhau (Hình 1-D)

  8. Phần còn lại có điểm phù hợp cao nhất sẽ được chọn làm đại diện cho vị trí đó trong chuỗi đồng thuận cuối cùng

Trình tự đồng thuận trong python
Trình tự đồng thuận trong python

  • Tải xuống hình
  • Mở ra trong trang mới

Hình 1

A. cái bàn trống - B. mỗi ô chứa điểm thay thế tương ứng của cặp hàng và cột của nó - C. mỗi ô trong một hàng đã được nhân với tần số của tên hàng tương ứng - D. cột cuối cùng chứa tổng điểm của từng cột, điểm thể lực tối đa và tên cột tương ứng đã được tô sáng

Quy trình trên là một lời giải thích chi tiết để thực hiện thuật toán này bằng ngôn ngữ lập trình. Tuy nhiên, điểm thích nghi cho mỗi dư lượng có thể được tính theo công thức sau.

Trình tự đồng thuận trong python
Trình tự đồng thuận trong python

phương trình 1. F. chức năng điểm thể lực, R. dư lượng mục tiêu, f. hàm tần số, r. mỗi dư lượng bao gồm chính mục tiêu, R −> r. thay thế phần dư 'R' hoặc mục tiêu bằng phần dư 'r'

Đường ống tạo sự đồng thuận

Giả định cơ bản của thuật toán phù hợp là lấy một tập hợp trình tự được căn chỉnh, tệp căn chỉnh nhiều trình tự (MSA), làm đầu vào của nó. Tệp MSA phải ở định dạng quen thuộc để cho phép thuật toán trích xuất thông tin cần thiết, bao gồm độ dài chuỗi, tần suất của từng phần dư ở bất kỳ vị trí cụ thể nào và danh sách các phần dư hiện có ở mỗi vị trí. Do đó, để tạo một đường ống nhất quán, phần căn chỉnh cũng được thêm vào thuật toán cơ sở để làm cho nó mạnh mẽ và đáng tin cậy hơn. Gói MAFFT căn chỉnh python được sử dụng làm công cụ căn chỉnh cơ bản vì đây là thuật toán căn chỉnh linh hoạt nhất với một số tùy chọn có thể thay đổi, có thể có hiệu quả trong kết quả của chức năng thuật toán thể dục. Một trong những tùy chọn quan trọng nhất của thuật toán MAFFT là khả năng thay đổi ma trận thay thế đang được sử dụng để sắp xếp tập hợp trình tự đã cho. Ma trận thay thế trong thuật toán MAFFT, có thể được chọn dựa trên khoảng cách tiến hóa giữa các chuỗi đầu vào, bao gồm BLOSUM30, BLOSUM45, BLOSUM 62, BLOSUM80 và các ma trận tính điểm khác. Ma trận đã chọn có thể giống hoặc khác với ma trận đang được sử dụng trong quy trình tính toán mức độ phù hợp, điều này sẽ tăng thêm tính linh hoạt cho quy trình cuối cùng

Quy trình tạo đồng thuận bao gồm các bước tiền xử lý, các bước tính điểm và xuất chuỗi đồng thuận đã được triển khai bằng ngôn ngữ lập trình python. Tất cả các bước cần thiết trong quy trình được tóm tắt ở định dạng lưu đồ (Hình 2)

Trình tự đồng thuận trong python
Trình tự đồng thuận trong python

  • Tải xuống hình
  • Mở ra trong trang mới

Hình 2

Việc triển khai quy trình tạo đồng thuận đã được mô tả ở định dạng lưu đồ

2 Tạo trình tự đồng thuận cho cụm vi rút viêm gan C (HCV) E2-1b

Hơn 400 trình tự HCV-E2-G1b đã được truy xuất từ ​​Cơ sở dữ liệu về mầm bệnh vi-rút và Tài nguyên phân tích (ViPR)1. Tập hợp trình tự đã truy xuất được căn chỉnh bằng thuật toán MAFFT2 (13) và trải qua quá trình tạo đồng thuận bằng ba thuật toán. Bàn làm việc bộ gen CLC 5. 53 được sử dụng để tạo ra sáu chuỗi đồng thuận dựa trên thuật toán ngưỡng (50-100%) và một chuỗi đồng thuận dựa trên thuật toán Đa số. Thuật toán thể dục cũng được áp dụng riêng để tạo ra một chuỗi đồng thuận mới

3 Phân tích cây phát sinh loài

Áp dụng phần mềm iqtree4(14), khoảng cách phát sinh loài của các trình tự đồng thuận đã được tính toán với cả hai giá trị hỗ trợ SH-aLRT và UFBoot. Cây phát sinh gen được kết xuất bằng phần mềm FigTree5

4 Dư lượng quan trọng liên kết với thụ thể và kháng thể

Các gốc cần thiết cho tương tác kháng nguyên-kháng thể và cả các gốc liên quan đến vị trí gắn thụ thể được xem xét để đánh giá độ chính xác của thuật toán trong việc bảo tồn các gốc quan trọng. Cuối cùng, một kháng thể trung hòa có tên (AP33) (15,16) nhắm vào epitope tuyến tính và hai kháng thể trung hòa có tên (1. 7), nhắm vào cùng các gốc cũng cần thiết cho sự gắn kết với thụ thể CD81, (17–19) và (HC-84. 1)(20) các văn bia hình dạng nhắm mục tiêu đã được nghiên cứu

5 Dự đoán tính kháng nguyên

Hiệu lực của trình tự đồng thuận để trở thành một kháng nguyên đã được thử nghiệm thông qua các máy chủ Vaxijen (Dự đoán kháng nguyên bảo vệ và vắc xin tiểu đơn vị)6 và AntigenPro7

6 Dự đoán vị trí N-glycosyl hóa trong protein E2

Để xác định mối liên hệ của chúng với quá trình trung hòa virus, các vị trí N-glycosyl hóa trong protein E2 đã được dự đoán bằng NetNGlyc Server 1. 08

Kết quả

1 Sắp xếp các trình tự đồng thuận

Biểu diễn liên kết của các axit amin của tất cả các trình tự đồng thuận được minh họa trong Hình 3. Ấn tượng đầu tiên về minh họa này cho thấy sự yếu kém và không thể áp dụng của thuật toán ngưỡng. Số lượng axit amin không xác định trong các trình tự đồng thuận dựa trên ngưỡng là quá nhiều để tạo ra bất kỳ trình tự có thể áp dụng nào, điều này có thể dẫn đến một văn bia chức năng. Mặc dù cả thuật toán Đa số và thuật toán phù hợp, có tên là G1b Blusom62 trong hình 3, đều tạo ra các chuỗi hoạt động, kết quả đầu ra của chúng khác nhau đáng kể, đây là dấu hiệu cho thấy phương pháp tạo đồng thuận khác nhau trong thuật toán phù hợp

Trình tự đồng thuận trong python
Trình tự đồng thuận trong python

  • Tải xuống hình
  • Mở ra trong trang mới

Hình 3

So sánh trình tự đồng thuận được tạo ra từ hơn 400 trình tự HCV-E2-G1b thông qua các thuật toán khác nhau. X. axit amin không xác định, Con-Seq dựa trên Blosum. Thuật toán thể dục, Con-Seq dựa trên đa số. Thuật toán đa số, Con-Seq dựa trên ngưỡng. Thuật toán ngưỡng

Trình tự đồng thuận trong python
Trình tự đồng thuận trong python

  • Tải xuống hình
  • Mở ra trong trang mới

hinh 4

cây phát sinh loài. Cây phát sinh gen không có gốc được suy ra từ trình tự axit amin E2 và trình tự đồng thuận được tạo ra dựa trên ba thuật toán. Các trình tự được sắp xếp theo thuật toán MAFFT và iqtree đã được sử dụng để xây dựng cây phát sinh loài

Hình 3 cho thấy sự so sánh định tính giữa thuật toán thể dục và các thuật toán khác. Mặc dù không thể xác định hiệu quả của một thuật toán mà không sử dụng đầu ra của nó trong một số quy trình tiếp theo, thử nghiệm in vitro và in vivo, nhưng thực tế là kết quả của nó cho thấy sự khác biệt đáng kể so với các thuật toán trước đó có thể đủ thuyết phục để nghiên cứu thêm

2 So sánh cây phát sinh loài

Khoảng cách giữa các trình tự đồng thuận được tạo thông qua các thuật toán khác nhau trên cây Phylogenetic dường như không đáng kể. Kết quả này ngụ ý rằng thuật toán phù hợp không thay đổi đáng kể vị trí của sự đồng thuận trên cây mặc dù nó tạo ra một chuỗi khác. Trình tự đồng thuận Ngưỡng 100% có quá nhiều lỗ hổng và nó không thể tính toán khoảng cách phát sinh loài trong phần mềm iqtree và do đó nó không được trình bày trong cây phát sinh loài

3 Dư lượng được bảo tồn Khả năng bảo quản

Như được minh họa trong Hình 5, không có thay đổi nào xảy ra trong các gốc quan trọng chịu trách nhiệm cho sự tương tác giữa kháng nguyên và ba kháng thể trung hòa được chọn trong nghiên cứu này (Hình 5). Thông thường, các dư lượng này được bảo tồn trong chuỗi protein và kết quả này cho thấy các thuật toán thể dục bảo tồn chuỗi các vùng được bảo tồn

Trình tự đồng thuận trong python
Trình tự đồng thuận trong python

  • Tải xuống hình
  • Mở ra trong trang mới

Hình 5

Dư lượng được bảo tồn – Mũi tên chỉ ra dư lượng liên quan đến tương tác kháng thể-epitope

4 Đánh giá tính kháng nguyên

Dữ liệu thu được từ các máy chủ trực tuyến (Vaxijen và AntigenPro) được chỉ ra rằng chỉ số tính kháng nguyên của trình tự đồng thuận cao hơn ngưỡng mà các máy chủ xem xét (bảng 1). Kết quả này cũng cho thấy rằng thuật toán phù hợp có điểm kháng nguyên rất gần với Ngưỡng G1b 90% trong cả hai thử nghiệm này

Xem bảng này

  • Xem nội tuyến
  • xem cửa sổ bật lên
  • Tải xuống powerpoint

Bảng 1

Tính kháng nguyên của tất cả các trình tự đồng thuận được dự đoán bởi Vaxijen và AntigenPro. Ngưỡng vaxijen là 0. 4 và ngưỡng AntigenPro là 0. 5. *. không kháng nguyên

*. Chuỗi đồng thuận được tạo từ ba thuật toán

5 vị trí N-glycosyl hóa dự đoán

Máy chủ NetNGlyc đã được áp dụng để dự đoán các trang web theo sửa đổi N-glycosyl hóa. Số lượng vị trí glycosyl hóa trên protein E2 nằm trong khoảng 9-11 vị trí. Tất cả các thuật toán, ngoại trừ Ngưỡng 100%, bảo tồn ít nhất 9 trang web. Tuy nhiên, thuật toán phù hợp bảo toàn tất cả 11 vị trí glycosyl hóa được báo cáo bao gồm cả vị trí E2N5 có độ biến thiên cao hơn trong trình tự 1b(21). Do đó, kết quả thuật toán phù hợp sẽ lưu các vị trí glycosyl hóa tự nhiên nhất có thể của protein này. (Hình 6)

Trình tự đồng thuận trong python
Trình tự đồng thuận trong python

  • Tải xuống hình
  • Mở ra trong trang mới

Hình 6

Các vị trí của N-glycosyl hóa đã được hiển thị trong tất cả các trình tự đồng thuận được tạo từ ba thuật toán. Một. G1b hoa62. b. Đa số G1b. C. Ngưỡng G1b 50%. Đ. Ngưỡng G1b60%. e. Ngưỡng G1b 70%. F. Ngưỡng G1b 80%. g. Ngưỡng G1b 90%. h. Ngưỡng G1b 100%

Thảo luận

Trong nghiên cứu hiện tại, một thuật toán tạo đồng thuận cải tiến mới, thuật toán phù hợp, đã được giới thiệu, hiệu quả và sự khác biệt của nó so với các phương pháp trước đây đã được chứng minh, sử dụng trình tự HCV E2 phân nhóm 1b biến đổi làm ví dụ

tạo ra một chuỗi chính tắc trung gian, bảo tồn các tính năng của các vùng biến ban đầu là một thách thức mà các thuật toán tạo đồng thuận hiện tại, Ngưỡng và Đa số, chưa thể giải quyết

Những nhược điểm của lựa chọn dựa trên ngưỡng đối với tập hợp các trình tự đa dạng như vậy như sau

  1. Ở hầu hết các vị trí, không có dư lượng với tần suất cao hơn 60%, có thể chọn bằng cách chỉ định điểm ngưỡng đáng tin cậy, thường là 60% trở lên

  2. Tính cứng nhắc của thuật toán này đối với một điểm ngưỡng cụ thể có thể dẫn đến việc bỏ qua một số dư lượng, có tần số rất gần, nhưng thấp hơn ngưỡng đã chọn, chẳng hạn như dư lượng với 59. Tần suất 9% sẽ bị bỏ qua khi chọn ngưỡng 60%

  3. Trình tự đồng thuận kết quả sẽ có nhiều vị trí khoảng cách và do đó mất thông tin, khiến trình tự đồng thuận này không hoạt động để sử dụng thực tế. Mặc dù thuật toán lựa chọn đa số không có những hạn chế đã đề cập, nhưng nó không xem xét chi phí tiến hóa của việc thay thế một dư lượng cụ thể bằng dư lượng ứng cử viên khác ở một vị trí và chỉ quan tâm đến tỷ lệ thuần tính toán dân số mẫu. Trong trường hợp hai dư lượng có tần số rất gần nhau, việc lựa chọn giữa chúng chỉ dựa trên chênh lệch tần số của chúng không thể là một cách tiếp cận đáng tin cậy vì tần số trong một tập hợp các chuỗi mẫu có thể không đại diện chính xác cho tần số thực tế trong dân số. Ví dụ: xem xét hai dư lượng một với tần số 48% và một với 47. 5%, thuật toán đa số sẽ chọn cái trước ngay cả khi tỷ lệ thực của cái sau trong dân số tự nhiên tương ứng của chúng cao hơn đáng kể

Do đó, chúng tôi đã cố gắng thiết kế một thuật toán tạo đồng thuận được tối ưu hóa và đáng tin cậy hơn cho các chuỗi biến đổi cao trong nghiên cứu này. Thuật toán mới này có các tính năng sau

  1. Quá trình lựa chọn đủ linh hoạt để lấp đầy tất cả các vị trí o, ngăn chặn các vị trí không quyết định hoặc khoảng cách và các sản phẩm chuỗi không chức năng và giải quyết vấn đề có một điểm ngưỡng tĩnh

  2. Các gốc được chọn không chỉ dựa trên tần số trong tập hợp các trình tự này mà còn bằng cách xem xét xác suất thay thế tương đối của gốc đó trong tự nhiên

Mặc dù mục đích chính của nghiên cứu là giới thiệu thuật toán mới này bằng cách sử dụng các khái niệm toán học phổ biến, một tập lệnh cũng được viết để thể hiện một phiên bản chức năng của thuật toán của chúng tôi vì lý do so sánh

Vi-rút viêm gan C (HCV) là một gánh nặng y tế lớn trên toàn cầu, lây nhiễm cho 1–2% dân số thế giới với ước tính 1. 5–2 triệu ca nhiễm mới mỗi năm(22–27). Việc phát triển vắc-xin HCV đang gặp nhiều thách thức do mức độ đa dạng cao gây ra bởi RNA polymerase phụ thuộc RNA (RdRP) thiếu hoạt động đọc sửa lỗi, do đó làm tăng tỷ lệ lỗi sao chép và tạo ra sự đa dạng di truyền đáng kể (28–32). do đó, do tính đa dạng, có bảy kiểu gen và 67 kiểu con có ít nhất 32. 39% và 14. biến thiên 55% số nuclêôtit và 25. 02% và 9. 7% biến đổi axit amin, tương ứng(33). Hơn nữa, mức độ biến đổi di truyền ở các vùng khác nhau của bộ gen HCV khác nhau. Mức độ bất đồng nhất di truyền cao nhất là do gen cấu trúc mã hóa vỏ glycoprotein 2 của HCV, có tên là E2 (34,35). Các epitope trung hòa chính nằm ở các vùng siêu biến đổi E2 (HVR), nơi chỉ có 37% các vị trí chia sẻ cùng một axit amin đồng thuận trên tất cả các kiểu gen HCV và có thể nhanh chóng thích ứng với khả năng miễn dịch của vật chủ, dẫn đến thoát ra ngoài (36) hoặc biểu hiện sự biến đổi về cấu trúc (37–37) . Đáng chú ý, các kháng thể chống lại các vùng này là đặc hiệu với chủng nhưng vắc-xin phải tạo ra các kháng thể có khả năng vô hiệu hóa phần lớn các chủng đang lưu hành (33). Trong số các phân nhóm HCV, các nghiên cứu cho thấy rằng phân nhóm 1b rất đa dạng. (40a)(44) Do đó, việc tạo ra trình tự đồng thuận từ phân nhóm 1b, không chỉ làm giảm khoảng cách di truyền giữa tất cả các trình tự phân nhóm 1b mà còn giúp chúng ta tiến thêm một bước để tạo ra một ứng cử viên vắc-xin để tạo ra các kháng thể trung hòa chéo rộng rãi. . Do đó, các kiểu gen HCV E2 1b được sử dụng làm ví dụ để so sánh thuật toán thích nghi mới với các thuật toán tạo đồng thuận thông thường khác và để đưa ra quan điểm về ứng dụng của thuật toán này cho các nghiên cứu phát triển vắc-xin

Việc đánh giá chức năng của thuật toán phù hợp được thực hiện thông qua một tập hợp các thử nghiệm trong silico như lập bản đồ văn bia, glycosyl hóa, cây phát sinh gen và cả dự đoán tính kháng nguyên

Cụ thể, trình tự đồng thuận mới đã giữ các dư lượng nóng cần thiết cho các tương tác kháng nguyên-kháng thể, cho dù là tương tác tuyến tính hay cấu trúc.

Nghiên cứu phát sinh loài cho thấy rằng mặc dù có sự khác biệt đáng kể về trình tự polypeptide giữa thuật toán mới và các phương pháp cũ, nhưng vị trí tổng thể của trình tự đồng thuận trên cây được giữ nguyên và nó rất gần với tâm của cây chưa được phân nhánh

Xác suất của trình tự đồng thuận để trở thành kháng nguyên cũng được xác định thông qua hai máy chủ khác nhau và kết quả chỉ ra rằng trình tự đồng thuận được tạo từ thuật toán phù hợp có điểm tính kháng nguyên trên ngưỡng của cả hai máy chủ và cũng gần ngưỡng 90% trong khi trình tự đồng thuận được tạo từ khả năng phù hợp

Quá trình glycosyl hóa cũng được đánh giá trên trình tự mới và kết quả ngụ ý rằng tất cả các vị trí glycosyl hóa được báo cáo đã được bảo toàn thông qua thuật toán phù hợp trong khi các phương pháp khác cho thấy số lượng vị trí glycosyl hóa ít hơn. Do đó, dữ liệu chỉ ra mối tương quan chặt chẽ hơn giữa thuật toán thể dục và các biến dạng tự nhiên so với các thuật toán khác

Nhìn chung, chúng tôi đã thiết kế một quy trình tạo sự đồng thuận, đặt tên là thuật toán phù hợp và đánh giá hiệu quả của trình tự được tạo ra so với một trình tự đồng thuận dựa trên đa số và sáu trình tự đồng thuận dựa trên ngưỡng thông qua một cụm trình tự biến đổi từ protein E2 của phân nhóm HCV 1b(G1b

Để sử dụng thuật toán tạo sự đồng thuận mới này cho các ví dụ thực tế, chẳng hạn như nghiên cứu phát triển vắc-xin, nghiên cứu in vitro và in vivo về các trình tự được tạo ra từ thuật toán này là rất quan trọng. Do đó, viễn cảnh trong tương lai của nghiên cứu này là xem xét sự khác biệt về chức năng và khả năng ứng dụng của các trình tự đồng thuận về thể lực trong việc sản xuất các kháng thể trung hòa bảo vệ chéo ở các sinh vật mô hình

Vật liệu bổ sung

Việc triển khai python đã được lưu trong bloConGen. py, được cung cấp cho bài viết này. Tệp có thể được thực thi hoặc sửa đổi bằng bất kỳ thiết bị đầu cuối python hoặc IDE nào, miễn là có các gói sau được cài đặt trong môi trường python. Dòng lệnh Biopython, Pandas và Mafft

chú thích

  • 1 https. //www. viprbrc. tổ chức/brc/nhà. spg?decorator=vipr

  • 2 https. //mafft. cbrc. jp/căn chỉnh/phần mềm/

  • 3 www. clcbio. com

  • 4 http. //www. iqtree. tổ chức/

  • 5 http. //cây. sinh học. biên tập. AC. anh/software/figtree/

  • 6 http. //www. ddg-pharmfac. net/vaxijen/VaxiJen/VaxiJen. html

  • 7 http. //cào. proteomics. ics. uci. giáo dục/giải thích. html~ANTIGENpro

  • 8 http. //www. cbs. đtu. dk/services/NetNGlyc/

Người giới thiệu

  1. 1.

    Waterman MS , Jones R. Các phương pháp thống nhất để sắp xếp trình tự DNA và protein . Phương pháp Enzyme. 1990 ; 183 (C). 22137 .

    OpenUrlCrossRefPubMedWeb Khoa học

  2. 2.

    Hertz GZ , Hartzell GW, Stormo GD. Xác định các mẫu đồng thuận trong các chuỗi DNA không được liên kết được biết là có liên quan đến chức năng . tin sinh học. 1990 ; 6 ( 2 . ):8192 .

    OpenUrlCrossRefPubMed

  3. 3.

    Bailey TL , Williams N, Misleh C, Li WW. MEME. Khám phá và phân tích mô típ trình tự DNA và protein . Axit nucleic Res. 2006 ; 34 ( WE. PHỤC VỤ. ISS . ). 36973 .

    url mở

  4. 4.

    Iserte JA , Stephan BI, Goñi SE, Borio CS, Ghiringhelli PD, Lozano ME. Thiết kế mồi suy biến dành riêng cho gia đình. Một công cụ để thiết kế các oligonucleotide thoái hóa đồng thuận . Công nghệ sinh học Res Int. 2013 ; 2013 . 19 .

    url mở

  5. 5.

    Gao F , Korber BT, Weaver EA, Liao HX, Hahn BH, Haynes BF. Các chất sinh miễn dịch tập trung như một chiến lược vắc-xin để vượt qua sự đa dạng của HIV-1 . Chuyên gia Rev Vắc xin. 2004 ; 3 ( 4 . ). SUPPL.):1618 .

    url mở

  6. 6

    Cao F , Liêu H-X, Hahn BH, Letvin NL, Korber BT, Haynes BF. Các kháng thể trung hòa và kháng thể trung hòa vỏ bọc HIV-1 . Curr HIV Res. 2007 ; 5 ( 6 . ):5727 .

    OpenUrlCrossRefPubMed

  7. 7

    Webby RJ , Weaver EA. Các gen hemagglutinin đồng thuận tập trung tạo ra khả năng miễn dịch bảo vệ chống lại vi-rút cúm H1, H3 và H5 . XIN MỘT. 2015 ; 10 ( 10 . ):114 .

    OpenUrlCrossRefPubMed

  8. 8

    McBurney SP , Ross TM. Đa dạng trình tự virus. Những thách thức đối với việc thiết kế vắc-xin AIDS . Chuyên gia Rev Vắc xin. 2008 ; 7 ( 9 . ):140517 .

    OpenUrlCrossRefPubMed

  9. 9.

    Kesturu GS , Colleton BA, Liu Y, Heath L, Shakil O, Rinaldo CR, et al. Giảm thiểu khoảng cách di truyền bằng các trình tự đồng thuận, tổ tiên và trung tâm của cây (COT) đối với các biến thể HIV-1 trong một cá thể bị nhiễm bệnh và thiết kế thuốc thử để kiểm tra khả năng phản ứng miễn dịch. Virology. 2006 ; 348 . 43748 .

    OpenUrlPubMed

  10. 10.

    Delphine A , Thư ký O, Frank C, Lobry JR. Truy xuất và phân tích trình tự sinh học . 2019 ; . http. //seqinr. r-rèn. dự án r. tổ chức/

  11. 11

    Okonechnikov K , Golosova O, Fursov M, Varlamov A, Vaskin Y, Efremov I, et al. Unipro UGENE. Bộ công cụ tin sinh học thống nhất . tin sinh học. 2012 ; 28 ( 8 . ):11667 .

    OpenUrlCrossRefPubMedWeb Khoa học

  12. 12.

    Hội trường T , Khoa học sinh học I, Carlsbad C. Chỉnh sửa sinh học. Một phần mềm quan trọng cho sinh học phân tử . Sinh học bò GERF. 2011 ; 2 ( Tháng 6 . ):601 .

    url mở

  13. 13.

    Katoh K , Standley DM. Phần mềm căn chỉnh nhiều trình tự MAFFT Phiên bản 7. Các cải tiến về hiệu suất và khả năng sử dụng Bài viết theo dõi nhanh . 2013 ; 30 ( 4 . ):77280 .

  14. 14.

    Trifinopoulos J , Nguyen L, Haeseler A Von, Minh BQ. W-IQ-TREE. một công cụ phát sinh loài trực tuyến nhanh chóng để phân tích khả năng xảy ra tối đa . 2016 ; 44 ( Tháng 4 . ):2325 .

  15. 15.

    Potter JA , Owsianka AM, Jeffery N, Matthews DJ, Keck Z-Y, Lau P, et al. Hướng tới vắc-xin vi-rút viêm gan C. Cơ sở cấu trúc của quá trình trung hòa vi rút viêm gan C bằng AP33, một kháng thể trung hòa rộng rãi . J Virol. 2012 ; 86 ( 23 . ):1292332 .

    Url mởTóm tắt/MIỄN PHÍ Toàn văn

  16. 16.

    Desombere I , Fafi-Kremer S, Van Houtte F, Pessaux P, Farhoudi A, Heydmann L, et al. Kháng thể đơn dòng kháng vỏ bọc AP33 bảo vệ những con chuột được nhân bản hóa chống lại thách thức vi rút viêm gan C có nguồn gốc từ bệnh nhân . khoa gan. 2016 ; 63 ( 4 . ):112034 .

    OpenUrlCrossRefPubMed

  17. 17.

    Johansson DX , Voisset C, Tarr AW, Aung M, Ball JK, Dubuisson J, et al. Các thư viện tổ hợp của con người tạo ra các kháng thể hiếm có khả năng vô hiệu hóa rộng rãi vi-rút viêm gan C . Proc Natl Acad Sci U S A. 2007 ; 104 ( 41 . ):1626974 .

    Url mởTóm tắt/MIỄN PHÍ Toàn văn

  18. 18

    Sabo MC , Luca VC, Prentoe J, Hopcraft SE, Blight KJ, Yi M, et al. Trung hòa các kháng thể đơn dòng chống lại vi-rút viêm gan C E2 Protein liên kết với các epitope không liên tục và ức chế lây nhiễm ở bước sau khi đính kèm . J Virol. 2011 ; 85 ( 14 . ):700519 .

    Url mởTóm tắt/MIỄN PHÍ Toàn văn

  19. 19.

    Bóng JK , Tarr AW, McKeating JA. Quá khứ, hiện tại và tương lai của kháng thể trung hòa vi-rút viêm gan C . Res kháng vi-rút. 2014 ; 105 ( 1 . ):10011 .

    OpenUrlCrossRefPubMed

  20. 20.

    Krey T , Meola A, Keck Z yong, Damier-Piolle L, Foung SKH, Rey FA. Cơ sở cấu trúc của quá trình trung hòa HCV bằng các kháng thể đơn dòng của con người chống lại quá trình trung hòa virus thoát ra . PLoS Pathog. 2013 ; 9 ( 5 . ):e1003364 .

    OpenUrlCrossRefPubMed

  21. 21.

    Lavie M , Hanoulle X, Dubuisson J. Glycan che chắn và điều chế các kháng thể trung hòa vi-rút viêm gan C . miễn dịch phía trước. 2018 ; 9 ( APR . ):19 .

    OpenUrlCrossRefPubMed

  22. 22.

    Roohvand F , Kossari N. Những tiến bộ trong vắc-xin viêm gan C, phần một. Những tiến bộ về kiến ​​thức cơ bản trong thiết kế vắc xin viêm gan vi rút C . Ý kiến ​​chuyên gia Ther Pat. 2011 ; 21 ( 12 . ):181130 .

    OpenUrlCrossRefPubMed

  23. 23

    Roohvand F , Kossari N. Những tiến bộ trong vắc-xin viêm gan C, phần hai. những tiến bộ trong công thức và phương thức vắc-xin viêm gan C . Ý kiến ​​chuyên gia Ther Pat. 2012 ; 22 ( 4 . ):391415 .

    OpenUrlCrossRefPubMed

  24. 24

    Messina JP , Humphreys I, Flaxman A, Brown A, Cooke GS, Pybus OG, et al. Sự phân bố và tỷ lệ lưu hành toàn cầu của các kiểu gen vi rút viêm gan C . khoa gan. 2015 ; 61 ( 1 . ):7787 .

    OpenUrlCrossRefPubMed

  25. 25

    Mohd Hanafiah K , Groeger J, Flaxman AD, Wiersma ST. Dịch tễ học toàn cầu về nhiễm vi-rút viêm gan C. Các ước tính mới về tỷ lệ kháng thể kháng HCV theo độ tuổi cụ thể . khoa gan. 2013 ; 57 ( 4 . ):133342 .

    OpenUrlCrossRefPubMedWeb Khoa học

  26. 26

    Petruzziello A , Marigliano S, Loquercio G, Cozzolino A, Cacciapuoti C. Dịch tễ học toàn cầu về nhiễm vi-rút viêm gan C. Cập nhật sự phân bố và lưu hành các kiểu gen của vi rút viêm gan C . Thế giới J Gastroenterol. 2016 ; 22 ( 34 . ):782440 .

    OpenUrlCrossRef

  27. 27.

    Tổ chức Y tế Thế giới . Dữ liệu mới về bệnh viêm gan nhấn mạnh nhu cầu ứng phó khẩn cấp trên toàn cầu . 2017 ; . http. //www. ai. int/mediacentre/%0Anews/releases/2017/global-hepatitis-report/en/

  28. 28.

    Tarr AW , Khera T, Hueging K, Sheldon J, Steinmann E, Pietschmann T, et al. Sự đa dạng di truyền nằm bên dưới lớp vỏ glycoprotein của vi rút viêm gan C. Hậu quả về cấu trúc và chức năng cũng như ý nghĩa đối với việc thiết kế vắc xin . vi-rút. 2015 ; 7 ( 7 . ):39954046 .

    OpenUrlCrossRef

  29. 29

    Simmonds P. Tính không đồng nhất về vi-rút của vi-rút viêm gan C . J gan. 1999 ; 31 ( 1 . ):5460 .

    OpenUrlCrossRefPubMedWeb Khoa học

  30. 30

    Halliday J , Klenerman P, Barnes E, Unit TG, Hospital JR. Tiêm phòng vi rút viêm gan C. áp sát mục tiêu lảng tránh . Chuyên gia Rev Vắc xin. 2011 ; 10 ( 5 . ):65972 .

    OpenUrlCrossRefPubMedWeb Khoa học

  31. 31

    Ngưu Y , Tứ Y, Li Y, Chi X, Li X, Liu X, et al. Một chất ức chế phân tử nhỏ mới đối với sự nhân lên của vi-rút viêm gan C hoạt động bằng cách ức chế bộ truyền tín hiệu và bộ kích hoạt phiên mã 3 . 2015 ;( Tháng 4 ). 201323 .

  32. 32.

    Messina JP , Humphreys I, Flaxman A, Brown A, Cooke GS, Pybus OG, et al. Sự phân bố và tỷ lệ lưu hành toàn cầu của các kiểu gen vi rút viêm gan C . khoa gan. 2015 ; 61 ( 1 . ):7787 .

    OpenUrlCrossRefPubMed

  33. 33.

    Cuypers L , Li G, Libin P, Piampongsant S, Vandamme AM, Theys K. Sự đa dạng di truyền và áp lực chọn lọc ở các kiểu gen vi rút viêm gan C 1–6. Ý nghĩa đối với điều trị kháng vi-rút tác động trực tiếp và kháng thuốc . vi-rút. 2015 ; 7 ( 9 . ):501839 .

    OpenUrlCrossRefPubMed

  34. 34.

    Simmonds P. Sự đa dạng di truyền và sự tiến hóa của vi rút viêm gan C - 15 năm sau . Virut gen J. 2004 ; 85 ( 11 . ):317388 .

    OpenUrlCrossRefPubMedWeb Khoa học

  35. 35.

    Simmonds P , Bukh J, Combet C, Deléage G, Enomoto N, Feinstone S, et al. Đề xuất thống nhất về một hệ thống thống nhất danh pháp cho các kiểu gen của vi rút viêm gan C . khoa gan. 2005 ; 42 ( 4 . ):96273 .

    OpenUrlCrossRefPubMedWeb Khoa học

  36. 36.

    Sautto G , Tarr AW, Mancini N, Clementi M. Định nghĩa về cấu trúc và kháng nguyên của các biểu mô glycoprotein E2 của vi-rút viêm gan C được nhắm mục tiêu bởi các kháng thể đơn dòng . Clin Dev miễn dịch. 2013 ; 2013 .

  37. 37.

    Kong L , Lee DE, Kadam RU, Liu T, Giang E, Nieusma T, et al. Tính linh hoạt về cấu trúc ở mục tiêu kháng thể được bảo tồn chính trên kháng nguyên E2 của vi-rút viêm gan C . Proc Natl Acad Sci [Internet]. 2016 Tháng 11 8 [đã trích dẫn . ];113(45):1276873 . Có sẵn từ. https. //www. pnas. org/content/113/45/12768

    url mở

  38. 38

    Meola A , Tarr AW, England P, Meredith LW, McClure CP, Foung SKH, et al. Tính linh hoạt về cấu trúc của vùng kháng nguyên được bảo tồn trong Glycoprotein E2 của vi-rút viêm gan C được công nhận bởi các kháng thể trung hòa rộng . J Virol. 2015 ; 89 ( 4 . ):217081 .

    Url mởTóm tắt/MIỄN PHÍ Toàn văn

  39. 39.

    Li Y , Đâm BG, Wang Q, Keck ZY, Fuerst TR, Foung SKH, et al. Cơ sở cấu trúc để xâm nhập lá chắn glycan của glycoprotein E2 của vi-rút viêm gan C bằng một kháng thể trung hòa rộng rãi của người . Hóa chất sinh học J. 2015 ; 290 ( 16 . ):1011725 .

    Url mởTóm tắt/MIỄN PHÍ Toàn văn

  40. 40

    Trình X Di , Xu HF, Wei XM, Zhou HZ. Phân tích biến thể của E1 và E2 trong các phân nhóm HCV . Arch Virol. 2015 ; 160 ( 10 . ):247982 .

    url mở

  41. 41

    Ferraro D , Urone N, Di Marco V, Craxì A. Sự biến thiên giữa các phân nhóm HCV-1b. Tác động đến hàng rào di truyền đối với chất ức chế protease . Nhiễm gen tiến hóa. 2014 ; 23 . 805 .

    url mở

  42. 42

    Bruno S , Silini E, Crosignani A, Borzio F, Leandro G, Bono F, et al. Kiểu gen của vi-rút viêm gan C và nguy cơ ung thư biểu mô tế bào gan ở người xơ gan. Một nghiên cứu tiến cứu . khoa gan. 1997 ; 25 ( 3 . ):7548 .

    OpenUrlCrossRefPubMedWeb Khoa học

  43. 43

    Tanaka H , Tsukuma H , Yamano H , Okubo Y , Inoue A , Kasahara A , et al. Nhiễm vi-rút viêm gan C 1b(II) và phát triển viêm gan mãn tính, xơ gan và ung thư biểu mô tế bào gan. Một nghiên cứu bệnh chứng ở Nhật Bản . Dịch tễ học J. 1998 ; 8 ( 4 . ):2449 .

    OpenUrlPubMed

  44. 44.

    Janiak M , Perlejewski K, Grabarczyk P, Kubicka-Russel D, Zagordi O, Berak H, et al. Kiểu gen 1b của vi-rút viêm gan C (HCV) thể hiện tính biến đổi di truyền cao hơn của vùng siêu biến 1 (HVR1) so với kiểu gen 3

    Một ví dụ về trình tự đồng thuận là gì?

    Các nhà sinh học phân tử thường trình bày các mẫu tại những điểm này bằng cách sử dụng trình tự đồng thuận. Ví dụ: sau khi sắp xếp một số vị trí gắn kết sao cho khớp với nhau, một vị trí có thể chứa 70% adenine, 10% cytosine, 10% guanine và 10% thymine. The consensus is the most frequent base, 'A'.

    Trình tự đồng thuận là gì?

    Trình tự đồng thuận là một trình tự DNA, RNA hoặc protein đại diện cho các trình tự có liên quan, được căn chỉnh . Trình tự đồng thuận của các trình tự liên quan có thể được xác định theo nhiều cách khác nhau, nhưng thường được xác định bởi (các) nucleotide phổ biến nhất hoặc (các) gốc axit amin ở mỗi vị trí.

    Trình tự đồng thuận trong mRNA là gì?

    Trong sinh học phân tử và tin sinh học, trình tự đồng thuận (hoặc trình tự chính tắc) là thứ tự được tính toán của hầu hết các gốc, nucleotide hoặc axit amin, được tìm thấy ở mỗi vị trí trong một trình tự . Nó phục vụ như một đại diện đơn giản của dân số. . It serves as a simplified representation of the population.

    Trình tự đồng thuận được xác định như thế nào?

    Trình tự đồng thuận ban đầu được xác định bằng cách so sánh các trình tự khởi đầu đã biết và lựa chọn cơ sở phổ biến nhất ở mỗi vị trí. Any sequence upstream of the transcription start site is given a negative sign in front of it as the start site is effectively +1.