Đề tài Tin Sinh học: Nhận biết và dự đoán cấu trúc protein (2)

-Nhận biết và dự đóan cấu trúc Pr là một ứng dụng quan trọng trong tin sinh học.Chúng ta có thể dễ dàng xác định cấu trúc bậc một của Pr từ trình tự gen mã hóa cho nó. Tuy nhiên Pr chỉ có chức năng khi được cấu trúc lên các bậc 2,3,4. Trên thực tế sẽ rất khó khăn khi muốn xác định cấu trúc các bậc 2,3,4 từ trình tự a.a.
+Phương pháp Nhận biết và dự đóan cấu trúc Pr cho phép từ trình tự a.a của Pr có thể so sánh với trình tự của các Pr khác đã biết cấu trúc hoặc chức năng . Từ đó thiết lập mối quan hệ để dự đóan cấu trúc pr cần biết.
35 trang | Chia sẻ: gaobeo18 | Lượt xem: 1306 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Đề tài Tin Sinh học: Nhận biết và dự đoán cấu trúc protein (2), để xem tài liệu hoàn chỉnh bạn click vào nút TẢI VỀ ở trên
 nơi mà các nguyên tử hydro có thể bắt đầu được thấy rõ.	Khi cấu trúc tinh thể được gửi vào các PDB, tập tin phối hợp chính thường chứa một đơn vị không đối xứng - một khái niệm mà đã áp dụng duy nhất để tinh thể, nhưng quan trọng là phải hiểu làm thế nào để có được những phân tử có chức năng sinh học.	Một đơn vị bất đối xứng là phần nhỏ nhất của một cấu trúc tinh thể mà đối xứng tinh thể có thể được áp dụng để tạo ra một đơn vị tế bào. Các hoạt động đối xứng thường được tìm thấy trong các cấu trúc phân tử sinh học được phép quay, dịch chuyển , và sự xoay (kết hợp luân chuyển và dịch thuật). Các đơn vị tế bào là đơn vị nhỏ nhất trong tinh thể mà khi dịch chuyển trong ba chiều tạo nên toàn bộ tinh thể.1.2. Cộng hưởng từ hạt nhân (NMR) 	Cộng hưởng từ hạt nhân (NMR) là một hiện tượng vật lý dựa trên đặc tính của các hạt nhân nguyên tử. NMR nghiên cứu hạt nhân từ, như của một nguyên tử hydro, bằng cách sắp xếp nó với một từ trường bên ngoài và nhiễu loạn liên kết này bằng cách sử dụng một trường điện từ. Phản ứng về lĩnh vực này( các nhiễu loạn), là những gì được khai thác trong quang phổ NMR và hình ảnh cộng hưởng từ. 	Bằng cách nghiên cứu các đỉnh của quang phổ NMR, có thể xác định cấu trúc của nhiều hợp chất. Nó có thể là một kỹ thuật rất chọn lọc, phân biệt giữa các nguyên tử trong một phân tử hoặc bộ sưu tập của các phân tử cùng loại, nhưng chỉ khác nhau về môi trường hóa học của địa phương. 	NMR xác định cấu trúc của các protein trong dung dịch, nhưng được giới hạn những phân tử không lớn hơn 30 kD. NMR là phương pháp được lựa chọn cho các protein nhỏ, không dễ dàng kết tinh, và bộc lộ các vị trí của một số các nguyên tử hydro. Kết quả phân tích NMR là một quần thể của các mô hình thay thế, ngược lại với mô hình duy nhất thu được bằng cách tinh thể.II. Phương pháp nhận biết và dự đoán cấu trúc Protein bằng tin sinh học2. 1. Mô hình hóa tương đồng 2.1.1 Mô hình hóa tương đồng là gì?	Mô hình hóa tương đồng là một mô hình ba chiều cho một protein cấu trúc không rõ (mục tiêu) có thể được xây dựng dựa trên thông tin từ một hoặc nhiều protein có liên quan của cấu trúc đã biết (mẫu). 	Các điều kiện cần thiết là có sự giống nhau giữa trình tự mục tiêu và cấu trúc mẫu được phát hiện và có một sự liên kết chính xác giữa chúng có thể được xây dựng. Các liên kết nên ở một vị trí chính xác với phần còn lại của protein. 2.1.2. Các bước trong mô hình hóa tương đồng* Bước 1: Tìm các mẫu So sánh mô hình thường bắt đầu bằng cách tìm kiếm ngân hàng dữ liệu protein (PDB) [] của các cấu trúc protein đã biết bằng cách sử dụng chuỗi mục tiêu như truy vấn. Tìm kiếm này thường được thực hiện bằng cách so sánh trình tự mục tiêu với các trình tự của mỗi cấu trúc trong cơ sở dữ liệu. 	Một điểm bắt đầu tốt để tìm kiếm mẫu là nhiều máy chủ cơ sở dữ liệu trên World Wide Web như BLAST và FASTA tìm kiếm các protein liên quan.* Bước 2: Lựa chọn mẫu	+ Sự tương tự về trình tự toàn bộ giữa mục tiêu và trình tự các mẫu, thì tốt hơn các mẫu như nhau. 	+ Chất lượng của các mẫu tiềm năng. 	+ Độ phân giải . Ví dụ: mẫu có độ phân giải cao thì tăng độ chính xác mô hình. 	+ Mục đích của mô hình. Ví dụ: nếu ý tưởng của các cấu trúc là có liên quan, chất lượng là ít quan trọng * Bước 3: Sự liên kết mục tiêu – mẫu 	Để xây dựng một mô hình, tất cả các chương trình mô hình phụ thuộc vào một danh sách các giả định các cấu trúc tương tự giữa mục tiêu và các mẫu còn lại. Danh sách này được xác định bởi sự liên kết của mục tiêu và trình tự mẫu. 	 Liên kết có được khi sự giống nhau trình tự mẫu mục tiêu là trên 40%. Sự liên kết chính xác có thể được lấy tự động bằng cách sử dụng phương pháp chuỗi liên kết chuẩn. Nếu sự giống nhau của các mẫu mục tiêu thấp hơn 40%, sự liên kết có những khoảng trống và cần sự can thiệp thủ công để giảm thiểu số lượng các phần còn lại bị lệch. * Bước 4: Xây dựng mô hình	Một khi sự liên kết mục tiêu-mẫu ban đầu được xây dựng, một loạt các phương pháp có thể được sử dụng để xây dựng một mô hình 3D cho các protein mục tiêu. Phương pháp ban đầu và vẫn còn sử dụng rộng rãi làmô hình của cơ thể cứng nhắc, lắp ráp. Phương pháp này xây dựng mô hình từ một vài vùng lõi và từ vòng, các chuỗi bên, được lấy từ các cấu trúc giải phẫu có liên quan. Mô hình hóa bằng cách kết hợp phân đoạn, dựa vào các vị trí gần đúng của các nguyên tử được bảo tồn từ các mẫu để tính toán tọa độ của các nguyên tử khác. 	Nhóm thứ ba của các phương pháp, mô hình hóa bởi sự hài lòng của các hạn chế về không gian, sử dụng cả hình học từ xa hoặc các kỹ thuật tối ưu hóa để đáp ứng các hạn chế về không gian có được từ sự liên kết của chuỗi mục tiêu với cấu trúc mẫu. 	Các yếu tố khác như lựa chọn mẫu và độ chính xác liên kết thường có tác động lớn hơn về tính chính xác mô hình, đặc biệt là cho các mô hình dựa trên ít hơn 40 % giống nhau trình tự cho các mẫu.* Bước 5: Ước lượng mô hình 	Sau khi mô hình được xây dựng, điều quan trọng là kiểm tra xem nó có thể có các lỗi. 	Điều đầu tiên để kiểm tra có thể được để áp đặt các cấu trúc mô hình mẫu của mình vào cấu trúc để xác định nếu gấp nếp là mô hình chính xác.	Một đánh giá rất quan trọng là nhận thức về các vùng không đáng tin cậy trong mô hình. Một cách tiếp cận đó là để dự tính một mô tả sơ lược năng lượng của mô hình của một chương trình như PROSA2003. Các mô tả sơ lược báo cáo năng lượng cho từng vị trí trong mô hình và khu vực xấu có thể được xác định. 	Một cách khác để tìm các vùng không đáng tin cậy trong một mô hình là để đánh giá lập thể (độ dài liên kết và các góc, góc nhị diện, các va chạm, vv) với các chương trình như WHATCHECK hoặc PROCHECK.	Nhận biết và dự đóan cấu trúc Protein theo kỹ thuật mô hình hóa tương đồng với phần mềm Swiss model và phần mềm Prosa1. Mở cửa sổ Swess- model workspase2. Nhập trình tự Protein cần xác định cấu trúc và nhập địa chỉ email cũng như yêu cầu và gửi đi bằng việc click vào Submit3. Kiểm tra chất lượng của mô hình bằng phần mềm PROSA 20034. Xây dựng cấu trúc 3D của mô hình bằng phần mềm PymolBước 1:.Mở cửa sổ Swiss- model workspase	Bước 2: Nhập trình tự Protein cần xác định cấu trúc và nhập địa chỉ email cũng như yêu cầu và gửi đi bằng việc click vào Submit1. Nhập địa chỉ email 2. Nhập yêu cầu3..Nhập trình tự Protein cần xác định cấu trúc hoặc mật mã AC UniProt4.Gửi Trình tự và yêu cầu đã nhập Bước 3.Kiểm tra chất lượng của mô hình bằng phần mềm PROSA 2003:GooglePROSA 2003Chọn và clickClick vào đâyNhập cấu trúc cần kiểm tra chất lượng mô hìnhNhập các mã về mô hình cần kiểm tra chất lượngPhân tích để đánh giá mô hìnhTìm kết quả đánh giáClick vào đâyBước 4.Xây dựng cấu trúc 3D của mô hình bằng phần mềm Pymol:GooglePDBNhập mã mô hình đã được đánh giá bằng phần mềm ProsaLựa chọn mẫu và downloadDisplaySquenceXem cấu trúc 3D của mẫu tương đồng bằng phần mềm JavaClick2.2. Phương pháp luồng 	Phương pháp luồng có trình tự axit amin của một cấu trúc protein không mô tả đặc điểm, các mô hình tính toán nhanh chóng dựa trên các cấu trúc 3D, và sau đó đánh giá các mô hình này để xác định các acid amin chưa rõ như thế nào "phù hợp" mỗi cấu trúc mẫu. 	Nó được sử dụng thành công hơn để phát hiện tương đồng từ xa mà không thể phát hiện bằng sự liên kết trình tự chuẩn, nếu các phần của một trình tự phù hợp tốt với một nếp gấp, một liên kết thường có thể được suy ra, mặc dù có thể không có đủ thông tin để xây dựng một mô hình hoàn chỉnh. 2.3. Các phương pháp dự báo Ab-initio 	Tập trung xây dựng cấu trúc mà không có thông tin trước. Các protein có thể được biểu diễn như hạt cườm trên chuỗi. Mỗi axit amin, hoặc từng đơn vị cấu trúc bậc hai ở một số phương pháp tiếp cận, trở thành một hạt với thuộc tính được giao mà thu hút và đẩy lùi các loại hạt khác, và thống kê các phương pháp mô phỏng cơ khí được sử dụng để tìm kiếm không gian cấu tạo có sẵn cho các mô hình đơn giản hóa. Những phương pháp này có thể được thành công trong việc xác định các nếp gấp protein, ngay cả khi các chi tiết của cấu trúc không thể tiên đoán được.III. Ứng dụng	Dự đoán cấu trúc EPITOPE tế bào B không liên tục trên protein MATRIX của Virus H5N1* Bước 1: Thu nhận và xử lý số liệu Từ cơ sở dữ liệu CEO và IEBD: thu dữ liệu về cấu trúc epitope tế bào B không liên tục. Từ cơ sở dữ liệu NCBI, UniProKB,CEO và IEPD: thư thập trình tự mục tiêu dùng xây dựng mô hình tạo cấu trúc. Đồng thời thu trình tự protein MP dùng để dự đoán epitope.Dữ liệu sau khi thu nhận từ các cơ sở dữ liệu trên được xử lý bằng các đoạn chương trình Perl để lấy ra các thông tin cần thiết cũng như định dạng dữ liệu phù hợp với chương trình sử dụng.* Bước 2: Xây dựng và đánh giá cấu trúc 	+ Tìm trình tự mẫu trong cơ sở dữ liệu tương đồng với trình tự mục tiêu bằng câu lệnh blastall của chương trình BLAST. + Thực hiện sắp gióng cột giữa trình tự mục tiêu và các trình tự mẫu bằng các chương trình gióng cột Clustal, T-Cofee và một công cụ sắp gióng cột cói sẵn của Modeller.+ Sử dụng chương trình Modeller để tạo cấu trúc cho trình tự mục triêu từ kết quả sắp gióng cột đa trình tự ở bước 2.+ Kiểm tra đánh giá độ chính xác của cấu trúc đã tạo bằng chương trình Prosa và Pymol. Các chỉ tiêu đánh giá bao gồm: chênh lệch gia trị z-score thực nghiệm và lý thuyết của cấu trúc không gian quá 3,5; giá trị năng lương rk- comb của cấu trúc dưới 10; giá trị RMSD giữa cấu trúc thực nghiệm và cấu trúc được tạo ra bằng phương pháp mô hình hóa không gian quá 1,5A0.	Để chọn phương án tạo cấu trúc tối ưu nhất sử dụng cho toàn bộ quy trình dự đoán, có 4 lần kiểm tra như sau. * Bước 3: Ứng dụng	Sau bốn lần kiểm tra chọn phương pháp tối ưu ta xác định được cấu trúc tối ưu là autoclustal và phương án này được sử dụng để tạo cấu trúc cho 53 trình tự protein MP của virus H5N1 ở Việt Nam* Bước 4: Dự đoán epitope	Cấu trúc của các protein MP đã tạo ra được sắp gióng cột cấu trúc với các cấu trúc epitope mẫu bằng chương trình CEO, nhằm dự đoán epitope trên trình tự mục tiêu . Kết quỉa dự đoán epitope bằng quy trình đó được so sánh với kết quả dự đoán bằng server CEP (một sever dự đoán epitope không liên tục với độ chính xác 75%) để đánh giá khả năng dự đoán của quy trình.
File đính kèm:
TIN SINH HOC P24.ppt