Đề tài Tin Sinh học: Dự đoán cấu trúc protein từ trình tự

Chuỗi axit amin của protein chứa thông tin thú vị. Một trình tự protein có thể được so sánh và đối chiếu với trình tự của các protein khác để thiết lập mối quan hệ giữa chúng, và có thể dùng để cung cấp thông tin về sự tiến hóa của chức năng sinh hóa. Tuy nhiên, dù mục đích gì thì sự hiểu biết về cấu trúc, chức năng của protein cũng sẽ có nhiều hữu ích.
24 trang | Chia sẻ: gaobeo18 | Lượt xem: 1996 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Đề tài Tin Sinh học: Dự đoán cấu trúc protein từ trình tự, để xem tài liệu hoàn chỉnh bạn click vào nút TẢI VỀ ở trên
au, trong một thời gian ngắn, sinh vật có thể tổng hợp được các protein cho một mục đích nào đó. 	I. DỰ ĐOÁN CẤU TRÚC PROTEIN TỪ TRÌNH TỰ	Mỗi lần một chuỗi protein đặc thù được tổng hợp trong tế bào, chúng cuộn lại với nhau theo nhóm hóa học để protein chức năng đó mang cấu trúc hình học chính xác. 	Trong khi có hàng ngàn hàng ngàn cách khác nhau amino axit có thể kết hợp để tạo thành một chuỗi có chiều dài đặc biệt, cách duy nhất mà một cấu trúc protein có thể tổ chức chính nó dường như là nhỏ hơn nhiều. Chỉ có một vài trăm nếp gấp protein độc đáo đã được quan sát thấy trong Ngân hàng dữ liệu protein. I. DỰ ĐOÁN CẤU TRÚC PROTEIN TỪ TRÌNH TỰ	Để hiểu đầy đủ chức năng và các đặc tính của protein, một cấu trúc ba chiều là không thể tránh khỏi.	Nếu thực nghiệm, chúng ta có thể xác định cấu trúc của các protein bằng tinh thể học tia X ( X-ray) hoặc sự cộng hưởng từ hạt nhân ( NMR).	Hầu hết các cấu trúc dữ liệu trong cơ sở dữ liệu PDB đã thu được bằng một trong ba phương pháp: x-ray tinh thể (trên 80%), giải pháp cộng hưởng từ hạt nhân (NMR) (khoảng 16%), hiển vi điện tử. Vậy phương pháp tinh thể học tia X và cộng hưởng từ hạt nhân được hiểu như thế nào?	Tinh thể học tia X	Khi chiếu tia X qua phân tử cần nghiên cứu, tia X tương tác với các electron của phân tử (không phải với hạt nhân). Đầu tiên chúng ta có được một mật độ điện tử, đây gọi là bước nhiễu xạ tia X. Tinh thể sẽ xoay tròn từ từ như vậy để thu thập nhiều mẫu nhiễu xạ mới. Tập hợp các hình ảnh 2D này sẽ chuyển thành 3D và sử dụng để xây dựng một mô hình nguyên tử. Cộng hưởng từ hạt nhân	Cộng hưởng từ hạt nhân là một kỹ thuật nghiên cứu khai thác các đặc tính từ tính của một số hạt nhân nguyên tử để xác định tính chất vật lý và hóa học của nguyên tử hay phân tử mà họ đang có. Hiện tượng cộng hưởng từ hạt nhân có thể cung cấp thông tin chi tiết về cơ cấu, động lực, phản ứng, và môi trường hóa học của phân tử .Một thiết bị NMR 900MHz với 21,2 T nam châm tại HWB-NMR , Birmingham, Vương quốc Anh I. DỰ ĐOÁN CẤU TRÚC PROTEIN TỪ TRÌNH TỰ	Cấu trúc 3D đã được xác định cho chỉ có khoảng 35.000 các chuỗi protein (tháng 3 năm 2006), ít hơn nhiều so với số lượng khoảng 264.000 mục trình tự trong cơ sở dữ liệu UniProt / TrEMBL [] (tháng 3 năm 2006) . Vì vậy, việc xác định cấu trúc 3D có giá trị điều tra là đang thiếu. Trong việc làm sáng tỏ những thiếu sót cơ sở dữ liệu, dự đoán cấu trúc tính toán là một mục tiêu nóng.	II. PHƯƠNG PHÁP DỰ ĐOÁN CẤU TRÚC 	1. Vị trí Tương đồng: sử dụng một mẫu cấu trúc đã biết để xây dựng một mô hình của một phân tử protein. Việc dự đoán cấu trúc dựa trên mẫu tương đồng rất thành công trong sản xuất các mô hình hợp lý trong mọi trường hợp, trong đó đáng kể tương đồng cấu trúc đã có sẵn. Thách thức đối với dự đoán dựa trên tương đồng, cũng như cho sự liên kết chuỗi cơ bản, là việc phát hiện trình tự tương đồng có ý nghĩa trong vùng chưa biết – chiếm khoảng dưới 25%. II. PHƯƠNG PHÁP DỰ ĐOÁN CẤU TRÚC	2. Phương pháp xâu chuỗi trình tự acid amin: trình tự a.a của một cấu trúc protein không xác định rõ đặc điểm, nhanh chóng được tính toán dựa trên các mô hình cấu trúc 3D hiện có, và sau đó đánh giá các mô hình này để quyết định “điều chỉnh” acid amin không rõ phù hợp với mỗi cấu trúc mẫu. Phương pháp này sản xuất mẫu cấu trúc chính xác gần một nửa các trường hợp được áp dụng. Có nhiều thành công đã từng phát hiện các tương đồng từ xa mà sự liên kết chuỗi tiêu chuẩn không làm được, nếu các bộ phận của một trình điều chỉnh nếp gấp protein đúng, liên kết nói chung có thể được suy ra, mặc dù có thể không có đủ thông tin để xây dựng một mô hình hoàn chỉnh.II. PHƯƠNG PHÁP DỰ ĐOÁN CẤU TRÚC	3. Phương pháp đoán trước từ đầu (ab-initio): tập trung vào việc xây dựng cấu trúc khi không có thông tin cho trước. Trong khi phương pháp ab-initio sản xuất các mô hình chính xác không có bất kỳ độ tin cậy nào, thì trong phạm vi này phương pháp lại cho thấy nhiều hưa hẹn. Một chiến lược dựa trên thông tin để dự đoán cấu trúc đã phát triển thư viện đại diện của các phân đoạn ngắn những cấu trúc có thể xây dựng được. Khi "tin tức" cấu trúc nằm ngoài giới hạn thư viện, không gian cấu trúc được tìm kiếm để xây dựng mô hình là một vài cấu trúc miễn cưỡng nào đó. 	 3. Phương pháp đoán trước từ đầu (ab-initio): 	Một phương pháp ab-initio phổ biến là mô phỏng cấu trúc gấp của protein. Trong những phương pháp này, các protein có thể được biểu diễn như là các hạt chuỗi. Mỗi amino acid, hoặc mỗi đơn vị cấu trúc thứ cấp được giao thu hút và đẩy lùi các loại hạt khác trong chuỗi, và dựa theo thống kê cơ học được sử dụng để tìm kiếm mô hình không gian đơn giản. Những phương pháp này có thể được thành công trong việc xác định các nếp gấp protein, ngay cả khi các chi tiết của cấu trúc không thể được dự đoán.	Dự đoán cấu trúc thứ cấp thường được xem như một bước đầu tiên trong dự đoán cấu trúc của một protein III. DỰ ĐOÁN CẤU TRÚC THỨ CẤP	Dự đoán cấu trúc thứ cấp protein là phân loại của các axit amin trong một chuỗi protein theo vùng dự đoán. Cấu trúc thứ cấp thường được chia thành một trong ba loại (alpha xoắn, tấm beta, hoặc cuộn dây), mặc dù số lượng tùy thuộc vào mô hình đang được sử dụng. 	Như đã đề cập trước đó, bài học dự đoán cấu trúc thứ cấp là nó không chính xác. Tuy nhiên, phương pháp dự đoán cấu trúc thứ cấp đã ứng dụng thực tế trong tin sinh học, đặc biệt là trong việc phát hiện tương đồng từ xa. Các công ty dược so sánh dự đoán cấu trúc thứ cấp để xác định vị trí tương đồng tiềm năng từ xa trong việc tìm kiếm các loại thuốc. Mô hình dự đoán cấu trúc thứ cấp có thể dự đoán các lớp gấp của protein và các mục tiêu lựa chọn trong cấu trúc gen. 	Các công cụ dự đoán như PredictProtein và JPred IV. PHƯƠNG PHÁP DỰ ĐOÁN CẤU TRÚC THỨ CẤP1. Cách tiếp cận dựa trên trình tự đơn 	Các phương pháp dự đoán cấu trúc đầu tiên vào những năm 1970 đã được phương pháp tiếp cận chuỗi đơn. 	Phương pháp Chou-Fasman sử dụng quy tắc xuất phát từ các dữ liệu hóa lý về axit amin để dự đoán cấu trúc thứ cấp. 	Các thuật toán Gor (được đặt tên cho các tác giả của nó, Garnier, Osguthorpe, và Robson) và những người kế của nó sử dụng thông tin về tần suất với dư lượng xảy ra trong cấu trúc xoắn, lá, và các cuộn dây của protein để dự đoán cấu trúc.	Cả hai phương pháp vẫn được sử dụng thường xuyên trên các máy chủ nhiều công cụ như Workbench SDSC Sinh học. IV. PHƯƠNG PHÁP DỰ ĐOÁN CẤU TRÚC THỨ CẤP	2) Dự đoán cấu trúc thứ cấp dựa trên sự sắp xếp thứ tự	Phương pháp hiện đại cho khai thác cấu trúc thông tin thứ cấp dự báo từ sự sắp xếp nhiều trình tự, hoặc sự kết hợp của các dự đoán từ nhiều phương pháp, hoặc cả hai. Những phương pháp này cho độ chính xác trong khoảng 70 -77%. Nhiều chương trình có sẵn để sử dụng trên Web. Họ có một trình tự (thường là trong định dạng FASTA) như đầu vào, thực hiện một số thủ tục, sau đó cho ra một dự đoán, thường là qua email, kể từ khi các thuật toán dự đoán được tính toán chuyên sâu và có xu hướng được chạy trong một hàng. 	Sau đây là danh sách các phương pháp thường được sử dụng: 2. Dự đoán cấu trúc thứ cấp dựa trên sự sắp xếp thứ tự	PHD[].	PHD kết hợp kết quả từ một số mạng lưới, trong đó dự báo cấu trúc thứ cấp của một trình tự địa phương và đặc điểm toàn chuỗi (protein dài, tần số acid amin, ...), sau đó dự đoán cuối cùng là một trung bình số học của các mạng lưới. Chương trình kết hợp này được gọi là quyết định ban giám khảo (quyết định cuối cùng) từ tất cả các phương pháp. 	. Giao diện của PHD2. Dự đoán cấu trúc thứ cấp dựa trên sự sắp xếp thứ tự 	- PSIPRED [] 	PSIPRED kết hợp dự đoán mạng lưới với một sự liên kết nhiều chuỗi bắt nguồn từ tìm kiếm cơ sở dữ liệu PSI-BLAST 	- Jpred  ~ www jpred /] 	JPred dự đoán cấu trúc thứ cấp được lấy từ một sự đồng thuận của một số phương pháp dự báo khác bổ sung, bổ sung thông tin nhiều sự liên kết chuỗi. JPred là một trong những dự báo cấu trúc thứ cấp hiệu suất hàng đầu. 	2. Dự đoán cấu trúc thứ cấp dựa trên sự sắp xếp thứ tự	- Predator 	[] 	Predator kết hợp nhiều thông tin liên kết liên tục với các đặc điểm liên kết hydro của các axit amin để dự đoán cấu trúc thứ cấp. 	- PSA[]	PSA là một mô hình Markov, phương pháp tiếp cận dựa trên dự đoán cấu trúc thứ cấp. Nó đáng chú ý cho sản lượng đồ họa chi tiết, trong đó đại diện cho xác suất dự đoán xoắn, tấm, và trạng thái cuộn dây cho mỗi vị trí trong chuỗi protein. 2. Dự đoán cấu trúc thứ cấp dựa trên sự sắp xếp thứ tự	- PredictProtein: Sau khi tìm kiếm SWISS-PROT đầu tiên, tất cả các chuỗi tìm thấy được liên kết chống lại các chuỗi truy vấn và hồ sơ cá nhân được tính cho sự liên kết. Hồ sơ cá nhân sau đó được sử dụng để tìm kiếm SWISS-PROT một lần nữa để tìm thấy các chuỗi mới phù hợp. Sự sắp xếp thứ tự tạo ra bởi MaxHom, sau đó được đưa vào một mạng lưới để dự đoán bởi một trong một bộ các phương pháp được gọi chung là PHD.PHDsec, các phương pháp trong bộ phần mềm này được sử dụng để dự đoán cấu trúc thứ cấp không chỉ gán cho mỗi dư lượng một loại cấu trúc thứ cấp, nó cung cấp một số liệu thống kê cho thấy sự tự tin dự đoán tại mỗi vị trí trong chuỗi. Phương pháp này tạo ra một độ chính xác trung bình của tốt hơn so với 72%, dự đoán dư lượng tốt nhất có một tỷ lệ chính xác của hơn 90%. 2. Dự đoán cấu trúc thứ cấp dựa trên sự sắp xếp thứ tựnnpredict  ~ Nomi / nnpredict.html]	Nnpredict là 1 chương trình mà nó dự đoán cấu trúc thứ cấp cho mỗi phần dư ra của trình tự amino acid. Cơ sở của việc dự đoán là 1 dạng 2 lớp, phía trước mạng lưới neural. Khối lượng của mạng lưới được xác định bởi 1 chương trình riêng biệt. Một mạng lưới neural có 1 lớp trong và 1 lớp ngoài. 2. Dự đoán cấu trúc thứ cấp dựa trên sự sắp xếp thứ tự	Trong trường hợp của dự đoán cấu trúc thứ cấp, lớp trong sẽ lấy thông tin từ trình tự chính nó, và lớp ngoài sẽ có các khả năng của bất kì phần dư nào có thể là dạng của 1 cấu trúc riêng biệt. Giữa lớp trong và lớp ngoài, có một hoặc nhiều lớp vô hình ngăn cách. "Kiến thức" thì được hoàn chỉnh bởi việc cung cấp một tập hợp dữ liệu tập huấn, và các thông số thì được điều chỉnh lặp đi lặp lại để mô phỏng cấu trúc thứ cấp được quan sát bằng thực nghiệm.Cảm ơn quý thầy cô
File đính kèm:
TIN SINH HOC P61.ppt