Đề tài Tin Sinh học: Dự đoán cấu trúc và chức năng protein

Chuỗi axit amin của protein chứa thông tin thú vị và của chính nó. Một chuỗi protein có thể được so sánh và đối chiếu với trình tự của các protein khác để thiết lập mối quan hệ của nó, nếu có, cho các loại protein được biết đến, và để cung cấp thông tin về sự tiến hóa của chức năng sinh hóa. Tuy nhiên, cho mục đích của sự hiểu biết chức năng protein, các cấu trúc 3D của một protein được thêm rất nhiều hữu ích hơn so với trình tự của nó.

 

ppt20 trang | Chia sẻ: gaobeo18 | Lượt xem: 1397 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Đề tài Tin Sinh học: Dự đoán cấu trúc và chức năng protein, để tải tài liệu về máy bạn click vào nút TẢI VỀ ở trên
 hợp với mỗi cấu trúc mẫu. Tất cả các phương pháp luồng sản xuất mô hình chính xác cấu trúc trong ít hơn một nửa các trường hợp, trong đó họ được áp dụng. Họ là thành công được sử dụng để phát hiện các homologies từ xa mà không thể được phát hiện bởi sự liên kết chuỗi tiêu chuẩn, nếu các bộ phận của một trình tự phù hợp với một giếng lần, liên kết nói chung có thể được suy ra, mặc dù có thể không có đủ thông tin để xây dựng một mô hình hoàn chỉnh. 8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN3.) Ab-initio phương pháp dự báo tập trung vào việc xây dựng cấu trúc không có thông tin trước khi. Trong khi không có của phương pháp ab-initio sản xuất các mô hình chính xác với độ tin cậy bất kỳ, một loạt các phương pháp hiển thị một số hứa hẹn trong lĩnh vực này. Một chiến lược dựa trên thông tin để dự đoán cấu trúc đã được phát triển thư viện đại diện của các phân đoạn ngắn cấu trúc trong đó có cấu trúc có thể được xây dựng. Kể từ khi cơ cấu "từ" mà không phải là trong thư viện của các phân đoạn giới hạn, không gian cấu trúc được tìm kiếm trong việc xây dựng mô hình có phần hạn chế. Một ab initio phương pháp phổ biến là sử dụng một đại diện giảm của cấu trúc protein để mô phỏng gấp. Trong những phương pháp này, các protein có thể được biểu diễn như là các hạt chuỗi. Mỗi amino acid, hoặc mỗi đơn vị cấu trúc thứ cấp trong một số phương pháp cố định, trở thành một hạt với những tài sản được giao thu hút và đẩy lùi các loại hạt, và thống kê các phương pháp mô phỏng cơ khí được sử dụng để tìm kiếm các không gian conformational có sẵn cho mô hình đơn giản. Những phương pháp này có thể được thành công trong việc xác định các nếp gấp protein, ngay cả khi các chi tiết của cấu trúc không thể được dự đoán. 	Trung dự đoán cấu trúc thường được xem như một bước đầu tiên trong dự đoán cấu trúc của một protein. Như với bất kỳ phương pháp dự đoán, giá trị của chủ nghĩa hoài nghi nên được sử dụng trong việc giải thích các đầu ra của các chương trình này là dự đoán thực tế của cấu trúc thứ cấp. 8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN8/9.1 DỰ ĐOÁN CẤU TRÚC THỨ CẤPDự đoán cấu trúc thứ cấp protein là sự phân loại các amino acid trong 1 trình tự protein theo vùng cấu trúc được dự đoán của chúng. Cấu trúc thứ cấp thường chia làm 3 loại (xoắn α, gấ β hoặc cuộn tròn), mặc dù số loại phụ thuộc vào mô hình sử dụng.Thông thường, mục tiêu của dự đoán cấu trúc thứ cấp thì đem đến khả năng dự đoán chính xác nhất. Nhiều nhà nghiên cứu thực hiện điều này như là 1 mục đích của họ, có thể kết luận trên nhiều móng tay bị ăn mòn và 1 lượng tóc bị rụng. Như đề cập, bài học khô khan về dự đoán cấu trúc thứ cấp protein thì thật không được chính xác cho lắm. Tuy nhiên, những phương pháp dự đoán cấu trúc thứ cấp protein có các ứng dụng đặc biệt trong lĩnh vực tin sinh học, đặc biệt là trong việc dò ra những trình tự tương đồng họ hàng xa nhau. Những công ty dược so sánh các dự đoán cấu trúc thứ cấp cho những trình tự tương đồng có họ hàng xa trong các tìm kiếm nghiên cứu mục tiêu sản xuất thuốc. Các mô hình của cấu trúc thứ cấp được dự đoán có thể cho biết trước những dạng cuộn gấp của các phân tử protein và chọn lựa được các mục tiêu trong nghiên cứu bộ gen.	Các phương pháp dự đoán cấu trúc thứ cấp protein có thể chia làm 2 dạng là cách sắp xếp cơ bản và phương pháp trình tự gốc đơn. phương pháp dùng sự sắp xếp cơ bản trong dự đoán cấu trúc thứ cấp thì hoàn toàn dựa vào trực giác và thay thế cho khái niệm của các mô tả trình tự protein. Trong 1 dự đoán cách xắp xếp cấu trúc thứ cấp , người nghiên cứu sẽ tìm ra 1 họ của các trình tự mà nó tương tự như nhau trong cấu trúc chưa xác định. Những vùng tương đồng trong họ các trình tự thì được thừa nhận để tham gia cấu trúc thứ cấp tương tự và việc dự đoán không được làm cơ sở cho trình tự đó nhưng dựa trên sự thống nhất của các trình tự trong tập hợp đó. Phương pháp tiếp cận trình tự gốc đơn, trên 1 lĩnh vực khác, dự đoán vùng cấu trúc dành cho 1 trình tự không xác định.	Những công cụ dùng để dự đoán cấu trúc thứ cấp như là predictotein and JPred liên kết các kết quả của một vài phương pháp tiếp cận, bao gồm dự đoán cấu trúc thứ cấp protein và các phương pháp xâu chuỗi protein. Sử dụng các dự đoán về cấu trúc thứ cấp protein từ 1 vài phương pháp bổ sung có thể cho kết quả trong 1 đáp án hay hơn là chỉ sử dụng 1 phương pháp. Nếu toàn bộ các phương pháp đều đồng ý về cấu trúc protein được dự đoán tại vùng nào đó, bạn có thể tin tưởng chắc chắn hơn về việc dự đoán đó hơn là nếu đó chỉ được đem lại bởi chỉ 1 hoặc 2 chương trình.8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN1.Các phương pháp tiếp cận trình tự gốc đơn- Phương pháp dự đóan cấu trúc đầu tiên là vào những năm 1970 là 1 trình tự đơn. Phương pháp Chou-Fasman dùng các quy luật bắt nguồn từ dữ liệu hóa lý về amino acid để dự đoán cấu trúc thứ cấp. Thuật toán GOR (tên đặt theo tên các tác giả: Garnier, Osguthorope và Robson) và những người nối tiếp sau đó dùng thông tin về tần số với bất kì các phần dư nào trong những xoắn, các tấm và những dạng cuộn vòng trong các phân tử protein của cấu trúc đã biết để dự đoán các cấu trúc đó. Cả 2 phương pháp hiện vẫn đang được sử dụng, thường là trên nhiều công cụ hỗ trợ như SDSC Biology Workbench.8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN2. dự đoán trình tự sắp xếp cấu trúc thứ cấp- Các phương pháp hiện đại cho việc dự đoán cấu trúc thứ cấp khai thác thông tin từ sự sắp xếp nhiều trình tự, hoặc nhiều sự phối hợp của các dự đoán từ nhiều phương pháp, hoặc cả 2. Các phương pháp này đòi hỏi độ chính xác khoảng 70 – 77%. Nhiều chương trình này có thể dùng trên Web. Chúng đưa vào 1 trình tự giống như là nạp dữ liệu, thực hiện một vài thủ tục trên chúng, sau đó cho ra 1 sự dự đoán, thường bằng email, từ khi những thuật toán dự đoán đòi hỏi tính toán nhiều và lưu trữ để chạy trong 1 hàng.Sau đây là danh sách các hương pháp thường dùng:8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEINPHD[]PHD kết nối các kết quả từ số lượng lớn hệ thần kinh, mỗi cái như vậy dự đoán cấu trúc thứ cấp của dạng trình tự gốc còn lại và trên toàn bộ trình tự (chiều dài rotein, các tần số xuất hiện amino acid,). Sau đó, dự đoán cuối cùng đó là trung bình cộng các giá trị của mỗi hệ thần kinh này. Như là các kết nối được biết đến như các phương pháp jury decision winner-take-all.8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN	PSIPRED []PSIPRED kết nối dự đoán hệ thần kinh với nhiều trình tự thẳng hàng lấy từ tìm kiếm dữ liệu PSI-BLAST.8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEINJpred []Các dự đoán cấu trúc thứ cấp protein Jpred thì được đưa ra từ sự thống nhất của một vài phương pháp dự đoán hỗ trợ, bổ sung bởi thông tin của nhiều trình tự thẳng hàng. Jpred là 1 trong những các chuyên gia dự đoán hàng đầu về cấu trúc thứ cấp protein.8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEINPREDATOR []PredictProtein []PREDATOR kết nối thông tìn của nhiều trình tự chuỗi với các liên kết hydro của amino acid để dự đoán cấu trúc thứ cấp. 8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN	PSA là mô hình cơ bản Markov gần như để dự đoán cấu trúc thứ cấp. Nó nổi bật vì giao diện của mình,Dự đoán cấu trúc protein là một trong những nhiệm vụ quan trọng,nhằm xây dựng cơ sở dữ liệu protein, phục vụ cho việc tìm hiểu chức năng và ý nghĩa của các protein, hiểu được bản chất của sự sống từ đó cải thiện môi trường sống. Tìm ra cấu trúc protein thông qua quá trình phân tích thực nghiệm đòi hỏi nhiều thời gian và công sức. Nhiệm vụ quan trọng của Sinh tin học là giúp dự đoán cấu trúc protein từ một chuỗi các amino acid đã biết hình thành nên protein đó. Tuy nhiên các phương pháp dự đoán cấu trúc protein hiện vẫn chưa thể có độ chính xác tuyệt đối. Tỉ lệ chính xác của các phương pháp chẩn đoán cấu trúc protein hiện nay vẫn chưa vượt quá con số 80%. Việc tìm hiểu chức năng của protein thường dựa vào cấu trúc bậc ba của protein đó. 8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEINTuy nhiên, việc áp dụng các phương pháp thí nghiệm hoá lý để tìm ra cấu trúc bậc ba của protein vẫn còn gặp nhiều khó khăn và phức tạp. Do đó, đa số các phương pháp xác định cấu trúc bậc ba của một protein phải trải qua một bước trung gian quan trọng là xác định cấu trúc bậc hai của protein đó. Việc xác định được cấu trúc bậc hai của protein sẽ làm tăng thêm độ chính xác trong việc xác định cấu trúc bậc ba lên từ 25 - 50 %.Phương pháp thí nghiệm hoá lý được sử dụng để xác định cấu trúc bậc hai protein cũng gặp nhiều khó khăn và tốn kém thời gian. Chính những khó khăn này đã thúc đẩy các nhà nghiên cứu tìm cách chẩn đoán cấu trúc bậc hai của các protein mới dựa trên cấu trúc bậc hai của những protein đã biết. Nhiều thuật toán khác nhau được phát triển như thuật toán sử dụng hệ chuyên gia, sử dụng các lý thuyết về đồ thị, sử dụng các phương pháp thống kê, thuật toán người láng giềng gần nhất, sử dụng mạng neural, ...8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN	Để giải quyết bài toán trên, phương pháp thông thường là chia chuỗi amino acid thành nhiều đoạn, mỗi đoạn là một cửa sổ chứa từ 13 đến 21 amino acid. Các amino acid trong cùng một cửa sổ sẽ có cấu trúc bậc 2 giống nhau. Khi đó bài toán được đơn giản hóa từ việc chẩn đoáncấu trúc bậc 2 của mỗi amino acid trong protein thành việc chẩn đoán cấu trúc bậc 2 của một amino acid trung tâm trong mỗi cửa sổ nói trên. Sau đó xây dựng mô hình để ánh xạ từ các cửa sổ amino acid trong chuỗi sang trạng thái cấu trúc bậc 2 tương ứng.8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN	Độ chính xác của kỹ thuật dự đoán cấu trúc bậc 2 của protein được cải tiến đáng kể sau khi áp dụng mạng thần kinh nhân tạo để huấn luyện quá trình chẩn đoán. Mạng sau khi được huấn luyện sẽ được ghi nhớ để chuẩn bị dự đoán cấu trúc bậc 2 của các chuỗi protein mới. Mạng thần kinh thường được xây dựng trên 3 lớp và áp dụng với số lượng lớn thông tin để tăng độ chi tiết của thông tin huấn luyện, nhằm tăng độ chính xác của giải thuật dự đoán. Độ chính xác của phương pháp dự đoán cấu trúc bậc 2 sử dụng mạng thần kinhChân thành cảm ơn!CHÀO TẠM BIỆT!

File đính kèm:

  • pptTIN SINH HOC P58.ppt