Đề tài Tin Sinh học: Dự đoán cấu trúc protein (2)
- Dự đoán cấu trúc protein là một trong những nhiệm vụ quan trọng nhằm xây dựng cơ sở dữ liệu protein phục vụ cho việc tìm hiểu chức năng và y nghĩa của các protein thông qua quá trình phân tích thực nghiệm và đòi hỏi nhiều thời gian và công sức.
- Nhiệm vụ quan trọng của tin sinh học là giúp dự đoán cấu trúc protein từ một chuỗi các amino acid đã biết hình thành nên protein đó.
- Có thể dễ dàng xác định trình tự của axit amin hay còn gọi là cấu trúc bậc một của protein từ trình tự gen mã hóa cho nó. Tuy nhiên sẽ là vô cùng khó khăn nếu dự đoán các cấu trúc này từ trình tự axit amin.
DỰ ĐOÁN CẤU TRÚC PROTEINHV: PHAN THỊ HUYỀN TRANGLỚP: SINH HỌC THỰC NGHIỆM K14Tin sinh học- Dự đoán cấu trúc protein là một trong những nhiệm vụ quan trọng nhằm xây dựng cơ sở dữ liệu protein phục vụ cho việc tìm hiểu chức năng và y nghĩa của các protein thông qua quá trình phân tích thực nghiệm và đòi hỏi nhiều thời gian và công sức.- Nhiệm vụ quan trọng của tin sinh học là giúp dự đoán cấu trúc protein từ một chuỗi các amino acid đã biết hình thành nên protein đó.- Có thể dễ dàng xác định trình tự của axit amin hay còn gọi là cấu trúc bậc một của protein từ trình tự gen mã hóa cho nó. Tuy nhiên sẽ là vô cùng khó khăn nếu dự đoán các cấu trúc này từ trình tự axit amin. TỔNG QUÁTMột trong các ý tưởng quan trọng trong nghiên cứu tin sinh học là quan điểm tương đồng.Trong một nhánh genomic của tin sinh học, tính tương đồng được sử dụng để dự đoán cấu trúc của gene: nếu biết trình tự và chức năng của gen A và trình tự này tương đồng với trình tự của gen B chưa biết chức năng thì có thể kết luận A và B cùng chức năng. Trong nhánh cấu trúc của tin sinh học, tính tương đồng dùng để xác định những hợp phần quan trọng trong cấu trúc của protein cũng như trong tương tác của nó với các protein khác. Với kĩ thuật mô phỏng tính tương đồng( homology modellinh) thông tin này được dùng để dự đoán cấu trúc của một protein khi đã biết cấu trúc của nó với các protein khác- Hiện nay cấu trúc không gian protein được xác định khoảng 35000 trình tự, ít hơn con số 264000 trình tự trong CSDL UniProt/TrEMBL. Một số phương pháp dự đoán cấu trúc protein bằng máy tính đang phát triển. Các phương pháp dự đoán cấu trúc protein được chia làm 3 dạng: 1. Kỹ thuật mô phỏng tính tương đồng 2. Kỹ thuật “xâu kim thành chuỗi” 3. Kỹ thuật dự đoán cấu trúc ngay từ đầuKỸ THUẬT MÔ PHỎNG TÍNH TƯƠNG ĐỒNGKỹ thuật này được dùng để dự đoán cấu trúc của một protein khi đã biết cấu trúc của một protein khác tương đồng với nó.Đây là cách dự đoán cấu trúc protein đáng tin cậy nhất.Ví dụ: Hb ở người và Hb ở các cây họ đậu (leghemoglobin) khá tương đồng với nhau. Mặc dù trình tự axit amin khác nhau nhưng cấu trúc của chúng trên thực tế lại đồng nhất cho thấy rằng chúng hầu như có cùng 1 chức năng.KỸ THUẬT “XÂU KIM THÀNH CHUỖI”Tạo thành trình tự amino acid của cấu trúc protein không điển hình, sau đó đánh giá các mô phỏng này để xác định các đoạn amino acid chưa biết hoạt động như thế nào trong mỗi cấu trúc khuôn mẫu. Tất cả các kĩ thuật này đưa ra những mô hình tương đối chính xác trong ít hơn nửa các trường hợp mà chúng được ứng dụng. Chúng đã từng được sử dụng thành công để khám phá những tính tương đồng xa mà không thể được khám phá ra bởi sự sắp xếp của trình tự chuẩn ban đầu.KỸ THUẬT DỰ ĐOÁN CẤU TRÚC NGAY TỪ ĐẦUTập trung chủ yếu vào xây dựng cấu trúc protein mà không hề có bất kì 1 thông tin cho trước.DỰ ĐOÁN CẤU TRÚC THỨ CẤPViệc tìm hiểu chức năng của protein thường dựa vào cấu trúc bậc ba của protein đó. Tuy nhiên việc áp dụng các phương pháp thực nghiệm hóa lý khác để tìm ra cấu trúc bậc ba của một protein phải trải qua bước trung gian quan trọng là xây dựng cấu trúc bậc hai của protein đó, việc xây dựng cấu trúc bậc hai của protein sẽ làm tăng độ chính xác của việc xây dựng cấu trúc bậc ba lên 25 – 500 %.- Phương pháp thực nghiệm hóa lý được sử dụng để xây dựng cấu trúc bậc hai của protein gặp nhiều khó khăn và tốn kém thời gian vì vậy các nhà khoa học đã chuẩn đoán cấu trúc bậc hai protein mới dựa trên cấu trúc bậc hai của những protein đã biết.- Nhiều thuật toán khác nhau đã được phát triển như:+ Thuật toán sử dụng lý thuyết về đồ thị,+ Phương pháp thống kê.+ Thuật toán người láng giềng gần nhất.+ Sử dụng mạng neural.- Thường chia chuỗi chuỗi amino acid thành nhiều đoạn, mỗi đoạn là một của sổ chứa từ 13 đến 21 amino acid. - Các amino acid trong cùng một cửa sẽ có cấu trúc bậc hai khác nhau. Khi đó bài toán sẽ được đơn giản hóa từ việc chuẩn đoán cấu trúc bậc 2 của mỗi aminno acid trong protein thành việc chuẩn đoán cấu trúc bậc hai của một acid amin tương tự trong mỗi cửa sổ nói trên.- Sau đó xây dựng mô hình để ánh xạ từ các cửa sổ amino acid trong chuỗi sang trình tự tương ứng.CÁCH THỰC HIỆN:Độ chính xác của kĩ thuật dự đoán cấu trúc bậc hai của protein được cải tiến đáng kể sau khi áp dụng mạng neural nhân tạo để huấn luyện quá trình chuẩn đoán.Mạng sau khi được huấn luyện sẽ được ghi nhớ để dự đoán cấu trúc bậc hai của các chuỗi protein mới. Mạng neural thường được xây dựng trên 3 lớp và được ứng dụng với số lượng lớn trình tự để phát triển độ chính xác của dự đoán. Độ chính xac của phương pháp dự đoán cấu trúc bậc hai sử dụng mạng neural là 78%.SAU ĐÂY LÀ CÁC CÔNG CỤ ĐƯỢC SỬ DỤNG PREDICTPROTEINNhấp chuột vào đây để xem protein có cấu trúc như thế nào.Nhập trình tự axit amin bất kì vào ô nàyPHDPSIPREDJPREDPSA
File đính kèm:
- TIN SINH HOC P71.ppt