Tin Sinh học - Chương 6: Sơ lược về cấu trúc protein

Protein đóng vai trò quan trọng trong các quá trình sinh học. Chúng có thể thực hiện một lượng lớn các nhiệm vụ. Các enzym xúc tác cho các hóa học phản ứng trong cơ thể sống. Những phản ứng hóa học trên được quy định bởi protein hay enzyme có bản chất là protein, đó gọi là trung tâm hoạt động hoặc thụ thể tiếp nhận. Chúng tham gia vào việc vận chuyển và lưu trữ các chất sinh học quan trọng như: Các ion kim loại, oxy, glucose, lipit và nhiều phân tử khác. Trong hình thức của các sợi cơ và co cụm, protein tạo ra các chuyển động cơ học phối hợp của nhiều quá trình sinh học, bao gồm cả việc phân chia các NST trong quá trình phân chia tế bào và sự vận động của mắt bạn khi bạn đọc văn bản này. Protein rhodopxin trong võng mạc của mắt bạn có được thông tin đó được xử lí thông qua các hành động của các protein tế bào thần kinh. Các protein của tế bào miễn dịch, chẳng hạn như các globulin miễn dịch, tạo thành một hệ thống phòng thủ sinh học cần thiết ở động vật cao hơn.

25 trang | Chia sẻ: gaobeo18 | Lượt xem: 1259 | Lượt tải: 0

Bạn đang xem trước 20 trang tài liệu Tin Sinh học - Chương 6: Sơ lược về cấu trúc protein, để xem tài liệu hoàn chỉnh bạn click vào nút TẢI VỀ ở trên

là người đầu tiên đề xuất sự phân loại này. người ta có thể phân loại bất kì protein bằng cách phân loại này, mức độ bổ sung của cấu trúc protein đã được giới thiệu để tạo điều kiện phân loại các protein thành họ cấu trúc và chức năng Bậc 1Axit aminBậc 2Bậc 3Bậc 4Cấu trúc protein6.2.1 Cấu trúc bậc 1 Protein là polimer được tạo thành từ 20 loại axit amin khác nhau nối lại với nhau qua liên kết cộng hóa trị, gọi là chuỗi polipeptide. Thứ tự các axit amin được gọi là chuỗi axit amin.Các trình tự của tất cả các chuỗi polypeptide của protein được xác định cấu trúc bậc 1.6.2.2 Cấu trúc bậc 2 Có 3 kiểu phổ biến của cấu trúc bậc 2 trong các protein, cụ thể là xoắn α , nếp gấp β và quay.Xoắn Mô hình cấu trúc bậc 2 nổi bậc nhất là xoắn. Có 3 kiểu xoắn được biết đến xảy ra trong các protein tự nhiên, xoắn 310, xoắn α và xoắn π .Kiểu xoắn phổ biến nhất là xoắn α. Cấu trúc của nó lặp đi lặp lại chính nó 5.4A0 dọc theo trục xoắn, vùng xoắn α có 3.6 gốc axit amincos chiều cao tương ứng là 5.4A0. Sự bền vững của cấu trúc xoắn α bắt nguồn từ các kiên kết hidro của xương sống giữa nhóm C=O và nhóm N-H. Các chuỗi bên điểm ra ngoài trục xoắn và nói chung là hướng về phía cuối amino.Gấp nếp β Pauling và Corey là người đầu tiên đề xuất cấu trúc gấp nếp. Như với xoắn α, hình thể gấp nếp β lặp đi lặp lại góc phi và psi và sử dụng năng lực liên kết hidro của xương sống polypeptide. Trong nếp gấp β, tuy nhiên liên kết hidro xảy ra giữa các chuỗi polypeptide kề nhau. Phiến gấp β có nguồn gốc tên của nó từ thực tế, các nguyên tử C kế cận nhau tuần tự được xen kẽ trên và dưới mặt phẳng của gấp nếp β song song và không song song.Quay Mô hình cấu trúc thứ 3 được xác định là quay. Các kiểu phổ biến nhất của mô hình này là quay kiểu I và kiểu II. Chúng bao gồm 4 axit amin tạo thành một vòng quay 1800 của xương sống. Cấu trúc này ổn định bởi liên kết hidro giữa axit amin đầu tiên và axit amin cuối cùng. Hai kiểu này khác nhau về sự sắp xếp của các axit amin tức là giá trị của phi và psi giữa axit amin i+1 và i+2. Trong thực tế, nó xuát hiện, các giá trị cho kiểu quay II lần lượt nằm trong một khu vực của bản vẽ Ramachandran mà chỉ có thể được hoàn thành nếu 1 glicine chiếm i+2 và thực sự i+2 gần như luôn luôn là một glicine. 6.2.3. Cấu trúc bậc 3 Khi bạn nhìn vào một chuỗi polypeptide thực tế, các hình dạng cuối cùng được tạo thành tính năng phổ thông, có lẽ là cấu trúc bậc 2 và một số cấu hình ngẫu nhiên. Cấu trúc tổng thể được gọi là các cấu trúc bậc 3. Cấu trúc bậc 3 cuối cùng đã xác định chức năng của protein. Điều đó có nghĩa là các protein khác nhau nhưng có cấu trúc bậc 3 tương tự nhau thì có chức năng giống nhau. 6.2.4. Cấu trúc bậc 4 Cuối cùng, nhiều protein sinh học xây dựng nên các chuỗi polypeptide. Cách thiết lập nhiều chuỗi polypeptide tạo thành cấu trúc bậc 4. Việc bố trí các chuỗi polypeptide là rất quan trọng với chức.năng.của.protein.6.3. Xác định và trực quan của cấu trúc protein 6.3.1. Nguồn gốc và hạn chế của cấu trúc dữ liệu 3D Thông tin về cấu trúc 3-D của các đại phân tử sinh học có thể được tìm thấy trong các dữ liệu Ngân hàng Protein (www.pdb.org). Hầu hết các cấu trúc dữ liệu trong cơ sở dữ liệu PDB đã thu được bằng một trong 2 phương pháp: x-ray tinh thể (trên 80%) và cộng hưởng từ hạt nhân (NMR) (khoảng 16%). 6.3.2. X-quang tinh thểTrước khi các cấu trúc 3D của một đại phân tử có thể được xác định bằng nhiễu xạ X-quang tinh thể có một số trở ngại phải được vượt qua: - Các phân tử phải được kết tinh, các tinh thể phải đơn độc và có chất lượng tốt. Vô số các nỗ lực để xác định cấu trúc phân tử đã thất bại ở giai đoạn này.- Giải quyết các "vấn đề giai đoạn". Một giải pháp cho vấn đề giai đoạn liên quan đến việc sử dụng bức xạ synchrotron nhiều ở các bước sóng. Điều này có rất nhiều đẩy nhanh tốc độ giải quyết các cấu trúc tinh thể. Một mô tả đầy đủ của mỗi phản ánh cường độ, vị trí và giai đoạn được gọi là một "yếu tố cấu trúc". 6.3.3. Cộng hưởng từ hạt nhân (NMR) Cộng hưởng từ hạt nhân (NMR) là một hiện tượng vật lý nghiên cứu một hạt nhân từ. Giải quyết một cấu trúc protein bằng cách sử dụng NMR là giống như công việc thám tử. Các nhà nghiên cứu tiến hành một loạt các thí nghiệm, mỗi trong số đó cung cấp một phần về bản chất của các nguyên tử trong phân tử mẫu - chẳng hạn như khoảng cách giữa hai nguyên tử với nhau, cho dù các nguyên tử nằm trong cùng một acid amin. Các thí nghiệm khác cho thấy các liên kết giữa các axit amin liền kề hay làm lộ ra các khu vực linh hoạt trong protein. Sử dụng chương trình máy tính, với máy quang phổ NMR có thể cho ta một ý tưởng sơ bộ về hình dạng tổng thể của protein và sự sắp xếp của các nguyên tử trong các bộ phận khác nhau của nó. 6.3.4. Cơ sở dữ liệu protein kiến trúc*Cath ( là một phân loại thứ bậc của các cấu trúc protein trong ngân hàng dữ liệu protein Brookhaven. Cụm protein ở bốn cấp độ lớn, Class (C), Kiến trúc (A), Cấu trúc liên kết (T) và họ tương đồng (H) Class (C) được xác định theo thành phần cấu trúc thứ cấp và đóng gói bên trong cấu trúc. Nó có thể được gán tự động cho hơn 90% cấu trúc được biết đến bằng cách sử dụng các phương pháp của Michie et al. (1996). Đối với phần còn lại, kiểm tra thủ công được sử dụng và thông tin cần thiết từ tài liệu đưa vào tài khoản. Ba loại chính được công nhận: chủ yếu-alpha, chủ yếu là beta và alpha-beta. Điều này lớp học cuối cùng (alpha-beta) bao gồm cả cấu trúc xen kẽ alpha / beta và alpha + beta cấu trúc, như ban đầu được xác định bởi Levitt và Chothia (1976). Một lớp học thứ tư cũng xác định, trong đó có lĩnh vực protein, trong đó có nội dung cấu trúc thứ cấp.thấp.Architecture(A) mô tả hình dạng tổng thể của các cấu trúc tên miền được xác định bởi định hướng của cấu trúc thứ cấp, nhưng bỏ qua các kết nối giữa các cấu trúc thứ cấp. Hôm nay, được phân công bằng tay bằng cách sử dụng một mô tả đơn giản của sự sắp xếp cấu trúc thứ cấp. Topology(T) cấu trúc được chia thành các họ tùy thuộc vào hình dạng tổng thể và kết nối của các cấu trúc thứ cấp. Điều này được thực hiện bằng cách sử dụng SSAP cấu trúc thuật toán so sánh (Taylor.&.Orengo.(1989). Để đánh giá cao mối quan hệ cấu trúc bên trong các họ dễ dàng hơn ta sử dụng số điểm SSAP Homologous superfamily (H) nhóm protein có cùng một tổ tiên chung và do đó có thể được mô tả như là tương đồng. Các tương đồng được xác định trước bằng cách so sánh trình tự và sau đó so sánh cấu trúc bằng cách sử dụng SSAP. Cấu trúc tập trung vào họ tương đồng nếu đáp ứng một trong các tiêu chuẩn sau đây:-Trình tự nhận dạng> = 35%, 60% tương đương với cấu trúc lớn nhỏ-số điểm SSAP > = 80,0 và bản sắc thứ tự> = 20, 60% cấu trúc lớn hơn.tương.đương.với.nhỏ.hơn-số điểm SSAP > = 80,0, 60% cấu trúc lớn hơn tương đương với nhỏ hơn, và các lĩnh vực, trong đó có chức năng liên quan SCOP (Phân loại cấu trúc của protein, nhằm mục đích để cung cấp một mô tả chi tiết và toàn diện của mối quan hệ cấu trúc và tiến hóa giữa tất cả các protein có cấu trúc được biết đến, bao gồm tất cả các mục trong dữ liệu Protein Ngân hàng [AG Murzin, Brenner SE, Hubbard T., Chothia C. (1995) J. Mol. Biol. 247, 536-540]. Nó có sẵn như là một tập hợp các chặt chẽ liên kết siêu văn bản tài liệu mà làm cho cơ sở dữ.liệu.lớn.dễ.hiểu.và.dễ.tiếp.cận.Hiện có trình tự tự động và các công cụ so sánh cấu trúc không có thể xác định tất cả các mối quan hệ cấu trúc và tiến hóa giữa các protein. Các mức khác nhau trong hệ thống phân cấp là:- Họ: các protein cùng họ rõ ràng là tiến hóa liên quan. Nói chung, điều này có nghĩa là cặp dư lượng bản sắc giữa các protein là 30% và.cao.hơn. Siêu họ: (có thể xảy ra nguồn gốc tiến hóa chung): Protein có những bản sắc chuỗi thấp, nhưng có tính năng cấu trúc và chức năng cho rằng một nguồn gốc tiến hóa thông thường là có thể xảy ra được đặt cùng trong superfamilies. Ví dụ, actin, miền ATPase của các protein sốc nhiệt, và hexakinase với nhau Fold (tương tự như cấu trúc chính): Protein được xác định là có một lần phổ biến nếu họ có cùng một cấu trúc thứ cấp lớn trong việc bố trí giống nhau và với các kết nối cùng một topo. Các protein khác nhau với cùng một lần thường có những yếu tố ngoại vi của cấu trúc thứ cấp và biến khu vực khác nhau về kích thước và cấu tạo. Trong một số trường hợp, những khu vực ngoại vi khác nhau có thể bao gồm một nửa cấu trúc. Protein được đặt cùng nhau trong cùng một thể loại lần có thể không có một nguồn gốc tiến hóa phổ biến: những điểm tương đồng về cấu trúc có thể phát sinh từ vật lý và hóa học của protein ưu sắp xếp một số bao bì và chuỗi cấu trúc liên kết.6.4. Protein giao cấu trúc thứ cấp Chương trình DSSP [Kabsch, W. và Sander, C. Biopolymers 22, 2577-2637 (1983)] định nghĩa cấu trúc thứ cấp, các tính năng hình học và tiếp xúc với dung môi của các protein, được tọa độ nguyên tử ở định dạng ngân hàng dữ liệu protein. Chương trình không dự đoán cấu trúc protein. Cấu trúc thứ cấp được phân công dựa trên mô hình liên kết hydro và ký hiệu trong các tập tin đầu ra với một từ.viết.tắt.một.bức.thư:• G = 3-lần lượt xoắn (3_10 xoắn). Min chiều dài 3 dư lượng.• H = 4-biến xoắn (xoắn alpha). Min chiều dài 4 dư lượng.• I = 5-turn xoắn (xoắn pi). Min chiều dài 5 dư lượng.• T = hydro ngoại quan lần lượt (3, 4 hoặc bật 5)• E = song song và / hoặc tấm beta chống song song. Min chiều dài 2,dư.lượng.• B = dư lượng beta-cầu bị cô lập (beta cặp duy nhất tờ trái phiếu hình.thành.hydrogen)• S = uốn cong (không kết hydro chỉ dựa trên giao)Ứng dụngChúng ta có thể dự đoán cấu trúc protein thông qua trình tự nucleotit hoặc trình tự axit amin bằng cách sử dụng phần mềm PyMol. Các bước tiến hành như sau: + Tìm trình tự nucleotit (axit amin) trong PDB, lưu dưới dạng đuôi PDB+ Copy trình tự nucleotit (axit amin) vào phần mềm PyMol ta sẽ được cấu trúc ProteinChúng ta có thể sắp xếp protein thành từng lớp (C), kiến trúc (A), cấu trúc liên kết (T), họ tương đồng (H). Các bước thực hiện như sau: + Tìm trình tự nucleotit (axit amin) trong PDB, lưu dưới dạng đuôi FASTA+ Copy trình tự nucleotit (axit amin) vào mục Search của cơ sở dữ liệu CATH+ Kết quả thu được như sau

File đính kèm:

TIN SINH HOC P43.ppt