Tin Sinh học - Bài 6: Giới thiệu về cấu trúc prôtêin

Protein đóng vai trò quan trọng trong quá trình sinh học. Nó có thể thực hiện nhiều nhiệm vụ lớn. Là enzym xúc tác tập hợp các phản ứng hóa học được gọi chung là sự sống. Mặt khác những phản ứng hóa học theo quy định của protein, mà hành động một cách trực tiếp bởi các thành phần của các enzym hoặc gián tiếp trong các hình thức truyền tin hóa học, hoặc các thụ thể của nó. Nó tham gia vào việc vận chuyển và lưu trữ các chất sinh học quan trọng như các ion kim loại, ôxy, glucose, chất béo, và các phân tử khác. Trong hình thức của các sợi cơ và lắp ráp co lại khác, protein tạo ra các chuyển động cơ học của quá trình phối hợp nhiều quá trình sinh học, bao gồm cả việc phân chia các nhiễm sắc thể trong quá trình phân chia tế bào và chuyển động của đôi mắt của bạn khi bạn đọc văn bản này.

 

ppt41 trang | Chia sẻ: gaobeo18 | Lượt xem: 1000 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Tin Sinh học - Bài 6: Giới thiệu về cấu trúc prôtêin, để xem tài liệu hoàn chỉnh bạn click vào nút TẢI VỀ ở trên
 hoặc được cho là có chức năng. Ví dụ, các phân tử hemoglobin chức năng có bốn chuỗi protein (alpha-beta dimers). Tùy thuộc vào đơn vị không đối xứng thì không gian nhóm hoạt động đối xứng bao gồm một trong hai phép quay hoặc bản dịch phải được thực hiện theo thứ tự để có được những đơn vị sinh học hoàn chỉnh. Tuy nhiên, nếu đơn vị không đối xứng có chứa nhiều phân tử sinh học thì sau đó một bản có thể được lựa chọn.Hình 6-7: đơn vị sinh học của Hemoglobin6.2.3. Cộng hưởng từ hạt nhân (NMR)Cộng hưởng từ hạt nhân (NMR) là một hiện tượng vật lý dựa trên nguyên liệu của hạt nhân nguyên tử. NMR nghiên cứu một hạt nhân từ, như của một nguyên tử hydro bằng cách sắp xếp nó với một từ trường bên ngoài và nhiễu loạn này liên kết bằng cách sử dụng một điện từ trường. Đáp ứng với các lĩnh vực (gây nhiễu), là những gì được khai thác trong quang phổ NMR và hình ảnh cộng hưởng từ. Hạt nhân được bao quanh bởi các electron quay xung quanh, mà cũng quay quanh các hạt tích điện [tức là nam châm] và do đó nó là một phần lá chắn hạt nhân. Số lượng che chắn phụ thuộc vào bộ phận xung quanh chính xác. Ví dụ, một hydro liên kết với oxy sẽ được bảo vệ khác với một hydro ngoại quan đến một nguyên tử carbon. Ngoài ra, hai hạt nhân hydrogen có thể tương tác thông qua một quá trình được gọi là khớp nối quay spin-nếu chúng đang ở trên cùng một phân tử, mà sẽ phân chia các dòng của quang phổ một cách nhận biết. Bằng cách nghiên cứu các đỉnh của NMR quang phổ, các nhà hoá học giỏi có thể xác định cấu trúc của nhiều hợp chất. Nó có thể là một kỹ thuật rất chọn lọc, phân biệt giữa các nguyên tử trong một phân tử hoặc bộ sưu tập của các phân tử cùng loại, nhưng chỉ khác nhau về môi trường hóa học của từng bộ phận. 6.2.3. Cộng hưởng từ hạt nhân (NMR) Giải quyết cấu trúc của protein bằng cách sử dụng NMR là một công việc cần thiết. Các nhà nghiên cứu tiến hành một loạt các thí nghiệm, mỗi thí nghiệm cung cấp một phần manh mối về bản chất của các nguyên tử trong mẫu phân tử - chẳng hạn như khoảng cách giữa hai nguyên tử với nhau, cho dù những nguyên tử này được thể chất ngoại quan với nhau, hoặc trong trường hợp các nguyên tử nằm trong cùng một acid amin. Các thí nghiệm khác cho thấy các liên kết giữa các axit amin liền kề đã làm lộ ra các khu vực linh hoạt trong protein. Thách thức của NMR là sử dụng một số bộ thí nghiệm như vậy để trêu chọc tính chất độc đáo cho từng nguyên tử trong mẫu. Sử dụng chương trình máy tính, với máy quang phổ NMR có thể có được một ý tưởng sơ bộ về hình dạng tổng thể của protein và có thể xem các thỏa thuận có thể có của các nguyên tử trong các bộ phận khác nhau của nó. Mỗi thiết lập mới của các thí nghiệm tiếp tục lọc các cấu trúc này có thể xảy ra. Cuối cùng, các nhà khoa học một cách cẩn thận lựa chọn 20 đến 40 giải pháp tốt nhất đại diện cho các dữ liệu thí nghiệm của họ và hiện tại trung bình của các giải pháp này là cấu trúc cuối cùng của họ. 6.2.4. Cấu ​​trúc cơ sở dữ liệu protein Cath ( là một phân loại thứ bậc của các cấu trúc protein trong ngân hàng dữ liệu protein Brookhaven. Cụm protein ở bốn cấp độ lớn, Class (C), Kiến trúc (A), Cấu trúc liên kết (T) và họ chất tương đồng (H) [Orengo, CA, Michie, AD, Jones, S., Jones, DT, Swindells, MB,Thornton, JM (1997) Cơ cấu. Vol 5. Không 8. p.1093-1108]. Lớp: được xác định theo thành phần cấu trúc thứ cấp và đóng gói bên trong cấu trúc. Nó có thể được gán tự động cho hơn 90% cấu trúc được biết đến bằng cách sử dụng các phương pháp của Michie et al. (1996). Đối với phần còn lại, kiểm tra thủ công được sử dụng và thông tin cần thiết từ tài liệu đưa vào tài khoản. Ba loại chính được công nhận: chủ yếu-alpha, beta và alpha-beta. Trong đó lớp cuối cùng (alpha-beta) bao gồm cả cấu trúc xen kẽ alpha / beta và alpha + beta cấu trúc, như ban đầu được xác định bởi Levitt và Chothia (1976). Một lớp thứ tư cũng được xác định, trong đó có lĩnh vực protein, với nội dung cấu trúc thứ cấp thấp. Topology hoặc gấp: cấu trúc được chia thành các nhóm gia đình ở mức độ tùy thuộc vào hình dạng tổng thể và kết nối của các cấu trúc thứ cấp. Điều này được thực hiện bằng cách sử dụng SSAP cấu trúc thuật toán so sánh (Taylor & Orengo (1989)). Các thông số để phân nhóm các lĩnh vực vào cùng một gia đình đã được xác định bằng các thí nghiệm thực nghiệm trong suốt hàng dữ liệu (Orengo et al (1992), Orengo et al (1993)). Kiến trúc, trong đó có một số điểm SSAP 70 và ít nhất 60% protein lớn hơn phù hợp với protein nhỏ hơn, được giao nhiệm vụ giống nhau ở cùng một cấp độ cấu trúc liên kết hoặc gia đình. Một số gia đình rất đông dân cư (Orengo et al (1994)) đặc biệt trong phạm vi chủ yếu là beta-kiến trúc bánh sandwich 2-layer và alpha-beta 3-lớp kiến ​​trúc bánh sandwich. Để đánh giá cao mối quan hệ cấu trúc bên trong các gia đình dễ dàng hơn, họ đang chia nhỏ bằng cách sử dụng một cách cao hơn số điểm SSAP (75 cho một số gia đình chủ yếu là phiên bản beta và alpha-beta, 80 đối với một số gia đình chủ yếu là-alpha, cùng với một chồng lên nhau cao hơn yêu cầu (70%). 6.2.4. Cấu ​​trúc cơ sở dữ liệu proteinHọ chất tương đồng (H-) nhóm mức độ lĩnh vực protein được cho là để chia sẻ một tổ tiên chung và do đó có thể được mô tả như là tương đồng. Các giống nhau được xác định trước bằng cách so sánh trình tự và sau đó so sánh cấu trúc bằng cách sử dụng SSAP. Cấu trúc tập trung vào họ chất tương đồng giống nhau nếu đáp ứng một trong các tiêu chuẩn sau đây: • Trình tự nhận dạng >= 35%, 60% tương đương với cấu trúc lớn nhỏSSAP số điểm> = 80,0 và bản sắc thứ tự> = 20, 60% cấu trúc lớn hơn tương đương với nhỏ hơn.• SSAP số điểm> = 80,0, 60% cấu trúc lớn hơn tương đương với nhỏ hơn, và các lĩnh vực, trong đó có chức năng liên quan. Cấu trúc bên trong mỗi cấp độ-H được tiếp tục nhóm dựa trên chuỗi nhận dạng. Lĩnh vực được nhóm vào cùng một gia đình thứ tự có những nhận dạng chuỗi> 35% (với ít nhất là 60% lĩnh vực tương đương nhỏ hơn), cho thấy cấu trúc rất giống. 6.2.4. Cấu ​​trúc cơ sở dữ liệu proteinCơ sở dữ liệu SCOP (Phân loại cấu trúc của protein,  -lmb.cam.ac.uk/scop/) nhằm mục đích cung cấp mô tả một cách chi tiết và toàn diện về mối quan hệ cấu trúc và tiến hóa giữa tất cả các protein có cấu trúc được biết đến, bao gồm tất cả các mục trong dữ liệu Protein Ngân hàng [AG Murzin, Brenner SE, Hubbard T., Chothia C. (1995) J. Mol. Biol. 247, 536-540]. Nó có sẵn như một tài liệu siêu văn bản liên kết chăt chẻ làm cho cơ sở dữ liệu lớn dễ hiểu và dễ tiếp cận. Hiện có trình tự tự động và các công cụ so sánh cấu trúc có thể xác định tất cả các mối quan hệ cấu trúc và tiến hóa giữa các protein. Việc phân loại SCOP protein đã được xây dựng bằng tay, bằng cách kiểm tra hình ảnh và so sánh các cấu trúc, nhưng với sự hỗ trợ của các công cụ để thực hiện nhiệm vụ quản lý và giúp cung cấp tổng quát. Công việc này được thực hiện với nhiều thử thách và khó khăn về mặt lý thuyết bởi thực tế các đối tượng được tổ chức không đồng nhất: đôi khi nó làm cho ý nghĩa hơn để tổ chức các lĩnh vực cá nhân, và thời gian khác bằng toàn bộ miền protein. 6.2.4. Cấu ​​trúc cơ sở dữ liệu protein Protein được phân loại để phản ánh cả hai quan hệ cấu trúc và tiến hóa. Nhiều cấp độ tồn tại trong hệ thống phân cấp, nhưng các cấp chính là gia đình, họ chất và gấp, mô tả dưới đây. Các vị trí chính xác ranh giới giữa các cấp ở một mức độ chủ quan. Phân loại tiến hóa của chúng tôi là bảo thủ: nơi mà bất cứ nghi ngờ về quan hệ tồn tại, bộ phận mới tại gia đình và mức độ siêu họ đã được thực hiện. Như vậy, một số nhà nghiên cứu có thể thích để tập trung vào mức độ cao hơn của cây phân loại, protein với cấu trúc tương tự như nhóm. Các mức khác nhau trong hệ thống phân cấp là: - Gia đình (rõ ràng tiến hóa mối quan hệ): Protein nhóm cùng với gia đình rõ ràng là tiến hóa có liên quan. Nói chung, điều này có nghĩa là cặp dư lượng bản sắc khôn ngoan giữa các protein là 30% và cao hơn. Tuy nhiên, trong một số trường hợp tương tự như chức năng và cơ cấu cung cấp bằng chứng có nguồn gốc chung trong trường hợp không nhận dạng trình tự cao, ví dụ, globin nhiều tạo thành một gia đình mặc dù một số thành viên có những nhận dạng trình tự chỉ có 15%. 6.2.4. Cấu ​​trúc cơ sở dữ liệu proteinSiêu họ (có thể xảy ra nguồn gốc tiến hóa chung): Protein có những bản sắc chuỗi thấp, nhưng có tính năng cấu trúc và chức năng cho rằng một nguồn gốc tiến hóa thông thường là có thể xảy ra được đặt cùng trong superfamilies. Ví dụ, actin, miền ATPase của các protein sốc nhiệt, và hexakinase với nhau tạo thành một hợp chất. Fold (tương tự như cấu trúc chính): Protein được xác định là có một lần phổ biến nếu họ có cùng một cấu trúc thứ cấp lớn trong việc bố trí giống nhau và với các kết nối cùng một topo. Các protein khác nhau với cùng một lần thường có những yếu tố ngoại vi của cấu trúc thứ cấp và biến khu vực khác nhau về kích thước và cấu tạo.Trong một số trường hợp, những khu vực ngoại vi khác nhau có thể bao gồm một nửa cấu trúc. Protein được đặt cùng nhau trong cùng một thể loại lần có thể không có một nguồn gốc tiến hóa phổ biến: những điểm tương đồng về cấu trúc có thể phát sinh từ vật lý và hóa học của protein ưu sắp xếp một số bao bì và chuỗi cấu trúc liên kết. 6.2.4. Cấu ​​trúc cơ sở dữ liệu protein6.3. Cấu trúc thứ cấp của proteinChương trình DSSP [Kabsch, W. và Sander, C. Biopolymers 22, 2577-2637 (1983)] định nghĩa cấu trúc thứ cấp, các tính năng hình học và tiếp xúc với dung môi của các protein, được tọa độ nguyên tử ở định dạng ngân hàng dữ liệu protein.Chương trình không dự đoán cấu trúc protein. Cấu trúc thứ cấp được phân công dựa trên mô hình liên kết hydro và ký hiệu trong các tập tin đầu ra với một từ viết tắt một bức thư: • G = 3- lượt xoắn (3_10 xoắn). Min chiều dài 3 dư lượng. • H = 4-biến xoắn (xoắn alpha). Min chiều dài 4 dư lượng. • I = 5-turn xoắn (xoắn pi). Min chiều dài 5 dư lượng. • T = hydro ngoại quan lần lượt (3, 4 hoặc bật 5). • E = song song và / hoặc tấm beta chống song song. Min chiều dài 2 dư lượng.• B = dư lượng beta-cầu bị cô lập (beta cặp duy nhất tờ trái phiếu hình thành hydrogen). • S = uốn cong . XIN CHÂN THÀNH CẢM ƠN!

File đính kèm:

  • pptTIN SINH HOC P70.ppt
Bài giảng liên quan