Tin Sinh học - Phần 2: Tìm kiếm dữ liệu sinh học

Năm trình tự cơ sở dữ liệu chính trong Internet cung cấp thông tin về trình tự nucleotide và protein
Trình tự cơ sở dữ liệu EMBL Nucleotit, chuỗi cơ sở dữ liệu GenBank và các ngân hàng dữ liệu DNA Nhật Bản (DDBJ) cung cấp thông tin chuỗi nucleotide và protein cũng như các thư mục và chú thích sinh học.
Swiss- Prot là một cơ sở dữ liệu trình tự protein chú thích và cung cấp các chuỗi protein được chú thích liên kết với các cơ sở dữ liệu khác.
23 trang | Chia sẻ: gaobeo18 | Lượt xem: 2059 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Tin Sinh học - Phần 2: Tìm kiếm dữ liệu sinh học, để xem tài liệu hoàn chỉnh bạn click vào nút TẢI VỀ ở trên
TIN SINH HỌC(BIOINFORMATICS)PHẦN 2: TÌM KIẾM DỮ LIỆU SINH HỌCHỌC VIÊN: PHAN THỊ THÙY DUNGLỚP: SINH HỌC THỰC NGHIỆM K14GV HƯỚNG DẪN: T.S VÕ VĂN TOÀN2.1 Bối cảnh và lý thuyết Năm trình tự cơ sở dữ liệu chính trong Internet cung cấp thông tin về trình tự nucleotide và proteinTrình tự cơ sở dữ liệu EMBL Nucleotit, chuỗi cơ sở dữ liệu GenBank và các ngân hàng dữ liệu DNA Nhật Bản (DDBJ) cung cấp thông tin chuỗi nucleotide và protein cũng như các thư mục và chú thích sinh học. Swiss- Prot là một cơ sở dữ liệu trình tự protein chú thích và cung cấp các chuỗi protein được chú thích liên kết với các cơ sở dữ liệu khác. Cơ sở dữ liệu chuỗi protein thứ hai là các thông tin protein tài nguyên (PIR). - Vào giữa thập niên 1970, các phương pháp cô lập trình tự ADN đã được thành lập và ý tưởng về lập bản đồ toàn bộ bộ gen được hình thành. Mô hình các loài sinh vật (vi rút, E. coli, nấm men, ruồi giấm) đã nhanh chóng được điều tra một cách mạnh mẽ. Một danh sách được cập nhật của tất cả các trình tự bộ gen hoàn toàn có sẵn tại  Thông tin đầy đủ về trình tự bộ gen (con người, cây Arabidopsis, Saccharomyces cerevisiae) được cung cấp bởi MIPS ( The Munich Information Center for Protein Sequences 2.1.1 Trình tự cơ sở dữ liệu1.Trình tự ADN: GenBank: là cơ sở dữ liệu chuỗi gen, một bộ sưu tập chú thích của tất cả các trình tự DNA công khai (nghiên cứu axit nucleic). Ghi chú Phát hành đầy đủ cho phiên bản hiện tại của GenBank là có sẵn trên các trang web NCBI. Một phát hành mới được thực hiện mỗi hai tháng. GenBank là một phần của Tổ chức Hợp tác quốc tế Cơ sở dữ liệu trình tự nucleotide, trong đó bao gồm hàng dữ liệu ADN của Nhật Bản (DDBJ), Phòng thí nghiệm Sinh học phân tử châu Âu (EMBL), và GenBank tại NCBI. Ba tổ chức trao đổi dữ liệu trên một cơ sở hàng ngày. Cơ sở dữ liệu EMBL Nucleotit: là cơ sở dữ liệu trình tự nucleotide (còn được gọi là ngân hàng EMBL) tạo thành nguồn tài nguyên chính của Châu Âu của trình tự nucleotide. Nguồn chính cho các trình tự DNA và RNA được cập nhật trực tiếp từ các nhà nghiên cứu cá nhân, dự án và các ứng dụng bằng sáng chế. Cơ sở dữ liệu được sản xuất trong một sự hợp tác quốc tế với GenBank (Mỹ) và Cơ sở dữ liệu ADN của Nhật Bản (DDBJ - DDBJ (ngân hàng dữ liệu DNA Nhật Bản):gân hàng dữ liệu DNA của Nhật Bản (DDBJ) là một cơ sở dữ liệu sinh học thu thập các chuỗi DNA [1] [2] Nó được đặt tại Viện Di truyền học quốc gia (Nig) ở tỉnh Shizuoka của Nhật Bản. Nó cũng là một thành viên của Tổ chức Hợp tác quốc tế Cơ sở dữ liệu trình tự nucleotide hoặc INSDC. Dữ liệu trao đổi với Phòng thí nghiệm Sinh học phân tử châu Âu tại Viện Tin sinh học châu Âu và với GenBank tại Trung tâm Quốc gia về Thông tin Công nghệ sinh học trên cơ sở hàng ngày. Như vậy ba hàng dữ liệu có chứa cùng một dữ liệu tại bất kỳ thời điểm nào.- GenBank  - Cơ sở dữ liệu EMBL Nucleotit  - DDBJ (ngân hàng dữ liệu DNA Nhật Bản)  2. Trình tự protein: UniProt (Universal Resource Protein): Khả năng lưu trữ và kết nối tất cả các thông tin có sẵn trên các protein là rất quan trọng để nghiên cứu sinh học hiện đại. Theo đó, Universal Resource Protein (UniProt) đóng một vai trò ngày càng quan trọng bằng cách cung cấp một nguồn tài nguyên, ổn định toàn diện, tự do truy cập trung tâm trên chuỗi protein và chú thích chức năng. UniProt được sản xuất bởi Hiệp hội UniProt, thành lập năm 2002 bởi Viện Tin Học Sinh Học Châu Âu (EBI), Protein tài nguyên thông tin (PIR) và Viện Thụy Sĩ Tin Học Sinh Học (SIB). - Cơ sở dữ liệu protein (NCBI- The National Center for Biotechnology Information) cung cấp thông tin về tiến bộ khoa học và sức khỏe bằng cách truy cập vào thông tin y sinh học và di truyền. - UniProt (Universal Resource Protein) SWISS-PROT bao gồm, TrEMBL, PIR - Cơ sở dữ liệu protein (NCBI)  Cấu trúc protein- Ngân hàng dữ liệu protein (PDB): Protein ngân hàng dữ liệu (PDB) là một kho lưu trữ cho các dữ liệu cấu trúc 3-D của các phân tử sinh học lớn, chẳng hạn như protein và axit nucleic. Các dữ liệu, thường thu được bằng tinh thể học tia X-quang phổ NMR và trình bởi các nhà sinh vật học và sinh hóa học từ khắp nơi trên thế giới, được tự do truy cập vào Internet thông qua trang web của các tổ chức thành viên (PDBe, PDBj, và RCSB). PDB được giám sát bởi một tổ chức gọi là các Protein Ngân hàng dữ liệu trên toàn thế giới, wwPDB. - Mô hình hóa phân tử cơ sở dữ liệu (NCBI)- Ngân hàng dữ liệu protein (PDB)  Mô hình hóa phân tử cơ sở dữ liệu (NCBI)ơ sở dữ liệu di truyền:- Toàn bộ hệ gen (NCBI) Toàn bộ hệ gen vi sinh vật (TIGR) Hệ gen chưa hoàn chỉnh (TIGR)- Đột biến gen của con người-Toàn bộ hệ gen (NCBI)  - Toàn bộ hệ gen vi sinh vật (TIGR) ệ gen chưa hoàn chỉnh (TIGR)  - Đột biến gen của con người  * Các cơ sở dữ liệu có thể được tìm kiếm có hệ thống, bởi các từ khoá, hoặc bằng trình tự giống nhau. 2.1.2 Văn học và cơ sở dữ liệu sáng chế - Các trình duyệt Entrez cũng cung cấp khả năng tìm kiếm MEDLINE ( một cơ sở dữ liệu trên xuất bản phẩm sinh học và y tế có thể truy cập tại Thư viện Y khoa Quốc gia. Trích dẫn bao gồm cả thông tin về trình tự protein hoặc nucleotide được liên kết với các trình tự cơ sở dữ liệu tương ứng và các trình tự để trích dẫn khác có liên quan. Cơ sở này cho phép tìm thấy một số lượng lớn các trích dẫn rơi vào khu vực bạn quan tâm một khi bạn đã tìm thấy một vài trích dẫn có liên quan, và làm tăng sức mạnh của tìm kiếm của bạn đáng kể. - Một tìm kiếm cho các bằng sáng chế của Mỹ ( - Các Tin sinh học Thư mục Liên kết ( là một nguồn lực cộng đồng trực tuyến có chứa một thư mục của công cụ tự do có sẵn, cơ sở dữ liệu, tài nguyên cho tin sinh học và nghiên cứu sinh học phân tử.    Giới thiệu sơ lược về epoxide hydrolases 2.2 .1 epoxide hydrolases - Epoxide hydrolases (EHS, EC 3.3.2.3) bao gồm một nhóm các enzyme chức năng xúc tác cho việc bổ sung nước cho các hợp chất oxirane (epoxide). EHS đã được tìm thấy trong tất cả các loại sinh vật sống, bao gồm cả động vật có vú, vật không xương sống, thực vật, nấm và vi khuẩn. - Ở động vật, sự quan tâm lớn về EH là hướng về khả năng giải độc cho epoxit vì chúng là biện pháp bảo vệ quan trọng chống lại các tiềm năng gây độc tế bào và những tác nhân có hại cho di truyền của các dẫn xuất oxirane. Điều này quan trọng bởi vì epoxit là chất chuyển hóa trung gian thường xuyên phát sinh trong quá trình biotransformation của các hợp chất nước ngoài. - Sự quan tâm đến EH vi sinh vật vì tiềm năng của các enzym này là biocatalysts enantioselective. Do phản ứng hóa học của chúng, epoxit đại diện cho các khối xây dựng đa năng hóa học. Đặc biệt là tiềm năng của EH cho việc phân giải chiral,từ enzyme thường được bản chất enantioselective. ATHE END ^ _ ^
File đính kèm:
TIN SINH HOC P40.ppt