Đề tài Tin Sinh học: Các phương pháp tìm kiếm dữ liệu trong sinh học và ứng dụng trong việc thực hiện Đề tài
1.1. Các công cụ tìm kiếm
Các công cụ tìm kiếm được sử dụng phổ biến hiện nay như:
- www.google.com
- www.altavista.com
- www.infoseek.com
- www.excite.com
- www.nlsearch.com
CÁC PHƯƠNG PHÁP TÌM KIẾM DỮ LIỆU TRONG SINH HỌC VÀ ỨNG DỤNG TRONG VIỆC THỰC HIỆN ĐỀ TÀIGiảng viên hướng dẫn : TS. Võ Văn ToànHọc viên thực hiện : Nguyễn Thị HươngLớp : Sinh học thực nghiệm K131. CÁC CÔNG CỤ TÌM KIẾM VÀ CƠ SỞ DỮ LIỆU SINH HỌC TRÊN MẠNG INTERNET 1.1. Các công cụ tìm kiếm Các công cụ tìm kiếm được sử dụng phổ biến hiện nay như: - www.google.com - www.altavista.com - www.infoseek.com - www.excite.com - www.nlsearch.comwww.google.com www.altavista.com www.infoseek.comwww.excite.comwww.nlsearch.com Cơ sở dữ liệu sinh học có vai trò quan trọng trong việc hỗ trợ các nhà khoa học tìm hiểu và khám phá những hiện tượng sinh học: từ cấu trúc của các phân tử sinh học và sự tương tác giữa chúng đến toàn bộ quá trình biến dưỡng của sinh vật và về sự tiến hóa của các loài. Kiến thức này giúp con người dễ dàng hơn trong cuộc cuộc chiến chống bệnh tật, hỗ trợ việc phát triển thuốc dược liệu và trong việc khám phá mối quan hệ giữa các loài trong lịch sử tiến hóa.1.2. Các cơ sở dữ liệu sinh họca. Cơ sở dữ liệu trình tự nguyên thủy Những ngân hàng dữ liệu này trình bày những hiểu biết hiện nay của con người về những trình tự của tất cả các sinh vật. Chúng trao đổi thông tin lưu trữ với nhau và là nguồn tài nguyên thông tin của nhiều cơ sở dữ liệu khác. 1. DDBJ (DNA DataBase of Japan) 2. EMBL Nucleotide DB (European Molecular Biology Laboratory ) 3. NCBI (National Center for Biotechnology Information) NCBI (National Center for Biotechnology Information)EMBL (European Molecular Biology Laboratory)DDBJ (DNA DataBase of Japan)b. Cơ sở dữ liệu biến đổi Cơ sở dữ liệu biến đổi là cơ sở dữ liệu tập hợp thông tin từ những nguồn khác nhau và thường tạo ra nhiều tiện ích mới thuận tiện cho người dùng. 1. Entrez (Nat.Center for Biotechn.Inf.) 2. euGenes (Univ. of Indiana) c. Cơ sở dữ liệu chuyên biệt 1. CGAP Cancer Genes (National Cancer Institute) 2. DBGET H.sapiens (Univ. of Kyoto) 3. Ensembl Genome BrowserAnnotated Genomes (EMBL-EBI and Sanger Inst.) 4. KEGG Functional Db (Univ. of Kyoto) 5. MGI Mouse Genome (Jackson Lab.) 6. NCBI-UniGene (National Center for Biotechnology Information) 7. OMIM Inherited Diseases (National Center for Biotechnology Information) d. Cơ sở dữ liệu trình tự protein1. SWISS-PROT Protein knowledgebase (Swiss Institute of Bioinformatics) UCSC Genome Bioinformatics (Genome Browser and Tools (UCSC) ) Ensembl Genome Browser (Sanger Institute and EBI) 4. PEDANT Protein Extraction, Description and Analysis Tool (Forschungszentrum f. Umwelt & Gesundheit) 5. PROSITE Database of Protein Families and Domains 6. DIP Database of Interacting Proteins (Univ. of California) 7. Pfam Protein families database of alignments and HMMs (Sanger Institute) 8. SignalP Server for signal peptide prediction Cơ sở dữ liệu cấu trúc1. PDB Protein Data Bank (Research Collaboratory for Structural Bioinformatics (RCSB)) SCOP Structural Classification of Proteins SWISS-MODEL Server and Repository for Protein Structure Models ModBase Database of Comparative Protein Structure Models (Sali Lab, UCSF) Cơ sở dữ liệu Microarray 1. ArrayExpress (European Bioinformatic Institute) 2. Gene Expression Omnibus (National Center for Biotechnology Information) 3. Maxd (Univ. of Manchester) 4. SMD (Univ. of Stanford) 5. GPX (Scottish Centre for Genomic Technology and Informatics) Một số trang Web về Công nghệ sinh học và các công trình nghiên cứu sinh học- Sinh học phân tử và tiến hóa Tế bào mầm Thú y Nghiên cứu về ARN Nghiên cứu về acid nucleic Về động vật học Chẩn đoán phân tử Virus học Sinh lý thực vật Tế bào thực vật NGUYÊN TẮC TÌM KIẾM THÔNG TIN TRÊN MẠNG INTERNET2.1. XÁC ĐỊNH THÔNG TIN CẦN TÌM Để có nhiều thông tin hơn, ta phải dịch nội dung chính của vấn đề sang tiếng Anh vì dữ liệu trên Internet là tiếng Anh.Hoặc phải biết tên la tinh của đối tượng msf ta đang tìm kiếm Ví dụ: tim kiếm thông tin về heo bạn phải biết tên latinh của heo là sus scrofa2.2. XÁC ĐỊNH TỪ KHÓA Để tìm kiếm thông tin chúng ta phải xác định một từ hay một nhóm từ khóa mang nội dung chủ yếu hay quan trọng nhất của vấn đề quan tâm. Từ khóa: sus scrofa 2.3. CHỌN CÔNG CỤ TÌM KIẾM - Google Patent Search -Tìm kiếm bằng sáng chế. - Google Scholar - Công cụ tìm kiếm dành cho học giả. - Google Books - Công cụ tìm kiếm sách. 2.4. LỌC THÔNG TIN - Đọc lướt nhanh rồi đối chiếu với nội dung ta cần tìm. Nếu đúng là thông tin ta cần tìm thì lưu lại trang web. - Từ khóa càng chuyện biệt thì kết quả tìm kiếm càng gần với thông tin ta quan tâm.TÌM KIẾM CÁC BÀI BÁO BẰNG PubMed Thẻ giới hạn phạm vi tìm kiếm[AB]: Tóm tắt – Abstract[AU]: Tên tác giả – Author name[DP]: Ngày xuất bản – Publication date[CY]: Nơi phát xuất bản tạp chí – Country[IP]: Số phát hành của tạp chí[IS]: International Standard Serial Number of Journal (ISSN)[LA]: Ngôn ngữ của bài báo – Language[PG]: Số trang – Page number [TI]: Tựa đề – Title word[VI]: Tập (số) – Volume Để tìm chính xác các từ khóa, chúng ta có thể sử dụng toán tử Boolean (AND, OR, NOT) và dùng thẻ (tag) trong ngoặc vuông ([]) đặt sau từ khóa để giới hạn phạm vi tìm kiếm từ khóa đó. Ví dụ: “ DNA microarray” [ti] AND Curtis [au] 2002[dp] Nghĩa là: Tìm bài báo có chữ DNA microarray (trong tựa đề bài báo) của tác giả Curtis năm 2002. Lưu ý: Để tìm một cụm từ (phrase) thì chúng ta phải được đặt trong dấu ngoặc kép (“”). Entrez tự động hiểu có toán tử AND giữa các từ cách nhau bằng khoảng trắng (không nằm trong dấu ngoặc kép).3. ỨNG DỤNG TRONG THỰC HIỆN ĐỀ TÀITÌM KIẾM TÀI LIỆU BẰNG GOOGLE Kết quả tìm kiếm hiện ra. Chọn kết quả nào có nội dung sát nội dung cần tìm nhất và lưu lại.Kết quả tìm kiếmVí dụ: Tìm kiếm cấu trúc các protein của virut gây bệnh H5N1 ở lợnTÌM KIẾM DỮ LIỆU CẤU TRÚC PROTEIN TRÊN PDB Protein Data Bank Nhập từ khóaKết quả tìm kiếm hiện ra. Chọn kết quả cần tìm.Các tùy chọn với kết quả tìm kiếmMở xem file onlineTải về máy tính để xem bằng phần mềmClick chuột để xem hình ảnh của protein cần tìmHình cấu trúc của protein sau khi click vào hình nhỏClick chuột để tải hình về máy tínhTìm kiếm thông tin trên pub med Kết quả tìm kiếm hiện ra. Chọn kết quả cần tìm và lưu lại.Tìm kiếm thông tin trên NCBIKết quả tìm kiếm cho ta lựa chọn để tham khảo
File đính kèm:
- TIN SINH HOC P13.ppt