Đề tài Tin Sinh học: Các phương pháp tìm kiếm dữ liệu trong sinh học và ứng dụng trong việc thực hiện Đề tài

 1.1. Các công cụ tìm kiếm

 Các công cụ tìm kiếm được sử dụng phổ biến hiện nay như:

 - www.google.com

 - www.altavista.com

 - www.infoseek.com

 - www.excite.com

 - www.nlsearch.com

 

ppt38 trang | Chia sẻ: gaobeo18 | Lượt xem: 1013 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Đề tài Tin Sinh học: Các phương pháp tìm kiếm dữ liệu trong sinh học và ứng dụng trong việc thực hiện Đề tài, để xem tài liệu hoàn chỉnh bạn click vào nút TẢI VỀ ở trên
CÁC PHƯƠNG PHÁP TÌM KIẾM DỮ LIỆU TRONG SINH HỌC VÀ ỨNG DỤNG TRONG VIỆC THỰC HIỆN ĐỀ TÀIGiảng viên hướng dẫn : TS. Võ Văn ToànHọc viên thực hiện : Nguyễn Thị HươngLớp : Sinh học thực nghiệm K131. CÁC CÔNG CỤ TÌM KIẾM VÀ CƠ  SỞ DỮ LIỆU SINH HỌC TRÊN  MẠNG INTERNET 1.1. Các công cụ tìm kiếm 	 	Các công cụ tìm kiếm được sử dụng phổ biến hiện nay như:	- www.google.com	- www.altavista.com	- www.infoseek.com	- www.excite.com	- www.nlsearch.comwww.google.com www.altavista.com www.infoseek.comwww.excite.comwww.nlsearch.com 	Cơ sở dữ liệu sinh học có vai trò quan trọng trong việc hỗ trợ các nhà khoa học tìm hiểu và khám phá những hiện tượng sinh học: từ cấu trúc của các phân tử sinh học và sự tương tác giữa chúng đến toàn bộ quá trình biến dưỡng của sinh vật và về sự tiến hóa của các loài. Kiến thức này giúp con người dễ dàng hơn trong cuộc cuộc chiến chống bệnh tật, hỗ trợ việc phát triển thuốc dược liệu và trong việc khám phá mối quan hệ giữa các loài trong lịch sử tiến hóa.1.2. Các cơ sở dữ liệu sinh họca. Cơ sở dữ liệu trình tự nguyên thủy	Những ngân hàng dữ liệu này trình bày những hiểu biết hiện nay của con người về những trình tự của tất cả các sinh vật. Chúng trao đổi thông tin lưu trữ với nhau và là nguồn tài nguyên thông tin của nhiều cơ sở dữ liệu khác. 1. DDBJ (DNA DataBase of Japan)  2. EMBL Nucleotide DB (European Molecular Biology Laboratory )  3. NCBI (National Center for Biotechnology Information)  NCBI (National Center for Biotechnology Information)EMBL (European Molecular Biology Laboratory)DDBJ (DNA DataBase of Japan)b. Cơ sở dữ liệu biến đổi	Cơ sở dữ liệu biến đổi là cơ sở dữ liệu tập hợp thông tin từ những nguồn khác nhau và thường tạo ra nhiều tiện ích mới thuận tiện cho người dùng. 1. Entrez (Nat.Center for Biotechn.Inf.)  2. euGenes (Univ. of Indiana) c. Cơ sở dữ liệu chuyên biệt	1. CGAP Cancer Genes (National Cancer Institute)  	2. DBGET H.sapiens (Univ. of Kyoto)	  3. Ensembl Genome BrowserAnnotated Genomes (EMBL-EBI and Sanger Inst.) 	4. KEGG Functional Db (Univ. of Kyoto) 	5. MGI Mouse Genome (Jackson Lab.)  	6. NCBI-UniGene (National Center for Biotechnology Information) 	7. OMIM Inherited Diseases (National Center for Biotechnology Information) d. Cơ sở dữ liệu trình tự protein1. SWISS-PROT Protein knowledgebase (Swiss Institute of Bioinformatics)  UCSC Genome Bioinformatics (Genome Browser and Tools (UCSC) )  Ensembl Genome Browser (Sanger Institute and EBI)  4. PEDANT Protein Extraction, Description and Analysis Tool (Forschungszentrum f. Umwelt & Gesundheit) 	5. PROSITE Database of Protein Families and Domains 	6. DIP Database of Interacting Proteins (Univ. of California)   7. Pfam Protein families database of alignments and HMMs (Sanger Institute)  8. SignalP Server for signal peptide prediction  Cơ sở dữ liệu cấu trúc1. PDB Protein Data Bank (Research Collaboratory for Structural Bioinformatics (RCSB))  SCOP Structural Classification of Proteins  SWISS-MODEL Server and Repository for Protein Structure Models  ModBase Database of Comparative Protein Structure Models (Sali Lab, UCSF)  Cơ sở dữ liệu Microarray	1. ArrayExpress (European Bioinformatic Institute) 	2. Gene Expression Omnibus (National Center for Biotechnology Information) 	3. Maxd (Univ. of Manchester) 	4. SMD (Univ. of Stanford) 	5. GPX (Scottish Centre for Genomic Technology and Informatics)  Một số trang Web về Công nghệ sinh học  và các công trình nghiên cứu sinh học- Sinh học phân tử và tiến hóa	 Tế bào mầm 	 Thú y	 Nghiên cứu về ARN 	 Nghiên cứu về acid nucleic	 Về động vật học	 Chẩn đoán phân tử 	 Virus học	 Sinh lý thực vật 	 Tế bào thực vật	 NGUYÊN TẮC TÌM KIẾM THÔNG  TIN TRÊN MẠNG INTERNET2.1. XÁC ĐỊNH THÔNG TIN CẦN TÌM 	Để có nhiều thông tin hơn, ta phải dịch nội dung chính của vấn đề sang tiếng Anh vì dữ liệu trên Internet là tiếng Anh.Hoặc phải biết tên la tinh của đối tượng msf ta đang tìm kiếm Ví dụ: tim kiếm thông tin về heo bạn phải biết tên latinh của heo là  sus scrofa2.2. XÁC ĐỊNH TỪ KHÓA 	Để tìm kiếm thông tin chúng ta phải xác định một từ hay một nhóm từ khóa mang nội dung chủ yếu hay quan trọng nhất của vấn đề quan tâm. Từ khóa: sus scrofa 2.3. CHỌN CÔNG CỤ TÌM KIẾM	- Google Patent Search -Tìm kiếm bằng sáng chế.	- Google Scholar - Công cụ tìm kiếm dành cho học giả.	- Google Books - Công cụ tìm kiếm sách. 2.4. LỌC THÔNG TIN	- Đọc lướt nhanh rồi đối chiếu với nội dung ta cần tìm. Nếu đúng là thông tin ta cần tìm thì lưu lại trang web. 	- Từ khóa càng chuyện biệt thì kết quả tìm kiếm càng gần với thông tin ta quan tâm.TÌM KIẾM CÁC BÀI BÁO BẰNG PubMed Thẻ giới hạn phạm vi tìm kiếm[AB]: Tóm tắt – Abstract[AU]: Tên tác giả – Author name[DP]:	Ngày xuất bản – Publication date[CY]:	Nơi phát xuất bản tạp chí – Country[IP]:	Số phát hành của tạp chí[IS]:	International Standard Serial Number of Journal (ISSN)[LA]:	Ngôn ngữ của bài báo – Language[PG]:	Số trang – Page number [TI]:	Tựa đề – Title word[VI]:	Tập (số) – Volume	Để tìm chính xác các từ khóa, chúng ta có thể sử dụng toán tử Boolean (AND, OR, NOT) và dùng thẻ (tag) trong ngoặc vuông ([]) đặt sau từ khóa để giới hạn phạm vi tìm kiếm từ khóa đó. 	Ví dụ: “ DNA microarray” [ti] AND Curtis [au] 2002[dp] 	 Nghĩa là: Tìm bài báo có chữ DNA microarray (trong tựa đề bài báo) của tác giả Curtis năm 2002.	Lưu ý: Để tìm một cụm từ (phrase) thì chúng ta phải được đặt trong dấu ngoặc kép (“”). Entrez tự động hiểu có toán tử AND giữa các từ cách nhau bằng khoảng trắng (không nằm trong dấu ngoặc kép).3. ỨNG DỤNG TRONG THỰC HIỆN ĐỀ TÀITÌM KIẾM TÀI LIỆU BẰNG GOOGLE	Kết quả tìm kiếm hiện ra. Chọn kết quả nào có nội dung sát nội dung cần tìm nhất và lưu lại.Kết quả tìm kiếmVí dụ: Tìm kiếm cấu trúc các protein của virut gây bệnh H5N1 ở lợnTÌM KIẾM DỮ LIỆU CẤU TRÚC PROTEIN TRÊN PDB Protein Data Bank Nhập từ khóaKết quả tìm kiếm hiện ra. Chọn kết quả cần tìm.Các tùy chọn với kết quả tìm kiếmMở xem file onlineTải về máy tính để xem bằng phần mềmClick chuột để xem hình ảnh của protein cần tìmHình cấu trúc của protein sau khi click vào hình nhỏClick chuột để tải hình về máy tínhTìm kiếm thông tin trên pub med	Kết quả tìm kiếm hiện ra. Chọn kết quả cần tìm và lưu lại.Tìm kiếm thông tin trên NCBIKết quả tìm kiếm cho ta lựa chọn để tham khảo

File đính kèm:

  • pptTIN SINH HOC P13.ppt
Bài giảng liên quan