Đề tài Tin Sinh học: Tìm kiếm trình tự sinh học
NỘI DUNG:
• Tìm kiếm thông tin sinh học trên internet.
• Tìm kiếm trình tự sinh học
2.1 . Tìm kiếm trình tự ADN
2.2 . Tìm kiếm trình tự protein
3. Tìm kiếm trình tự tương đồng
4. Phân tích trình tự AND, tìm khung đọc mở ORF.
5. So sánh tương đồng và tạo cây phát sinh từ trình tự AND.
6. Tìm vị trí trình tự AND nhờ phần mềm ADNclub.
ó câu hỏi đặt ra “Liệu có trình tự nào trong ngân hàng dữ liệu giống hoặc gần giống với trình tự của bạn không?”.Chương trình BLAST giúp chúng ta nhanh chóng tìm ra những trình tự sinh học tương đồng (nếu có) với trình tự bạn yêu cầu. Ngoài ra, BLAST còn cung cấp cho bạn những số liệu về tỉ tệ tương đồng, nguồn gốc các trình tự tương đồng. 2. Công cụ và cách sử dụngĐể truy cập vào trang BLAST, chúng ta nhấn vào dòng BLAST trong trang chủ của NCBI. Chúng ta có thể thực hiện tìm kiếm trình tự tương đồng DNA (Nucleotide -Nucleotide BLAST) hoặc protein (Protein – Protein BLAST). 2.1. Nucleotide – Nucleotide BLASTMở chương trình BLAST bằng cách nhấn vào dòng BLAST trong các trang của NCBI. Mở chương trình Nucleotide BLAST bằng cách nhấn lên dòng blastn. Trang kết quả Nucleotide BLAST sẽ xuất hiện dưới dạng HTML (chúng ta có thể thay đổi dạng hiển thị tại menu Format). Nhập trình tự DNA cần tìm kiếm vào khung nhập trình tự (Search). Lựa chọn chức năng blastn và nr (non-redundant), đặt chiều dài giới hạn vùng cần tìm (From:............To: ............ ). Nhấn lên nút BLAST! để bắt đầu chương trình.Kết quả sẽ hiện lên trang formatting BLAST.Nhấn vào nút Format! để mở trang kết quả tìm kiếm và chờ đợi kết quả.2.2. Protein – Protein BLASTSử dụng tương tự chức năng Nucleotide BLAST.• Mở trang Protein BLAST bằng cách nhấn vào dòng blastp trong trang BLAST.Trang protein BLAST sẽ có dạng tương tự nu-nu BLASTChọn chiều dài giới hạn vùng cần tìm (From: ooooo To: ooooo ), cơ sở dữ liệu là nr (non-redundant).• Nhấn vào nút Format! và đợi đến khi xuất hiện kết quả.3. Thực hành3.1. Nucleotide – Nucleotide BLASTTìm một đoạn trình tự DNA GHD7 mà ta đã lưu• Mở chương trình BLAST bằng cách nhấn vào dòng BLAST trong các trangcủa NCBI. Mở chương trình Nucleotide BLAST bằng cách nhấn lên dòngblastn.• Chép trình DNA tự trong tập tin vào khung nhập trình tự(Search). Lựa chọn chức năng blastn và nr, đặt chiều dài giới hạn từ 1 đến200 trong mục From và To, chọn others (so với các loài khác)• Nhấn nút BLAST! để bắt đầu chương trình.Kết quả sẽ hiện lên trang formatting BLAST.• Nhấn vào nút Format! để mở trang kết quả tìm kiếm và chờ đợi (có thể kéo dài vài phút hoặc lâu hơn).Kích vào ô View report ta được bảng sau:Kết quả sẽ hiện lên một trang web mới chứa nội dung tìm được. Thông thường kết quả không hiện lên tức thì mà yêu cầu chúng ta chờ đợi trong một khoảng thời gian. Kết quả gồm phần đồ thị, danh sách mục bài có trình tự tương đồng với trình tự DNA nhập vào với mức độ ngày càng giảm dần. Ngoài ra còn có danh sách các trình tự sắp xếp theo trị số Score.Ví dụ với trình tự nu của gen GDH7, hiện kết quả ở bảng sau trong đó gi|168188198|gb|EU286801.1| Oryza sativa Indica... – là mã số truy cập vào các trình tự tương đồng trong GenBank.3.2. Protein – Protein BLASTMở thư mục GHD7-protein chứa trình tự protein GHD7đã lưu.• Mở trang Protein BLAST bằng cách nhấn vào dòng blastp trong trang BLAST.• Trong hộp nhập thông tin (Search), chép trình toàn bộ trình tự amino acidtrong tập tin GHD7 -protein. Chọn trình tự BLAST (ví dụ từ 1 đến 60),chọn cơ sở dữ liệu là nr.• Nhấn vào nút BLAST!, một cửa sổ mới sẽ xuất hiện.• Nhấn vào nút Format! để mở trang kết quả tìm kiếm và đợi đến khi xuấthiện kết quả.Kết quả xuất hiện tương tự dạng Nucleotide BLAST.IV. PHÂN TÍCH TRÌNH TỰ DNA- TÌM KHUNG ĐỌC MỞ ORF1. Mục đích, nguyên tắcCác trình tự DNA mã hóa thông tin di truyền dưới dạng các bộ ba nucleotide.Khi có một trình tự DNA, chúng ta cần phải tìm trình tự protein nếu muốn xác định sản phẩm sau dịch mã của trình tự này. Tuy nhiên, các trình tự DNA, sau khi được phiên mã, chỉ được dịch mã thành protein khi chúng là một khung đọc mở (Open Reading Frame - ORF). Các khung đọc mở phải là những trình tự DNA có codon bắt đầu và codon kết thúc dịch mã (Stop Codon) như TAA, TGA, TAG.2. Công cụ và cách thực hiệnĐể tìm các khung đọc mở có thể có trong một trình tự DNA, chúng ta sử dụng một chương trình có tên là ORF finder của NCBI. Chương trình này sẽ tìm kiếm những khung đọc mở có thể có của trình tự nhập vào và trình tự bổ sung của nó. Sau đó đưa ra bản đồ khung đọc mở với các trình tự đã dịch mã thành trình tự amino acid.• Mở trang ORF finder từ trang chủ NCBI bằng cách nhấn vào dòng ORF finder. Nhập trình tự DNA vào hộp trình tự (sequence in FASTA format) hoặc mã số trình tự vào hộp GI or ACESSSION (nếu muốn dùng toàn bộ trình tự trong cơ sở dữ liệu). Lựa vị trí dịch mã (From: ....To:..... ) và kiểu mã di truyền.Nhấn nút OrfFind để thực hiện chương trình.Đợi kết quả xuất hiện sau vài phút (hoặc có thể lâu hơn). Kết quả có sáu khung dịch mã xuất hiện. Các khung đọc mở (nếu có) sẽ là những thanh có màu sậm hơn. Lựa chọn giới hạn cách thể hiện bằng trị số trong mục Redraw (50, 100, 300). Nhấn lên trình tự khung đọc mở sẽ thấy hiện lên trình tự DNA và trình tự dịch mã amino acid tương tự kết quả bên dưới.3. Thực hànhChúng ta thực hành xác định khung đọc mở của trình tự gen GHD7. Mở tập tin GDH7b –nu đã lưu.• Mở trang ORF finder từ trang chủ NCBI.• Chép trình tự DNA trong tập tin GDH7 –nu (dạng tập tin văn bản text) vào hộp trình tự (sequence in FASTA format).• Lựa chọn dịch mã từ 1 đến 1000 và mã di truyền là Genetic code.• Nhấn nút OrfFind để thực hiện chương trình.Kết quả có sáu bản dịch xuất hiện và mỗi bản là một khung đọc mở. GHD7 là một protein có mạch polypeptide là 253 amino acid nên cần có một khung đọc mở với 762 base.Muốn xem cụ thể khung đọc mở nào ta kích vào ô xanh đó (ví dụ khung +1), Nhấn lên trình tự khung đọc mở sẽ thấy hiện lên trình tự DNA và trình tự dịch mã amino acid.V. SO SÁNH TƯƠNG ĐỒNG VÀ TẠO CÂY PHÁT SINH LOÀI TỪ TRÌNH TỰ DNA1. Mục đích, nguyên tắcCây phát sinh loài là công cụ thể hiện mức độ tương đồng giữa các trình tự qua quá trình tiến hóa. Chúng ta có thể tạo cây phát sinh loài từ kết quả so sánh các trình tự tương đồng thông qua hai phần mềm ClustalX (1.81) và TreeView (có thể download từ Internet).2. Công cụ và cách sử dụngClustalX là một phần mềm (giao diện Windows) dùng để so sánh tương đồngnhiều trình tự DNA. Nó mô tả kết quả bằng hệ thống các màu sắc và làm nổi bật những nét đặc trưng trong những đoạn tương đồng.TreeView là một phần mềm dùng để vẽ cây phát sinh loài. Phần mềm nàythực hiện đọc kết quả so sánh từ những tập tin dạng NEXUS (NEXUS tree) của các chương trình PAUP và COMPONENT NEXUS hoặc những tập tin dạng PHYLIP (PHYLIP tree) của các chương trình fastDNAml, ClustalX và ClustalW. Mở chương trình ClustalX trên desktop. Lựa chọn chức năng Multiple Alignment Mode. Từ menu File, chọn Append Sequences. Trong hộp Open, chọn tập tin chứa các trình tự cần so sánh. Nhấn nút Open. Chọn Do Complete Alignment trong menu Alignment. Xác định vị trí cho tập tin xuất rồi nhấn nút Align.Kết quả xuất hiện các trình tự so sánh tương đồng. Các vị trí trình tự giống nhau sẽ được thể hiện cùng một màu sắc (mỗi loại nucleotide một màu) và được đánh dấu * là vị trí giống nhauTa có thể nhận xét mức độ tương đồng của các trình tự thông qua sự tương đồng về màu sắc và dạng đồ thị bên dưới. Để tạo cây phát sinh loài dạng PHYLIP chúng ta lần lượt thực hiện các bước:Trong menu Trees, chọn chức năng Draw N-J Trees. Trong hộp DRAW TREE ta chọn nút OK để lưu tập tin dạng *.ph. Mở chương trình TreeView trên desktop. Từ menu File, chọn Open.Trong hộp Open, chọn tập tin *.ph và Files of type là All tree files.Một trang kết quả cây phát sinh loài sẽ xuất hiện.Chúng ta có thể thay đổi kiểu trình bày cây phát sinh loài bằng cách nhấn vào các nút Phylogram, Rectanglar Cladogram, Cladogram, Radial tree.3. Thực hành• Mở chương trình ClustalX trên desktop.• Lựa chọn chức năng Multiple Alignment Mode.• Chọn trình tự trong tập tin đa õlưu ở trên.• Nhấn nút Open. Chọn do complete alignment.Ta nhận xét mức độ tương đồng của các trình tự sự tương đồng về màu sắc (mỗi loại nucleotide một màu) và dạng đồ thị bên dưới.Tạo cây phát sinh bằng cách:• Trong menu Trees, chọn chức năng Draw N-J Trees.• Trong hộp DRAW TREE ta chọn nút OK để lưu tập tin dạng *.ph.( ví dụ: hoanh1*ph)• Mở chương trình TreeView trên desktop. Từ menu File, chọn Open.• Trong hộp Open, chọn tập tin hoanh1 .ph trong thư mục đã lưu và Files of type là All tree files.Một trang kết quả cây phát sinh loài sẽ xuất hiện VI. TÌM VỊ TRÍ TRÌNH TỰ DNA BẰNG PHẦN MỀM ADNclub.DNAclub cung cấp cho chúng ta một công cụ tìm kiếm hữu hiệu. Nhờ đó, tacó thể tìm một trình tự DNA trong toàn bộ bộ gen một cách nhanh chóng và chính xác. Ví dụ ta nhập trình tự nu gen GHD 7 bằøng cách vào File- import – chọn sequence.fasta 11 đã lưu ta được:Ta đi tìm vị trí của đoạn có trình tự nu : AGTTGTTGTTTGTAGCTCGATCGAGTTTGATTTATCCGTTCATGTCGATGGGACCAGCAGC ta làm như sau:- Gọi DNAclub, nhập dữ liệu phân tích. Kích hoạt menu Edit, chọn Find.- Nhập trình tự cần tìm vào khung đợi lệnh và chọn Find. Vị trí và chiều dài của trình tự cần tìm sẽ dược trình bày trên màn hình cùng với dấu hiệu chọn chuỗitrình tự ấy dưới dạng bôi đen
File đính kèm:
- TIN SINH HOC P5.ppt