Đề tài Tin Sinh học: Phân tích trình tự DNA

Xác định một trình tự những nucleotide mã hóa cho protein
Xác định được vị trí bắt đầu và vị trí kết thúc của đoạn gen
Phân tích đoạn antisene theo chiều ngược lại của DNA bổ sung
49 trang | Chia sẻ: gaobeo18 | Lượt xem: 1284 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Đề tài Tin Sinh học: Phân tích trình tự DNA, để xem tài liệu hoàn chỉnh bạn click vào nút TẢI VỀ ở trên
PHÂN TÍCH TRÌNH TỰ DNA NỘI DUNG Xác định một trình tự những nucleotide mã hóa cho protein Xác định được vị trí bắt đầu và vị trí kết thúc của đoạn genPhân tích đoạn antisene theo chiều ngược lại của DNA bổ sungQuá trình phiên mã RNA từ DNAProteinRNADNAtranscriptiontranslationCCTGAGCCAACTATTGATGAACCUGAGCCAACUAUUGAUGAAPEPTIDESự sao chép sinh vật prokaryotic và eukaryotic Quá trình phiên mã RNA từ DNADịch mã theo quy tắc một gene một proteinDịch mã trong ProkaryotesPromoterGene1Gene2Gene NTerminatorTranscriptionRNA PolymerasemRNA 5’3’TranslationRibosome, tRNAs,Protein Factors12NPolypeptidesNCNCNC123Dịch mã proteinKhung đọc mở là gì? Đoạn trình tự nằm giữa một bộ ba khởi đầu và một bộ ba kết thúc tương ứng cùng khung đọc được gọi là khung đọc mở (ORF = open reading frame). Đặc điểm này được dùng để xác định các trình tự ADN mã hoá protein trong các dự án giải mã hệ gen. Initiation codonStop codonPromoter region Shine-Dalgarno box (AGGAGG) Pribnow box (TATAAT) -35 site (TTGACA)Prokaryote5’ Mở đầu: AUG (ATG, GTG, CTG, TTG)3’ORFTerminatorORF - Khung đọc mở Trong Di truyền phân tử, một ORF là một bộ phận của gene của sinh vật mà bao gồm một chuỗi trình tự các base có khả năng mã hóa cho một protein. Trong một gene, các ORF nằm giữa trình tự khởi đầu (codon bắt đầu) và trình tự kết thúc (codon kết thúc). Các ORF luôn luôn được bắt gặp khi di chuyển vị trí ngang qua các mẩu DNA trong lúc cố gắng xác định vị trí một gene. Bởi vì các sai khác tồn tại trong trình tự khởi đầu của các sinh vật với mã di truyền khác nhau, ORF sẽ được xác định khác nhau.Ví dụ, nếu một phần của bộ gene đã được giải trình tựCác ORF có thể được xác định vị trí bằng cách khảo sát mỗi một trong số 3 ORF có thể có (hoặc 6 đối với DNA mạch kép). Trong trình tự này hai nằm ngoài 3 khung đọc có thể là "mở". Đây là một trong hai trình tự mRNA có thể có của sự phiên mã, và chúng ta thấy rằng nó có thể được đọc theo 3 cách khác nhau: 1. UCU AAA AUG GGU GAC 2. ..CUA AAA UGG GUG AC 3. ....UAA AAU GGG UGA CKhung đọc mởMỗi trình tự ADN có thể đọc theo ba khung đọc khác nhau, phụ thuộc vào bazơ nào được chọn làm bazơ khởi đầu. Trên mỗi phân đoạn ADN mạch kép về lý thuyết có thể có tối đa sáu khung đọc mở (ORF) khác nhau.Khung đọc mởNgoài việc quy định điểm bắt đầu quá trình tổng hợp protein, bộ ba mã khởi đầu (AUG) còn xác định khung đọc của trình tự ARN.Có thể có ba bộ ba cho bất kỳ một trình tự bazơ nào, phụ thuộc vào bazơ nào được chọn làm bazơ bắt đầu của codon. CÔNG CỤ VÀ CÁCH THỰC HiỆN Tìm ORF finder trong google ORF FINDER (OPEN READING FRAME FINDER)Nhập trình tự DNA vào khung ORF finderNhập trình tự Kết quả phân tích DNA Chỉ trình bày khung đọc mở tổi thiểu 100 acid aminÝ nghĩa của các khuôn đọcKhung đọc mở (ORF)Forward DNA strandReverse DNA strandF1F2F3F6F5F4****Start signalStop signal*********Total ORFs in F1: 3Total ORFs in F2: 2Total ORFs in F3: 1Total ORFs in F4: 1Total ORFs in F5: 3Total ORFs in F6: 2Total ORFs: 12Trình tự DNA có thể được đọc trong 6 khung đọc ở các sinh vật có DNA mạch đôi; 3 khung đọc trên mỗi mạch.. Chiều dịch mã trong sáu khuôn đọc ORF5’ AATGGCAATCCGCGTAGACTAGGCA 3’3’ TTACCGTTAGGCGCATCTGTATCGT 5’AATGGCAATCCGCGTAGACTAGGCAAATGGCAATCCGCGTAGACTAGGCAAATGGCAATCCGCGTAGACTAGGCATTACCGTTAGGCGCATCTGTATCGTTTACCGTTAGGCGCATCTGTATCGTTTACCGTTAGGCGCATCTGTATCGT+1-2-3-1+2+3Six reading framesAATGGCAATCCGCGTAGACTAGGCA N G N P R R L G AATGGCAATCCGCGTAGACTAGGCA W Q S A * T R TTACCGTTAGGCGCATCTGTATCGTTTACCGTTAGGCGCATCTGTATCGTTTACCGTTAGGCGCATCTGTATCGT+1-2-3-1+3AATGGCAATCCGCGTAGACTAGGCA M A I R V D * A +2Click vàoSử dụng blastp phân tích chức năng đoạn gen mã hóa cho protein Kết quả phân tíchClick vàoTìm ORF bằng DNA clubPHÂN TÍCH SÁU KHUNG ĐỌC MỞCHUYỂN ĐỔI TRÌNH TỰ DNA VÀ AMINO ACIDPhân tử DNA có cấu trúc mạch kép song song và ngược chiều. Do vậy, trình tự DNA có thể chuyển đổi trên hai trình thức, ngược chiều (reverse) và bổ sung (complement) dựa trên nguyên tắc bổ sung A – T, G – C.Muốn nghiên cứu trên trình tự ngược chiều của trình tự DNA đã biết. Đặc biệt là trong ứng dụng việc tạo ra gen antisense (gen mạch đối nghĩa), sự biểu hiện của gen này sẽ tạo ra một mRNA có trình tự bổ sung và bắt cặp được với mRNA của gen gốc bằng cách này ức chế sự biểu hiện một gen gốc không mong muốnNgười nghiên cứu cần chuyển đổi những dữ liệu của trình tự DNA ở gen gốc thành trình tự ngược chiều bổ sung của nó. Khi đó chúng ta cần được hỗ trợ bởi chức năng reverse của phần mềm để chuyển đổi trình tự DNA có sẵn thành trình tự ngược chiều của nó.Trước hết, bảng các codon mã hóa và acid amin tương ứng được lưu trong chương trình. Quá trình dịch mã trên máy tính được tiến hành bằng cách lập chuỗi liên tục các bộ ba nucleotide trên trình tự khuôn; sau đó, chuyển các nhóm ký tự này thành một mã ký tự qui địnhSử dụng chức năng reveseVới chức năng reverse, trình tự DNA sẽ được đọc và trình bày theo chiều ngược lại với trình tự ban đầu: 5'-AAATTTGGGCCCAAAGGG-3' 5'-GGGAAACCCGGGTTTAAA-3'Sử dụng chức năng revese và complement trong DNA clubChức năng reverse và complement cho phép người sử dụng cũng có nhu cầu chuyển đổi, dịch mã từ các dữ liệu DNA thành các dữ liệu protein. Nói cách khác, với một số phần mềm dành cho sinh học phân tử, chúng ta có thể "dịch mã nhân tạo", để từ đó, nghiên cứu và xác định trên protein.Sử dụng chức năng revese và complemnt trong DNA clubDịch mã ra proteinỨNG DỤNG Biết được trình tự của một gen (chẳng hạn gen ung thư hay sự có mặt của các virus nguy hiểm chẳng hạn H5N1, bệnh virus đốm trắng ở tôm) người ta có thể phát hiện sớm bằng kỹ thuật PCR, lai ADN để ngăn chặn, điều trị.Thiết kế những cặp mồi (primer) để nhân bản các đoạn này cho những mục đích nghiên cứu khác nhau như : Nghiên cứu sự có mặt của gen đó trong các sinh vật khác nhau (xác định sự có mặt gen chống bệnh bạc lá, đạo ôn, xác định giới tính, bệnh di truyền). Ngoài ra, còn sử dụng các kỹ thuật microarray, DNA chip để phát hiện sự có mặt và mức độ hoạt động của các gen trong những điều kiện nhất định.Từ trình tự nucleotit của một phân tử ADN có thể biết được bản đồ các vị trí nhận biết của các enzym cắt hạn chế. Điều này đặc biệt có ý nghĩa trong kỹ nghệ ADN tái tổ hợp. Một trong những phương pháp trị liệu gen (gene therapy) dựa trên trình tự ribonucleotit trên phân tử mRNA để tổng hợp sợi bổ sung (antisense) nhằm ngăn chặn sự hoạt động của các gen đó.Một trong những ứng dụng quan trọng đó là chuyển gen để tạo ra các sinh vật mới mang những đặc tính mong muốn hoặc có thể chuyển gen vào các tế bào vi khuẩn, nấm men để sản xuất sản phẩm gen theo con đường tái tổ hợp (protein, enzym, vaccine và các hợp chất có hoạt tính sinh học).Nếu như chúng ta biết được thành phần, trình tự sắp xếp của các axit amin trong phân tử protein, enzym nào đó có thể đánh giá được sự sai khác giữa các axit amin trong các phân tử protein, enzym cùng chức năng ở các loài khác nhau để biết được thành phần axit amin nào đóng vai trò quan trọng.
File đính kèm:
TIN SINH HOC P32.ppt