Thuật Ngữ Hiện Đại Trong CNSH - Chăn Nuôi Và Thú Y
Hình 1: Cấu trúc chuỗi ADN và ARN |
Có nhiều thuật ngữ trong ngành di truyền và sinh học phân tử liên quan mật thiết đến ngành chăn nuôi thú y mà các nhà chăn nuôi heo tiên tiến cần biết. Dưới đây là danh sách của 12 thuật ngữ.
Biên soạn: TS. BSTY. Đinh Xuân Phát
Có nhiều thuật ngữ trong ngành di truyền và sinh học phân tử liên quan mật thiết đến ngành chăn nuôi thú y mà các nhà chăn nuôi heo tiên tiến cần biết. Dưới đây là danh sách của 12 thuật ngữ hiện đại được sử dụng trong sinh học phân tử thuộc lĩnh vực chăn nuôi thú y.
1/ Gen (gene):
Là một thuật ngữ hay tên gọi chung để chỉ một phân tử ADN hay ARN mà có chứa thông tin di truyền mã hóa cho ít nhất một protein hoàn chỉnh. Mỗi gen chứa nhiều mã di truyền khác nhau, thường bắt đầu bằng mã di truyền ATG và kết thúc bằng một trong ba mã di truyền TAA, TGA và TAG. Mọi sinh vật và vi sinh vật sống trên trái đất đều có thông tin di truyền được mã hóa bởi các gen trong bộ gen đặc trưng của mình. Trình tự của gen có bản chất ADN bao gồm 4 loại nucleotide A, T, C, G; trình tự của gen có bản chất ARN bao gồm 4 loại nucleotide là A, U, C, G (Hình ADN – ARN).
Mỗi nucleotide của ADN có cấu trúc bao gồm 3 phần (Hình 1, ô vuông đỏ):
- Một trong 4 loại base chứa nitơ có tên là guanine (G), adenine (A), thymine (T), và cytosine (C),
- Một phân tử đường đơn deoxyribose: trên đó base được gắn vào
- Một nhóm phosphate (PO4).
Cấu trúc nucleotide của ARN cũng gồm 3 phần tương tự như trong ADN. Sự khác biệt là ở chỗ: 1/ Phân tử đường đơn trong ARN có bản chất là đường ribose, chứa OH ở vị trí carbon số 2 (Hình 1, vòng tròn đỏ) thay vì H như trong ADN (đường deoxyribose); 2/ base thymine (T) được thay bằng base uracil (U).
Người ta gọi tên các nucleotide theo tên của base là A, T, C, G cho ADN và A, U, C, G cho ARN. Nhưng tên đầy đủ của nucleotide là khác so với tên của các base. Tên đầy đủ của nucleotide là:
- A: adenosine 5’ triphosphate. Hình ‘ATP’ là cấu trúc của một adenosine triphosphate trong một phân tử ARN vì nó chứa đường ribose.
- T: Thymidine 5’ triphosphate
- U: Uridine 5’ triphosphate
- G: Guanosine 5’ triphosphate
- C: Cytidine 5’ triphosphate
2/ Bộ gen (genome):
Là thuật ngữ chỉ tập hợp tất cả các gen của một sinh vật hay vi sinh vật. Mỗi sinh vật có một bộ gen đặc trưng, và mọi tế bào của cơ thể đều chứa một bộ gen giống y hệt nhau. Tùy theo mức độ phức tạp của bộ gen mà bộ gen có thể là một phân tử ADN duy nhất hay là một tập hợp của nhiều phân tử ADN khác nhau. Ví dụ:
- Bộ gen của heo: gồm 38 nhiễm sắc thể (tổng cộng 19 cặp nhiễm sắc thể), so với bộ gen của người gồm 46 nhiễm sắc thể. Bảng 1 cho thấy bộ gen người dài khoảng 3 tỉ nucleotide và mã hóa cho khoảng 30 ngàn protein khác nhau. Độ dài của bộ gen và số lượng protein được mã hóa trên heo chưa được biết rõ (khoảng 2.7 tỉ nucleotide) nhưng nếu lấy chuột làm khung so sánh thì chuột có 40 nhiễm sắc thể, tổng số nucleotide là 2.6 tỉ và mã hóa cho khoảng 27000 protein khác nhau (Bảng 1), thì với độ dài bộ gen đã được các nhà khoa học ước tính khoảng 2,8 tỉ nucleotide, số protein được mã hóa từ bộ gen của heo cũng không dưới 27,000.
Bảng 1. Thông tin về bộ gen của một số loài
| ||||
Tên khoa học
|
Loài
|
Độ dài genome
|
Số gene mã hóa protein
|
Năm hoàn thành đọc trình tự
|
Muỗi
|
278 Mb (278 triệu nucleotide)
|
13.683
|
2002
| |
Sán
|
100 Mb
|
19.000
|
1998
| |
Ruồi dấm
|
165 Mb
|
13.600
|
2000
| |
Người
|
3.2 Gb (3.2 tỉ nucleotide)
|
20,251 (UniProt)
|
Bắt đầu 2001;
Hoàn thành 2006
| |
Mus musculus
|
Chuột
|
2.6 Gb
|
27.000
| |
Lúa
|
420 Mb
|
32.000-50.000
|
2002
|
Bộ gen của virus gây bệnh PRRS là một phân tử ARN duy nhất, có trình tự dài khoảng 15.414 nucleotide, hiện nay được biết là mã hóa cho 10 protein ban đầu. Sau khi được tổng hợp thì 2 protein lớn nhất của virus này được phân cắt thành những protein nhỏ hơn. Phần này sẽ được thảo luận rõ hơn trong chuyên đề về virus gây bệnh tai xanh. GP5 là một trong số 5 protein bề mặt của PRRSV, gen mã hóa cho GP5 dài 603 nucleotide (Bảng 2).
Bảng 2. Trình tự nucleotide của gen GP5 của virus PRRS (dòng Bắc Mỹ, NVSL 97-7895 hay FL12) đã được chuyển hóa thành ADN
|
ATGTTGGGGAGATGCTTGACCGCGGGCTGTTGCTCGCGATTGCTTTCTTTGTGGTG
TATCGTGCCATTTTGTTTTGCTGCGCTCGTCAACGCCAACAGCAACAGCAGCTCTCA
TCTTCAGTTGATTTACAACTTGACGCTATGTGAGCTGAATGGCACAGATTGGCTGAA
AGACAAATTTGATTGGGCAGTGGAGACTTTTGTCATCTTTCCCGTGTTGACTCACATT
GTCTCATATGGTGCACTCACCACTAGCCATTTCCTTGACACAGTCGGTCTGGTTACTG
TGTCTACCGCCGGGTTCTACCACGGGCGGTATGTTCTGAGTAGCATCTACGCGGTCT
GCGCTCTGGCCGCATTGATTTGCTTCGTCATTAGGCTTGCGAAGAACTGCATGTCCT
GGCGCTACTCTTGTACCAGATATACTAACTTCCTTCTGGACACTAAGGGCAGACTCT
ATCGCTGGCGGTCGCCCGTTATCATAGAGAAAGGGGGTAAGGTTGAGGTCGAAGG
TCACCTGATCGACCTCAAAAGAGTTGTGCTTGATGGTTCCGTGGCAACCCCTTTAAC
CAGAGTTTCAGCGGAACAATGGGGTCGTCTTTAG
|
Như vậy, protein GP5 sẽ dài 200 axit amin, vì codon cuối cùng TAG chỉ là codon kết thúc chứ không mã hóa cho axit amin nào. 200 axit amin của GP5 được trình bày trong Bảng 3.
Bảng 3. Trình tự axit amin của protein GP5 của virus PRRS
(dòng Bắc Mỹ FL12)
|
MLGRCLTAGCCSRLLSLWCIVPFCFAALVNANSNSSSHLQLIYNLTLCELNGTDWLK
DKFDWAVETFVIFPVLTHIVSYGALTTSHFLDTVGLVTVSTAGFYHGRYVLSSIYAVC
ALAALICFVIRLAKNCMSWRYSCTRYTNFLLDTKGRLYRWRSPVIIEKGGKVEVEGH
LIDLKRVVLDGSVATPLTRVSAEQWGRL
|
Để biết tên các axit amin trong protein GP5, mời bạn tham khảo Bảng 4.
Bảng 4. Tên axit amin và các chữ viết tắt
| |||
STT
|
Viết tắt 1 ký tự
|
Tên axit amin
|
Viết tắt 3 ký tự
|
1
|
A
|
Alanine
|
Ala
|
2
|
C
|
Cysteine
|
Cys
|
3
|
D
|
Aspartic acid
|
Asp
|
4
|
E
|
Glutamic acid
|
Glu
|
5
|
F
|
Phenylalanine
|
Phe
|
6
|
G
|
Glycine
|
Gly
|
7
|
H
|
Histidine
|
His
|
8
|
I
|
Isoleucine
|
Ile
|
9
|
K
|
Lysine
|
Lys
|
10
|
L
|
Leucine
|
Leu
|
11
|
M
|
Methionine
|
Met
|
12
|
N
|
Asparagine
|
Asn
|
13
|
P
|
Proline
|
Pro
|
14
|
Q
|
Glutamine
|
Gln
|
15
|
R
|
Arginine
|
Arg
|
16
|
S
|
Serine
|
Ser
|
17
|
T
|
Threonine
|
Thr
|
18
|
V
|
Valine
|
Val
|
19
|
W
|
Tryptophan
|
Trp
|
20
|
Y
|
Tyrosine
|
Tyr
|
Tóm lại, gen hay bộ gen đều có bản chất là axit deoxyribonucleic (ADN) hoặc axit ribonucleic (ARN). Gen và bộ gen mang bản chất ARN chỉ có ở một số virus gọi là virus ARN; còn các loài vi sinh vật khác bao gồm cả một số virus, hoặc động vật khác được biết cho đến nay đều có gen và bộ gen mang bản chất ADN. Để có thể làm việc và sử dụng các gen và bộ gen của virus ARN, tất cả các gen và bộ gen của chúng cần phải được chuyển hóa thành ADN bằng kỹ thuật di truyền ngược (reverse genetics). Kỹ thuật này được trình bày trong phần ‘Kỹ thuật di truyền ngược’. Vì vậy, các bài viết kỹ thuật có thể chỉ đề cập đến thuật ngữ gen mà không cần trình bày rõ rằng gen đó có bản chất là ARN hay ADN.
3/ Mã di truyền (Codon):
Là phần mật mã trên gen, có chức năng quy định trình tự các axit amin cho phân tử protein được mã hóa bởi gen đó. Cứ ba nucleotide liên tiếp của gene sẽ quy định cho một axit amin nhất định. Do đó, mã di truyền còn được gọi là mã bộ ba, và tổ hợp ba nucleotide được gọi là một bộ ba mã hoá.4/ Khung đọc mở (open reading frame, ORF)
Gen ở những sinh vật bậc cao như động vật và người thường có chứa phần mã hóa và phần không mã hóa. Vì vậy, gen (có bản chất là ADN) không trực tiếp mã hóa cho protein, mà nó phải được dịch mã thành các ARN thông tin ban đầu (pre-messenger ARN, pre-mARN). Các pre-mARN có thể phải trải qua một số bước xử lý tiếp theo để trở thành các mARN chính thức. Các mARN chính thức chỉ chứa chuỗi mã di truyền, còn phần không mã hóa đã bị cắt bỏ. Mỗi 1 mARN chính thức này được gọi là một khung đọc mở, nó có khả năng mã hóa cho ít nhất một protein. Trình tự mRNA bao gồm 4 loại ribonucleotide là A, U, C và G (Bảng 5).5/ Lập bản đồ gen (gene mapping)
Là việc xác định vị trí tương đối của các gen trên một phân tử ADN hay trên nhiễm sắc thể. Mỗi nhiễm sắc thể là một phân tử ADN rất lớn, chứa trong nó nhiều gen khác nhau.Ảnh minh họa khung cảnh làm việc trong phòng nghiên cứu về gen |
6/ Chọn lọc dựa trên bộ gen (genomic selection)
Là việc chọn lọc bằng cách xác định đồng thời sự có mặt của hàng ngàn gen khác nhau dựa trên chuỗi ADN đặc trưng của chúng để ước tính giá trị về di truyền giống của một cá thể.7/ Chọn lọc dựa trên chỉ thị (marker assisted/aided selection, MAS)
Là quá trình chọn lọc không dựa vào toàn bộ bộ gen, mà chỉ dựa vào một dấu chỉ gián tiếp nào đó. Dấu chỉ gián tiếp này có thể là một tính trạng được biểu hiện trên cơ thể (hình thái, một enzyme, một protein nào đó) hoặc chỉ là dựa trên sự có mặt của một gen, một đột biến gen cụ thể nào đó trong bộ gen). Phương pháp này có thể được sử dụng để gián tiếp chọn lọc một tính trạng di truyền tốt như năng suất, sức đề kháng bệnh, khả năng chịu stress, hoặc chất lượng thịt…).8/ GWAS (genome-wide association study)
Là việc nghiên cứu được tiến hành để đánh giá tác động của mỗi gen trong toàn bộ bộ gen di truyền đối với tác nhân được nghiên cứu. Tác nhân được nghiên cứu ở đây có thể là một loại thuốc, một virus, một vi khuẩn gây bệnh, một tác nhân gây dị ứng…9/ Bản đồ tính trạng di truyền số lượng (Quantitative trait loci, QTL)
Là phương pháp nghiên cứu giúp tìm hiểu cơ sở di truyền của những tính trạng số lượng bằng cách xác định vị trí, số lượng hiện diện của các gen quy định cho chúng trong bộ gen, cơ sở đó sẽ giúp xác định những tương tác của các gen này đối với các gen khác hoặc đối với môi trường. Một mục đích khác của bản đồ QTL là xác định những chỉ thị mang tính chẩn đoán đối với những kiểu hình đặc thù nào đó. Bản đồ QTL sẽ hỗ trợ cho việc áp dụng phương pháp MAS (chọn lọc dựa trên chỉ thị) trở nên có hiệu quả, phục vụ yêu cầu chọn dòng (giống) chống chịu bệnh tật, năng suất cao…10/ Trình tự gen (sequence)
Là chuỗi ADN (bản chất là axit deoxyribonucleotide) hay ARN (bản chất là axit oxyribonucleotide) của gen hay bộ gen. Việc xác định thứ tự và loại deoxynucleotide (A, T, G hay C như trong Bảng 1) trong một ADN hoặc thứ tự và loại nucleotide phân tử ARN (A, U, G hay C như trong Bảng 1) được gọi là kỹ thuật xác định trình tự gen (sequencing). Tuy nhiên, kỹ thuật sequencing hiện nay chủ yếu xác định trình tự của ADN. Để xác định trình tự của ARN, người ta dùng enzyme phiên mã ngược (reverse transcriptase) để biến phân tử ARN thành phân tử ADN. Sau đó, dùng ADN này để xác định trình tự và suy ra trình tự thực của phân tử ARN. Người ta cũng có thể xác định trình tự của các axit amin trong protein bằng phương pháp khối phổ (Mass spectrometry).11/ Đa hình đơn nucleotide (Single-nucleotide polymorphism, SNP)
Là những biến thể khác nhau của cùng một chuỗi ADN (một gen), trong đó, mỗi chuỗi chỉ khác nhau một nucleotide (A, T, C, hoặc G) duy nhất trong toàn bộ trình tự bộ gen (Bảng 6). Sự biến đổi của nucleotide này gọi là một đột biến điểm (point mutation), nó sẽ làm biến đổi một nucleotide tương ứng trong mRNA nhưng còn tùy thuộc vào vị trí của biến đổi đó trong codon mà trình tự protein có bị thay đổi hay không. Đột biến điểm là loại đột biến phổ biến nhất xảy ra với gen hay bộ gen của mọi loài sinh vật trên trái đất. Mỗi một kiểu đa hình đơn nucleotide của một gen được gọi là một kiểu gen.
Bảng 6. Hai trình tự đa hình đơn nucleotide
| |
Trình tự 1
|
ATGTTGGGGAGATGCTTGACCGCGGGCTGT
|
Trình tự 2
|
ATGTTGGGGAGATGCTGGACCGCGGGCTGT
|
12/ Xác định các kiểu đa hình đơn nucleotide của toàn bộ bộ gen (SNP genotyping)
Là việc xác định toàn bộ biến thể của mỗi gen giữa các thành viên của một loài. Nói cách khác, SNP genotyping là việc xác định các kiểu gen của một gen nào đó trong một loài, ví dụ các kiểu gen của gen GP5 của virus PRRS. Trên động vật bậc cao như gia súc và người, một SNP bao gồm một cặp gen (cặp alen) nằm trên một vị trí (gọi là locus) cụ thể trên mỗi nhiễm sắc thể.Tài liệu tham khảo
1. Pig Internatinal, 2013. SNP and modern pig genomic selection dictionary.
2. Nguyễn Thị Lang Duy, 2013. Giới thiệu QTL và bản đồ QTL về di truyền tính chống chịu khô hạn. Duybiotech.
3. Sus scrofa (pig). Genome, NCBI.
4. Nelson L. David and Michael M. Cox, 2008. Lehninger Principles Of Biochemistry. W. H. Freeman and Company, New YorK, USA. ISBN-139: 78-0-7167-7108.
Nguồn: Channuoi.com.vn
Receive articles via Email!