2008年10月18日

簡介人類基因體計畫


在我們開始講述人類基因體計畫之前,有必要把一些必要的基礎知識先講清楚。

生物的最小功能單位 -  細胞。細菌的細胞屬於沒有細胞核的原核細胞,而真菌,原生生物,植物和動物的細胞則屬於具有細胞核的真核細胞。






不論有沒有細胞核,細胞中的遺傳和生化訊息都是儲存在DNA分子之中。DNA分子上一個能夠轉錄出RNA的片段稱為基因。由DNA轉錄出RNA,而RNA又轉譯成蛋白質的過程,稱為分子生物學中心法則。一個基因的產物(RNA或蛋白質),是一個能夠在細胞中與其他的分子產生交互作用來執行生化任務的分子。

既然所有生物的遺傳和生化的訊息都含藏在基因之中,那麼,若是我們可以了解所有的基因,靠著解讀由基因所寫成的這本生命之書,必然可以使我們對於生物的各種現象(包括,發育,生長,老化,疾病等等)有更深入且基礎的理解。

基因體計畫,就是針對這個終極目標 - 了解各種生物現象的原理 - 而發展出來的。人類基因體計畫,目標就是要了解人類所有的基因以及所有非基因的DNA片段,藉著這樣的研究,當然能夠使我們對於人類這種動物有更清楚的了解。

二十世紀有三個龐大的科學計畫,對人類社會造成深遠的影響。這三個計畫是:阿波羅人類登月計劃 - 開啟人類太空探索的新頁;曼哈坦原子彈計劃 - 開啟原子能應用的首頁;除此之外的第三大計畫便是人類基因體計劃 - 了解生而為人的奧秘的第一步。

「人類基因體計劃」(Human Genome Project)是由美國、英國、法國、德國、台灣、中國與日本等國科學家所組成的龐大團隊,其經費大部份來自美國聯邦政府的「國家衛生研究院」(NIH)與英國的「衛爾康基金會」(WellcomeTrust)。另外,「賽雷拉公司」(Celera Genomics)則是由科學界的傳奇人物文特博士所創立,在一九九八年以異軍突起之姿投入破解人類基因密碼的競技場,而且成果斐然。

文特博士以非政府的民間人士成立賽雷拉基因公司。他提出不同於當時主流想法的技術進行基因體的定序工作。所謂定序,就是決定DNA上含氮鹼基的排列順序;比如ATGUTGCGCCCA,像這樣的一段文字,在DNA上就稱作是一個序列。每一個基因,都有屬於自己的序列,因此定序的工作在基因體計畫中是非常重要的。文特博士提出了新的技術來定序,並且認為可以利用超級電腦來幫助基因的定序工作。雖然,他的異軍突起在當時並不受到主流的認可,但往後的發展證明他的方向是正確的,並且他的方法加速了基因體計畫的完成。

基因體計畫繪製了人類的基因圖譜,但是繪製人類基因圖譜只是破解人類基因密碼的基礎,科學家必須進一步確認人體所有的基因、了解基因的功能與控制方式、基因與人體生理以及疾病的關聯,然後才能開發出嶄新的藥品與治療方式,其成果將為人類醫學與文明帶來革命性的進展與衝擊。 

底下,我們更進一步來了解人類基因體計畫的內容。

在真正談到基因體計畫之前,有必要再補充一些基礎的知識。

細胞內的DNA平時是以鬆散的結構飄在細胞核之內,只有當細胞要進行分裂的時候,DNA分子開始緊密的纏繞,形成棒狀的結構,這些棒狀結構稱為染色體。人的細胞內共有22對體染色體和一對性染色體;女生為XX而男生為XY。染色體使用特殊藥劑染色之後會出現深色條紋,這些條紋區域通常與基因的位置有相對關係。染色體通常會有兩個“臂“,較短的p臂和較長的q臂,因此基因的位址通常是以某臂的某染色區域來定位,比如7q31.2。 人類基因體計劃已於2003年完成;而人類23對染色體的DNA當然是定序完成的了,因此,絕大多數基因的位置已經確定。

人類基因體計畫的結果是讓人吃驚的。人類基因體計畫發現,人類染色體上的基因只有三萬多左右,這比科學家們原先預期的,人類細胞可能包含十萬左右的基因低了很多。不只如此,令人驚訝的發現,人類的基因數只比低等生物線蟲多了三分一;對果蠅而言,就僅有其數目的二倍而已!

我們總以為,人類遠比線蟲和果蠅的構造來得複雜,應該具有比他們多上許多倍的基因數目。然而,基因體計畫的結果顯示,我們的複雜性似乎不是建立在基因的數目,而是在於如何使用這些基因!

基因體計畫另外一個讓人吃驚的結果是,基因只佔人類基因體的小部份;基因約佔整個基因體(所有的DNA)的1.5%!

每一個人類細胞中的DNA 總長度大概為六英尺長,然而只有一吋長的DNA被用以組成影響整個生命現象的基因!也就是說,近乎百分之九十九的DNA並不參與基因的建構,在生命現象中,這些閒置的DNA 扮演什麼角色? 這些非基因的DNA片段是什麼呢?

非基因的DNA片段主要有四大類:

(一) 在基因中的非編碼序列(內含子,noncoding region):人類基因中,常被一些非基因序列或稱為非編碼序列所分割開來。這些參雜在基因密碼中的非基因序列就稱為內含子(introns)。在基因體中,有百分之二十四的序列是屬於內含子,而基因本身的序列就只有百分之一至一點五而已。

(二) 結構用的DNA序列:在染色體上有一部份稱做中心體或稱著絲粒(centromere)的DNA,其作用是組成一個構造平台讓微管(microtubule)附着後,用以在細胞分裂時撁引染色體到細胞的兩極。在染色體未端有一稱為端點(telomeres)的構造,可讓聚合酶附着後促進DNA的複製。這個區域稱為異染色質(heterochromatin),此結構約佔人類基因體總長百分之二十。
(三) 重覆序列:分散在染色體中有很多簡單的重覆序列(simple sequence repeats, SSRs),通常是二、三個核苷酸作千次以上的重覆出現,如 CA 或CGG的不斷地重覆。SSRs約佔人類基因體的百分之三。也有其他類形的重覆序列,其長度約為基因體的百分之七。總之言之,約有百分之十的基因體序列是屬於重覆序列的。

(四) 轉位子序列: 轉位子是屬於一些能在染色體間移動的DNA序列,而此序列的總長約為基因體的百分之四十。在微生物中,常含有很多種類不同並有活性的轉位子,在生物進化的過程中,轉位子是扮演重要基因重組的色,為什麼在人類基因體中含有大量的轉位子序列,其原因何在?還有待研究。

轉位子的發現是一個有趣的故事。最初,轉位子被發現是來自於玉米色斑的研究。從事這項研究的科學家芭芭拉·麥克林托克更因此獲得了諾貝爾生物醫學獎。

麥克林托克是一位儕輩眼中特立獨行的科學家。

麥克林托克在一九五一年發現跳躍基因(轉為子,轉位因子),這項發現造成很大的衝擊,但是這衝擊是負面的。遺傳學數十年來的發展,已經確立了基因在染色體有固定排列順序的觀念。麥克林托克的發現指出有些基因可以從一處跳到另一處,而且她的證據又不是直接可見的,是從一系列非常複雜難懂的實驗結果所推演出來的。

一項可能造成科學發現未成熟的因素,就是缺少公開認知。一項新發現鮮為人知的原因可能是發現者本身就鮮為人知。遺傳學之父孟德爾就是個例子。這在資訊傳播不發達的時代特別重要。另一個原因是發現者本身的個性保守,不善於宣揚。但這兩點都不適用於麥克林托克身上。當時她已經是個著名的遺傳學家,處在當代生物學重鎮的冷泉港(Cold Spring Harbor Laboratory),她也非常地主動出擊(在被潑了幾次冷水之前)。

那麼麥克林托克的發現為何會未成熟呢?主要的原因還是它與當代的學問無法掛勾,以及她與當代的主流生物學家無法溝通。前者雖然也一定受後者影響,但卻是屬於比較客觀的事實。有時候學術界對一項新發現,的確不知道如何是好。新發現有時不是不對,也不一定是不重要,而是不知道如何將它嵌入現有知識的牆上。

一九四四年,艾弗里(Oswald T. Avery, 1877-1955)提出DNA是遺傳物質的論證,也不是不為人所知,也沒有人說它不重要;但是那時的遺傳學家(包括艾弗里本人)好像對它不知怎麼辦才好,不知如何將這發現往下發展,因此有好幾年都無法產生影響。這很像一支大槌子揮擊下去,沒有承受的東西的話,也是沒有衝擊。

麥克林托克的轉位子是支槌子擊到反彈性很強的大鐵板。使問題惡化的是麥克林托克的研究與當代潮流之間的鴻溝。分子生物學的崛起與麥氏的科學事業發展幾乎完全平行,而分子生物學的聖殿剛好是她後半生涯工作地點 - 冷泉港。

我們可以從這裡切入麥克林托克故事所啟發的第二個重要課題---她的研究風格與當代潮流的不同。我想當時分子生物學的鼻祖人物戴爾布魯克(Max Delbruck, 1906-1981)是個很好的對比。或許我們可以說,麥克林托克是代表將傳統遺傳學發揮到極致的末代人物,戴爾布魯克則代表將物理學成功引入遺傳學的先知。

正當舊式遺傳學仍舊局限於用顯微鏡觀察細胞裡的染色體和用肉眼觀察生物體的表徵變化的研究瓶頸時,以戴爾布魯克為首的一群科學家(其中很多物理學家及化學家)挾著二十世紀新物理學及新化學的輝煌成功的餘威,步入傳統生物學(特別是遺傳學)的領域。他們堅信,生命現象不但可以用物理及化學原理解釋,而且可以用物理學及化學實驗技術來研究。現在回顧起來,這新學問(分子生物學)的成功幾乎是不可避免的。在這新潮流的澎湃發展中,麥克林托克仍一直堅守自己非常「私人的」研究方式,最主要原因可能是她個人的執著。但是即使是她有心求變,當時分子生物學的技術仍然無法用在像她所熱愛的玉米這樣「高等」的生物上。

新興的分子生物學的技術是非常物理,非常化學的,而且大部分的技術都是一般實驗室可以做得到的,因此非常講究「再現性」---也就是說,如果你的發現是真的話,那麼借他人之手應該也可以重新證實這項發現。麥克林托克的玉米研究不是普通人所能夠或者願意去嘗試「再現」的。光光要了解她的研究已經不容易了。相反地,分子生物學的技術不只是容易了解,而且不停有新的突破。傳統的細胞遺傳學就沒有這種便利。麥克林托克所依賴的光學顯微鏡,總是無法突破一千倍放大率的理論極限。

分子生物學的另一特色是它的實質性。基因不再是個數學操演的單位(如在孟德爾的定律中),也不是個一串鏈子中的珠珠(在後來的觀念中),而是一個有一清二楚化學結構的分子,因此很多生物學的發現都有實質上的證據,不容置疑。分子生物學家後來在細菌及果蠅發現轉位因子時,就掌握了生物化學的證據。如果當卑麥克林托克掌握有玉米轉位因子的分子印證,她的理論就不會遭受到如此多的非難,而且她的發現會很快他對新遺傳學的走向產生很大的影響。不過這是完全不可能發生的假想,只是提出來比較一下。

麥克林托克的獨行俠風格與當時領導分子生物學的「噬菌體集團」的開放作風,也是強烈的對比。有趣的是兩者部以冷泉港為基地。「噬菌體集團」大力積極推動分子生物學的結果,造成桃李滿天下的局面。反觀麥克林托克,了解她的人少得可憐,更別談真正接她衣缽的。在回顧近代生物學歷史的書籍文章中,我們常看到「噬菌體集團」的活動照片,無論是一群人非常不拘束地擠在斗室中討論交流,或者坐在草地上曬太陽,或者兩位大師打赤膊翹著腿乘涼,流露出人與人之間的活躍自在,又具高度刺激性的互動。

麥克林托克比孟德爾幸運。她於一九九二年去世時,已經九十歲,不但在有生之年看到自己「未成熟發現」成熟,而且受到肯定,並造成深遠的影響。她於一九八三年獲得諾貝爾獎,距離她發表轉位子的發現也已經三十二年了。同一年,她所描述的「解離子」(dissociator)及「啟動子」(activator)轉位因子也被分子生物學家分離出來。

(以上文章片段摘自「玉米田裡的先知」凱勒(Evelyn Fox Keller)著,唐嘉慧譯,天下文化出版。)

轉位子大充滿了基因體中的事實更讓我們認識到, 人類基因體是一個動態的組織,整個基因體都佈滿了DNA 轉位的痕跡。偶然我們才遇到一個有編碼的基因(約少於百分之一的DNA為基因序列),似乎,基因的組合在整個基因體的角度看來是微不足度的。在研究基因體的過程中,我們應體會到,基因體只不過是一個過渡的機構,因為整個機構似乎不斷地製造更多的DNA。雖然,我們迷失在各種序列的圖譜中,然而,三萬個人類基因已可以發揮了無比完備的工作以構成人類複雜的生命現象。

美國官方主導的國際「人類基因體計劃」與美國民間「賽雷拉公司」,在2001年1月全球五大城市共同發布他們解讀人類基因體的最新成果,而兩者含括人類基因體定序初稿與其解析的研究報告也分別刊載於「自然」與「科學」雜誌。 這兩份研究報告雖然運用的方法不同,但結論大致相近,其中有幾項發現最受矚目:人類基因的數目遠少於以往科學界的預估(十萬個),大約只有三萬到四萬個,僅僅是果蠅、線蟲等低等生物的兩倍多。而且與老鼠比較,人類只有三百餘個基因是老鼠身上找不到的。「人類基因體計劃」的領導人柯林斯說:「這對我們人類的自尊是個打擊,不過這也顯示了人類的複雜性來自其他源頭,我們必須開始搜尋。」

除了人類以外, 截至今日,進行中的基因體解碼計畫有4095個,而有862種生物的基因體已經被定序完成;這些生物包括一些微生物, 病原體,高等植物,哺乳動物,甚至與我們相近的靈長類。

各種物種基因體陸續的被解讀出來,現在,我們稱這個時代為「後基因體時代」。後基因體時代,由於我們對於基因的了解更加的透徹,因此它促使了生物技術,醫療等各方面發展更快速。同時,不同物種的基因體之間的關係,更透露出演化的蛛絲馬跡。在往後的課程中,將陸續的介紹生物技術以及人類演化的故事。