每多一分正確的資訊,都對防疫多一分幫助。防疫如作戰,當下最關鍵的資訊是什麼?

NGS  

 

我們要對抗狂犬病毒,就要了解它的來歷與特性,大致的作法,如前文所述,要先知道來自台灣鼬獾與錢鼠的狂犬病毒的基因序列;然後闡明它們的親緣關係,看看它們是何來頭?之後作序列比對,尋找可能的突變,對病毒表現造成的影響;最後測試這些改變對疫苗效力,以及病毒毒性的影響(最後這點未必要全做也不用等前三個步驟完,可以先做)。

狂犬病毒的浪漫ㄈㄈ尺之旅:從狗狗到鼬獾

 

台灣農委會超過一週之前,就宣佈台灣鼬獾與錢鼠的狂犬病毒被定序成功,卻遲了一週,才在各方催促下交出報告。這份家衛所的報告,給人的感想只有四個字:“garbage in, garbage out”,翻譯:“用低品質的垃圾資料,得到錯誤的垃圾結論”。

台灣分離之狂犬病病毒序列分析資料

 

* 狂犬病毒的基因定序

 

複習一下,作狂犬病親緣分析的時候,常用兩個基因,N和G來畫樹。以前的作法,多半是利用PCR(這個技術太基本了,不解釋)釣出長度幾百到幾千個核苷酸長的基因,再用傳統的化學法定序。但隨著科技進展,新發明的“次世代基因定序”(Next Generation Sequencing)讓速度突飛猛進,即使定序整個基因組(genome)也花不了太久的時間,何況狂犬病毒不過區區一萬兩千核苷酸長,要定序是很快的。

 

然而狂犬病毒基因組實在有夠短即使不用這麼先進的方法,用傳統的做法來定序全基因組也不成問題。不久前這篇中國的論文(Zhao et al., Genome Announcements, 2013),就用傳統方法全部定序了“JX09-17(fb)”這株在鼬獾採到的狂犬病毒。這株病毒也是我前文提到,2010年那篇論文(Zhang et al., Virus Research, 2010)的主角,它在G基因上帶有6個明顯的點突變,而且和其他鼬獾型狂犬病毒是獨立起源,意謂中國的狗至少有兩次把病毒傳給鼬獾。

 

complete genomic sequencing of rabies virus      

 

台灣這次的定序,應該也没用到“次世代基因定序”這麼先進的技術,即使只用傳統的PCR,要定出一兩個基因的整段序列,也不是什麼困難的事。中國論文的結果是這樣的:病毒全長11923 nt,N基因長1353 nt,G基因長1575 nt(nt = nucleotide,核苷酸的縮寫)。台灣這次的報告則表示,用來畫樹的N基因長389 nt,G基因長768 nt……等等,為什麼人家的N基因一千三,台灣卻不到四百?人家G基因長快到一千六,台灣不到八百?是台灣的病毒變異超大嗎?

 

當然不是台灣的病毒跟人家差這麼多,而是台灣定序的品質有問題,所以應該超過一千三的N基因,台灣能確定的範圍只有389 nt,還不到全長的三分之一,G基因也只能確定全長一千六的一半768 nt。為什麼定序結果這麼差?我們看看定出來的片段在哪N基因全長1353 nt,台灣公佈的序列389 nt,位於958到1346,位於基因尾端三分之一。G基因全長1575 nt,台灣公佈的序列768 nt,介於124到891,位於基因前端一半

 

問題出在哪裡?定序時會從基因的開頭或尾巴開始定照理說一個長度一千多 nt 的基因,分別從頭尾開始定,然後把頭尾拼起來要完整定出整段序列並不難,然而台灣這個定序結果,顯然N基因只從尾巴讀到三分之一,然後就後繼無力,沒法取得更長的資訊,另一邊從頭卻什麼都沒有讀到(不可能真的是沒做吧?)G基因也只從頭讀到前面的一半,更長也是後繼無力,另一邊從尾巴讀,也是什麼都沒讀到

 

比較可能的原因是,取樣的病毒品質不佳,畢竟鼬獾是死掉後才被送來檢驗,雖然可以測出病毒存在,但要定序,病毒的品質一定要夠好,做出來的結果才可信也許之前從死亡鼬獾取得的病毒,品質不夠好到能可靠的全部定序平時用PCR釣出序列放大,然後用化學法定序,的確只讀一邊就可以,然而即使只讀一邊,連四百個 nt 都讀不到,效力也弱的過份,我猜,操作人員和機器沒問題的話問題多半是出在樣本的品質,品質不好,實驗技術再好,儀器設備再先進,都沒辦法得到令人滿意的結果

 

這裡衍生出一個疑問,假如定序出來結果不夠可信,那些之前農委會公佈的“相似度”百分之幾又是怎麼比出來的?這真是天曉得(應該是直接用那些殘障序列算的),現在當務之急是,趕快上山抓活的鼬獾,取得牠們體內活跳跳的新鮮病毒,再做定序,才能真的解決這個問題,否則用這種garbage資料,誤差會很大。

 

中國2009年的論文(Zhang et al., Emerging Infectious Diseases, 2009)提到他們是怎麼做的:

badger hunter  

簡單說就是請獵人上山捕捉。照理說這件事在一週前定序結果出來,可信度是這麼悲慘的狀況下,早就應該做了,竟然還拖過一週才有動靜,要是真是打仗,以這等應變速度,我們早就通通陣亡了。

 

** 台灣狂犬病毒的親緣關係

 

好了,雖然基因定序品質很差,死馬當活馬醫,硬是要做親緣關係還是可以,台灣的農委會也真的這麼做了,但給出來的結果,簡直把台灣做演化研究的人,面子通通丟光了(這回台灣被中國完敗,徹底完敗)。

 

不用寫過論文,光是看過論文的人也知道(我猜大學生上台報告就知道了吧!),擺一個圖至少要有圖說(figure legend),解釋這張圖的意思;表中引用的資訊,要列出資訊來源(reference);另外好歹要列方法(method),不然天知道是用哪個程式跑的,還是三太子托夢夢到的?什麼資訊都沒有,這兩張圖的意義,還真的要三太子托夢才能理解。

 

這兩張圖沒寫的已經一堆問題,寫出來少少的東西也是問題一堆,畫樹的錯誤取樣法先不提,先看右上角那個大大的“389bp”和“768bp,我不是要挑毛病說數字和英文中間要空格這麼基本的錯誤啦,我只是要講,狂犬病毒是 ssRNA病毒,它的核苷酸只有單股(single strand = ss)而非雙股(double strand = ds),所以描述時不能講“bp(base pair),只能用“nt,這個大學一年級應該都知道

 

WTF N gene tree  

沒方法,沒說明,沒資料出處的殘障N基因序列

 

WTF G gene tree  

沒方法,沒說明,沒資料出處的殘障G基因序列

 

最後的結論更是犯了親緣分析時最基本的錯誤,為什麼結論是“台灣的病毒與中國最接近”?廢話,因為只比中國跟台灣的樣本,當然是中國跟台灣最接近!為了淡定一點,先來簡介樹到底是什麼意思,怎麼做出來的。

 

WTF result of TW government  

 

作親緣分析,就是比大家的親疏遠近,比方說,二等親和五等親比,自然是二等親比較親,但可以說二等親和我最接近嗎?其實還有一等親比二等親更親,所以親疏是“相對”的,只比兩個樣本時,當然是兩者互相最接近對方,但不代表兩者真的最接近。

 

演化樹就是比較大家的親疏之後,把關係用線條畫出來。不同方法(例如maximum likelihood與neighbor joining)會用不同的性質作比較,所以不同方法與條件,畫出來的樹會有出入,而親緣關係的表達,可以由樹型(topology)得知,這裡只講最簡單的。

 

例如,這個樹型顯示,AB的共同祖先與C、D的共同祖先,在古早就已經分開,所以B和C、D沒有直接的關係

B and CD evolve independently  

 

又例如,這個樹型顯示,A先演化出BB再演化出C、D,所以B和C、D有直接的關係

B and CD evolve related  

中國的鼬獾病毒來自於狗假如台灣鼬獾的病毒來自中國鼬獾,A會是離比較遠的動物(例如加拿大狗)B會是中國狗C、D分別是中國與台灣鼬獾

 

農委會報告公佈當天,馬上有人(我不會承認他就是教我分子演化的老師,因為我都翹課)自己拿那些殘障序列,加上其他地區的樣本,一起做了一棵更加可信的演化樹。這棵樹完全推翻了農委會“台灣鼬獾狂犬病毒和中國最接近”的garbage,反而指出,台灣的鼬獾型狂犬病毒與中國的鼬獾型狂犬病毒,中間隔了菲律賓狗和中國狗,這個結果證明這次感染台灣鼬獾的狂犬病毒,並非來自中國(否則應該會和中國鼬獾分成同群)。

台灣鼬獾狂犬病毒從中國鼬獾來? 恐怕不是這樣!

 

phylogenetic tree of fb and dogs 1st  

 

台灣鼬獾取自三個地區的樣本,又可以分成三個小群,這暗示這型病毒已經在台灣獨立演化一段時間(或是三次獨立傳入台灣),至少不可能是最近兩三年內才出現,否則序列應該很像,不會差這麼多。然而由於這是用N基因三分之一不到的殘障序列得到的結果,所以仍需更多更完整的資訊,才能正確判斷。(趕快去山裡抓完整的序列回來啊!)

 

A and CD evolve independently  

情形是A是台灣鼬獾,B是菲律賓狗C、D分別是中國狗與中國鼬獾。很明顯,台灣與中國的鼬獾是獨立演化出來的

 

隔天又加入更多地區的序列作分析,得到一致的結果。這個結果相當有趣,因為眾所皆知,台灣的狗狗已經很久沒有狂犬病毒了,所以台灣鼬獾的病毒到底是哪裡來的?中國過去20年爆發3次鼬獾狂犬病,也已經證實鼬獾可以作為“保毒動物”,與病毒共生而不發病。

為什麼我們認為台灣鼬獾狂犬病毒並非直接來自中國鼬獾?

 

phylogenetic tree of fb and dogs  

 

目前比較可能的故事是,台灣鼬獾在很多年以前就得到狂犬病,並成為保毒動物(比中國更早?),一直維持到最近兩年。最近不知道是什麼原因(環境改變或病毒突變或其他),病毒突破鼬獾,使鼬獾由保毒動物轉變為“病媒”,開始發病並且散佈狂犬病,並難得的感染錢鼠。然而,由於目前我們只有殘障序列,所以一切進一步的推論都僅供參考,有幾分證據才能說幾分話。

 

上頭那個分析,列入世界各地已知的狂犬病毒序列,作出來的結果應該更加可靠,然而中國鼬獾的病毒至少有兩個起源,那個分析有個潛在的問題是,它沒有加入中國另外那株很特殊,獨立演化的鼬獾型狂犬病毒“JX09-17(fb)”。我比了一堆論文使用的樣本,不過沒辦法確定假如把它加進去,會落在樹的哪個地方,我猜它會跟中國狗分在同群,但假如要徹底消除疑慮,還是要把它加進去,和完整的台灣病毒重新計算才行。

 

沒有完整的基因序列,就不能作出明確的親緣關係,也就沒辦法比對序列,尋找可能的特殊突變,換句話說,我們就沒辦法徹底了解台灣狂犬病毒,提出正確的因應對策。之前農委會沒有及早警告狂犬病來襲,還有科學上的正當理由(誰想得到?),然而自從疫情爆發之後,相關政府單位的處理,簡直是把國軍五大戰技-“推拖閃躲飄”,發揮到了極致。

 

We are Borq Resistance is futile 3  

 

做完基因定序,拖了一週,還特別等到下班閃人後才公佈,結果出來是個殘障序列,定序品質笑死全世界;還用錯誤方法畫演化樹,丟盡台灣演化界的臉。這種荒唐程度,和外交部開記者會控訴菲律賓警察殺人,投影卻直接投在人的臉上一樣荒謬要不是有人搶時間作出正確的結果,誰知道農委會這個錯誤的結論會帶來多糟糕的影響?身為科學家,沒有專業,沒有榮譽,只會搞政治小動作,和那些不能打仗的台灣軍人有什麼兩樣?

 

榮譽是用專業表達的,不是掛在口頭上講的要得到別人的尊敬,就要拿出該有的專業

 

對疫苗有興趣的可以去看聖兔的文章:

狂犬病疫苗知多少

 
arrow
arrow

    網路艦長日誌 發表在 痞客邦 留言(1) 人氣()