俄羅斯圣光機大學(ITMO)生物信息學研究人員開發(fā)了一種算法,可幫助評估基因?qū)θ梭w過程(包括疾病發(fā)展)的影響。這項研究發(fā)表在《BMC生物信息學》上。
脫發(fā)、肥胖或視力低下可能與特定基因有關,識別出相關基因組,有利于研究和治療。此外,為確定基因和病情之間是否存在聯(lián)系,了解基因之間的相互作用也非常重要。
ITMO助理教授愛列克謝·謝爾蓋西切夫解釋說:“總的來說,每個人有超過2萬個基因。通過將患者病情相關基因與健康人的基因進行比較,我們可以看到二者之間活性和表現(xiàn)形式的差異?;诖诵畔?,可以創(chuàng)建一個共同的圖示,顯示所有基因之間的相互聯(lián)系,并且每個基因都被分配一個權(quán)重因子。通常,科學家們只繼續(xù)研究最活躍的基因,對其進行特殊的子圖繪制,但是將這些基因從‘普通背景’中分離出來,就失去了評估每個基因與其他基因的關聯(lián)性進而進行診斷的機會。”
在新研究中,研究人員不僅專注于權(quán)重因子最高的那個基因系統(tǒng),還提出了一種新方法,可利用整個基因組上的數(shù)據(jù)生成數(shù)十萬個子圖。該算法基于馬爾可夫鏈蒙特卡羅方法,可計算每個樣本與所討論病情之間的聯(lián)系概率,并就每個基因之間的相互作用分析樣本的組成。
研究人員從一組基因中刪除一個基因,如果活躍基因的數(shù)量增加,則表示正確并保存結(jié)果。否則就重新開始。通過一系列步驟,權(quán)重因子開始快速增長。這樣一來,該算法就可以生成大量圖形。
有了這樣一個樣本組,研究人員就可發(fā)現(xiàn)比其他基因更頻繁出現(xiàn)的基因。如果一個基因出現(xiàn)在90%的此類子圖中,那么就可90%地確定該基因與相關疾病的關系。
該項目研究人員指出,這一算法未來可表示為帶有滑動條的程序,允許用戶出于各種目的以各種置信度生成結(jié)果。例如,置信度水平越低,顯示的基因就越多,反之亦然。如果僅需要確定信任的基因,可以將置信度水平設置為約99%。
標簽: 基因組