GeneInteraction基因互作:基因相互作用指miRNA、lncRNA、circRNA或其它RNA介導DNA轉錄,從而影響mRNA的表達過程。通俗意義上來說,基因互作關系指基于序列預測的靶基因對。miRNA通過與靶mRNA的結合,或促使mRNA降解,或阻礙其翻譯,從而***目的基因的表達。競爭性內源RNA網絡是靶基因預測的研究深入,簡稱ceRNA網絡。通過進行ceRNA網絡的分析,我們能從一個更為宏觀的角度來解釋轉錄體如何構建基因表達調控網絡,從而進一步挖掘基因在其中的調控機制。基本原理:miRNA主要通過與靶基因的非翻譯區(UTR)結合而發揮其作用,對miRNA和mRNA、lncRNA、circRNA結合進行的預測稱為靶基因預測。靶基因預測使用軟件根據miRNA和靶基因間的結合的規律預測結合基因對。在生物體內,miRNA可以通過與proteincoding特異性結合,影響相關基因的表達,從而參與調控細胞內的各項功能。ceRNA具有miRNA結合位點,能后競爭性地結合miRNA,***miRNA對靶基因的調控。例如lncRNA與miRNA競爭性結合,影響miRNA調控mRNA的過程,**終導致的mRNA表達失調。我們使用基于序列預測的軟件對差異分析得到的miRNA與mRNA,lncRNA,circRNA進行靶點預測和ceRNA網絡分析。 多鏈條批量處理、快速獲得研究靶點。北京生物/藥物信息學分析數據科學活動
**突變頻譜分析(突變模式):目的:輸入突變數據,用非負矩陣分解方法NMF分析突變特征,描述樣本集的突變模式。什么是突變模式:這也是對TCGA數據的深度挖掘,從而提出的一個統計學概念。文章(Signaturesofmutationalprocessesinhumancancer)研究了30種**,發現21種不同的mutationsignature。如果理解了,就會發現這個其實蠻簡單的,他們并不重新測序,只是拿已經有了的TCGA數據進行分析,而且居然是發表在nature上面!文章研究了4,938,362mutationsfrom7,042cancers樣本,突變頻譜的概念只是針對于somatic的mutation。一般是對**病人的**組織和*旁組織配對測序,過濾得到的somaticmutation,一般一個樣本也就幾百個somatic的mutation。還有其它文章(Mutationalsignatures:thepatternsofsomaticmutationshiddenincancergenomes)也是這樣分析的從2013年提出到現在,已經有30種mutationsiganures,在cosmic數據庫有詳細記錄,更新見:MutationalSignatures。它的概念就是:根據突變上下文分成96類,然后每類突變的頻率不一樣畫一個條形圖,可視化展現。應用場景:突變特征定義:體細胞突變是多個突變過程如DNA修復缺陷,暴露于外源或內源誘變劑等綜合結果。 山東生物/藥物信息學分析數據科學口碑推薦軟硬件配套,完成數據收集、整理、檢索、分析與智能化開發工作。
**初目的:對手上的**樣本(或病人)進行分型分析,期望找到不同的亞型,并對應不同的臨床特征。可擴展應用到:所有樣本的亞型分析,用于樣本的特征分析。數據可用轉錄組、基因組、甲基化、蛋白質組等。輸入數據格式:一個數值矩陣,行是基因或者其他特征,列是樣本。本分析要求樣本數要多,有利于亞型的分析。參考文獻:(2)::本文利用室管膜瘤病人的甲基化數據,首先進行了tSNE分型,隨后又采用了新的方法spectralclustering進行分類分析,作者比較了兩種分類方法。使用spectralclustering的分類,鑒定了每一種**亞型的特異性表達模式。并且發現spectralclustering的分類和病人的臨床特征有關,從而提出一種新的室管膜瘤亞型,可用于臨床的篩選和檢測。
單細胞測序數據挖掘:GEO目前收錄的單細胞研究樣本已經超過2萬例,單細胞測序幾乎成為生物醫學領域CNS***文章的標配。實驗費用高昂,阻斷了CNS夢,既然其他數據可以挖,單細胞測序數據照樣可以挖。已知公共數據庫中單細胞測序數據涉及各種疾病類型,包括**、免疫細胞、炎癥類甚至神經、肌肉、骨骼等,樣本豐富、數據龐大,你不挖就是失去了一座金山。我們提供各種設計單細胞測序、各種測序、芯片、多組學的公共數據庫挖掘、培訓、模型構建、臨床統計、算法還原服務;你能想到,我能做到;你提供參考文獻、思路和目的,我們提供結果;如果沒有思路,我們提供付費科研設計服務。示例如下:利用公共數據庫的1539個單細胞樣本,構建自己的生物學故事。 按照斯普林格學術規范化處理準則提供文稿同行**投稿前意見評估。
棒棒糖圖是直觀顯示蛋白質結構上的突變點**簡單且有效的方式。許多致*基因具有比任何其他基因座更頻繁突變的優先位點。這些位點被認為是突變熱點,棒棒糖圖可以用于顯示突變熱點以及其他突變位點。并可以對比不同**/亞型的突變位點。
基本原理
將蛋白質結構根據氨基酸順序繪制為長條形,以不同色塊標注不同結構域,在基因突變導致氨基酸改變的位置標注棒棒糖,并在棒棒糖圓球標注位點的突變頻數以及突變位點。
數據要求
基因突變或者蛋白質突變數據
下游分析
1、突變位點靶向藥物分析
2、驅動基因突變分析 檢測服務及數據分析助力取得2020年國自然面上十項、青年基金十八項。山東生物/藥物信息學分析數據科學口碑推薦
OmicCircos圖可以對感興趣的多個基因,展示其染色體的位置、拷貝數變異等多個特征。北京生物/藥物信息學分析數據科學活動
GSVA(基因集變異分析,反映了樣本和感興趣的通路之間的聯系):GSVA全名Genesetvariationanalysis(基因集變異分析),是一種非參數,無監督的算法。與GSEA不同,GSVA不需要預先對樣本進行分組,可以計算每個樣本中特定基因集的富集分數。換而言之,GSVA轉化了基因表達數據,從單個基因作為特征的表達矩陣,轉化為特定基因集作為特征的表達矩陣。GSVA對基因富集結果進行了量化,可以更方便地進行后續統計分析。如果用limma包做差異表達分析可以尋找樣本間差異表達的基因,同樣地,使用limma包對GSVA的結果(依然是一個矩陣)做同樣的分析,則可以尋找樣本間有***差異的基因集。這些“差異表達”的基因集,相對于基因而言,更加具有生物學意義,更具有可解釋性,可以進一步用于**subtype的分型等等與生物學意義結合密切的探究。 北京生物/藥物信息學分析數據科學活動