天天看點

生信自學筆記(一):概述

想涉獵生物資訊學已經很久了,隻是苦于平時作業繁重,沒有連續的時間坐下來好好學習。好不容易捱到暑假,是時候補一波知識了。

自學教材:《生物資訊學》(樊龍江主編)

當初在圖書館找教材,找了好幾種,出版社不同,年代不同,裝幀風格也非常不一樣。迷茫的我就去請教了研究所學生師姐,然鵝她說課本這種東西都是大同小異的,于是我果斷選了顔值最高同時也是出版最新的一本書 (2015 應該算是很新的了)。現在想想,可能還有一個因素是因為這是浙大的老師寫的,雖然因為自己水準菜沒去成,但所謂 “雖不能至,心向往之”,或多或少還是有一絲執念吧。

課本的第一部分就是對這門學科的介紹,寫得很清晰,看起來也頗有意思,濃縮一下,大概就是這麼幾句話:

  • 分子生物學研究的飛躍帶來了生物資訊的劇烈膨脹,并形成了巨量的生物資訊庫,促成了生物資訊學這一全新研究領域的誕生。
  • 生信的研究對象即生物資訊包含有多種類型,如分子序列資料、蛋白質二級結構和三維結構。它們直接構成了初級資料庫。而根據這些資料建立起來的功能區、二級結構、疏水位點等等,構成了所謂的二級資料庫。
  • 生信的主要内容可以概括為:新算法和統計學方法研究 + 各類資料的分析和解釋 + 研制有效利用和管理資料的新工具。
  • 生信的具體研究領域有:序列聯配、基因預測、基因組拼接、藥物設計和篩選、蛋白質結構預測、基因表達和蛋白質互作預測、全基因組連鎖和進化分析等。
  • 生信研究的基本思路是和生物學的基本思路一脈相承的,即先提出假設,再去檢驗假設是否正确,大概和統計學裡面的假設檢驗有異曲同工之妙。
  • 權威期刊:《Bioinformatics》

    第二部分,則着重闡述了一個合格的生物資訊學家所應該具備的基本技能:

  • 具備分子生物學的核心知識。
  • 了解中心法則。
  • 掌握 1~2 個用于序列分析或模型的主要分子生物學網站。
  • 熟練計算機指令行。
  • 會使用 C/C++/PERL/Python

    我現在可能隻在程式設計語言和指令行方面有些許基礎,其他方面還是兩眼一抹黑。即使是程式設計語言,我也不敢說自己 “會了” 或是“懂了”,畢竟隻是會了一些最基本的操作,要達到了解精髓,還有很長的一段路要走。

    目前發展方向:

    • 大基因組組裝算法。
    • 大基因組注釋。
    • 比較基因組與進化分析。
    • 大基因組重測序資料分析核心技術。
    • RNA 分析技術。

繼續閱讀