更新時間 2011/12/17
PSIPRED簡介
PSIPRED是一個蛋白質二級結構預測的軟體,使用neural networks的方法來建立預測model。大致上的原理將要預測的蛋白質,是先透過PSI-BLAST工具找出與此相關的蛋白質,藉此得到演化上資訊,如amino acid的改變、insertion或是deletion等等。跟據此結果輸入到neural network,來預測可能的二級預測結構。(詳細的內容,請看Jones DT. (1999) Protein secondary structure prediction based on position-specific scoring matrices. J. Mol. Biol. 292: 195-202.這篇paper)
PSIPRED版本下載
目前PSIPRED除了提供的Web service之外,也可以下載到自己的電腦裡,但只有Linux版本喔(目前版本3.2)(2010.08.26).
Web service : http://bioinf.cs.ucl.ac.uk/psipred/
Download : http://bioinfadmin.cs.ucl.ac.uk/downloads/psipred/ (2011.09.01更新)
若無你的電腦無Linux系統, 可以考慮兩種方式
1. 使用 cygwin
2. 使用 Virtual machine 來安裝 Linux 系統
(待補)
PSIPRED安裝
一、工具本身主要是在linux上開發的,用tar解壓縮
>tar -xzvf psipredxxx.tar.gz
解壓縮後會有在資料夾中的bin裡會有 runpsipred 和 runpsipred_single 兩種模式可以使用
PS: runpsipred_single 顧名思義 single 指的是並不會執行 PSI-BLAST 的動作,認定你要預測的 protein sequences 是找不到同源的 protein,也因如此執行上也比 runpsipred 程式快上了許多。但這種情形不大發生,而且 PSIPRED 也由於多做了 PSI-BLAST 的動作才使得預測率變得更好。所以在使用上是用runpsired 這隻程式來預測 protein secondary structure。
二、另外還必須要下載PSI-BLAST和蛋白質序列的database。在這裡,我這裡挑選的是nr database。nr 指的是 non-redundant,也就是沒有多餘重複的protein。而nr是如何挑出來的呢?這又是另一個故事了...就不在此敘述了。
這邊要注一下,PSIPRED本身是設計成讀nr database除了nr database 設成其他的dabase都是無法work的(2009.02.01)以上刪除為初入此領域無知所寫的,只是要protein的database,就可以正常運作(茶~) (2010.06.27)
BLAST Download : (BLAST內含PSI-BLAST)
BLAST : ftp://ftp.ncbi.nih.gov/blast/executables/release
BLAST隨著時間會不段的改版,下載時請參考釋出時間以及適合的版本。
database : ftp://ftp.ncbi.nih.gov/blast/db/
database檔名為nr.XX.tar.gz,不只有一個,隨時間更新。以上都不需要再make install,只要解壓縮之後就可直接使用了。
三、都下載好所需之後,在執行前要先行設定,用 vi 或 vim 工具打開 runpsipred
在set dbname的部份,要設定成你database所放置的路徑
ex: 放在 /home/febain/db/裡的話,就將set dbname = /home/febain/db/nr 。這邊要注意,如果沒有少打了nr 的話,可是會發生錯誤的喔~
而set ncbidir的部份,指的就是PSI-BLAST程式所放置的地方。
ex: PSI-BLAST放在 /home/febain/BLAST 下,則set ncbidir = /home/febain/BLAST/bin , 修改好並儲存。
四、回到PSIPRED的src的目錄底下,執行make,重新編譯。之後再將所產生的執行檔,copy到bin的目錄底下。
>make
>mv chkparse pfilt psipass2 seq2mtx psipred ../bin
五、將你所用預測的protein sequence分別各存成一個檔案,使用下面指令(注意:一次只能預測一個蛋白質)
>./runpsipred your_file_name
依經電腦的速度不同,等待的時間也就不同。完成之後,會產生出 your_file_name.ss, your_file_name.ss2, your_file_name.horiz 三個檔案。
在horiz檔案,長的如下:
一行以60 amino acids為長度, conf是說對於該預測的信心度多高, 數值從0~9, 越大表示越有信心
而Pred就是所預測出來了的結果, C代表Coil, H代表 Helix, E代表的Strand。AA為amino acid sequence
常見問題
如果遇到了這類的錯誤訊息:
[makemat] FATAL ERROR: Unable to open file psitmp21305007f0100.chk
最有可能的情況是路徑的問題,要檢查 set dbname 及set ncbidir 有無設錯。
而horiz檔裡若無內容,則是要檢查 set execdir 和 set datadir 的路徑。(2009.02.09)
若是出現了Exec format error. Binary file not executable. 的訊息
就需要到src的目錄底下,執行make,重新編譯。之後再將src底下所產生的執行檔,copy到bin的目錄底下, 即可解決。(2010.12.29)
PSIPRED工具使用上,大致如此。
keyword : PSIPRED, PSIPRED安裝及使用方法, 蛋白質二級結構預測工具, Unable to open file psitmpxxxx.chk

最近想用 sspro4 但是那是在 linux 上跑得 對於 windows 使用者真的是很困擾 = = 話說 sspro4 的預測效果是不是預測軟體中最好的?
william96718你好 以我個人的經驗,目前在做蛋白質二質結構的預測軟體 都是在linux上開發的,我尚未看過有在windows上的工具 如果對linux不熟,建議使用有Web server服務的工具 PSIPRED也是有提供這種服務,但缺點就要做大量分析就 不方便使用。 至於預測結果最好這個問題,有時因為測量的dataset的不同 所以都會有某種程度上的誤差,而目前PSIPRED是最為穩定的 預測工具,也是最多被使用的。 以上希望有回答到你的問題
我是用cygwin當作業環境 我的目錄是/home/ps 我將blast與database存在ps解壓縮 那我的路徑要如何變更
你好 這要看你blast和database解壓縮之後的名字 像blast, 如果是2.2.14版本的, 那麼就如下 set ncbidir = /home/ps/blast-2.2.14/bin 而database的部份, 如果是用nr, 則 set dbname = /home/ps/database/nr 以上回答希望對你有幫助
你好,想請教版主些問題 我是下載psipred32版本(psi-blast2.2.5) in linux ia32 執行時會出現FATAL: Error whilst running blastpgp - script terminated 回頭看程序都是blast執行到出現"Searching....."就出現上行的錯誤訊息 請問有哪裡是可能出錯的地方嗎
你好: 你可以先嘗試一下執行blastpgp是不是正常 ex: blastpgp -d databasepath -i sequence 此指令請到blast/bin/底下執行, 而databasepath就是你存放database的路徑, 如/home/nr, 請記得要多加一次的nr變成/home/nr/nr, 而sequence就是你要預測的蛋白質序列. 如果上述的指令可以正常執行, 那麼你就要檢查下set ncbidir的路徑是否有設錯,相反的不能執行的話, 就是blast的套件有問題, 試著下載最近的blast版本 祝你能順利使用 ^^
请问可以循环输入输出么?比如我有100条序列(fasta结构),可以用软件循环输入并循环输出结果么?谢谢!
hi, 你好 如果你要使用PSIPRED做多條預測, 那麼你必需自行寫一個程式, 利用迴圈的方法重複執行runpsipred指令
你好。我請教兩個問題。(1)請問nr.XX.tar.gz是要把所有的版本都下載下來么?還是只要下最新的e.g. nr.10.tar.gz版本?(2)我現在是windows 64位系統下用cygwin,請問我下載了blast的可執行文件blast-2.2.25-x64-win64.exe,是不是新建且直接放在路徑 set ncbidir = /home/ps/blast-2.2.25/ 下就可以了?謝謝!
Hi, 你好 (1)建議你將所有的nr.xx.tar.gz都下載, 預測的結果會比好 (2)如果你的環境是使用cgywin, blast-2.2.25-x64-win64.exe執行之後會產生一個bin的資料夾, 然後把此資料夾放到cgywin的家目錄底下, 以我的例子, 是放到c:\cygwin\home\febain\底下. 接著打開cygwin 依本篇的介紹設定PSIPRED就應可使用. 若有問題, 歡迎再與我討論
*****
*****