廖英哲的週報


 

2002/12/15~12/21

GenBanksearch可以當作dataDNA sequences來跑看看,由AGTC四種組合的motif20種組合的蛋白質是否有相關?目前還在找sequences,因為有一些paperinput datarandom sequences

利用造出多條strings當作是找motif的樣本,不同之前由一條stringmotif,比較之間的差異。目前還在coding

因為這禮拜跑了幾趟台北去公司面試,所以進度有點少。

 

2002/12/08~12/14

對於ACO所得解當起點的做法,所得到的結果並沒有明顯的好,但所花費的時間卻大幅的增加,所以不適用。

而目前在run的程式是用暴力法,因為老師希望可以得到此input data較好的解,因此先跑全部的結果看最佳解的score

之前所用的input data並不是非常相似,因為在paper上所得到的結果,在motif中的任兩條substring的相似度不到10分之4,約只有56各字元有對應到,因此不太符合motif的特性。

 

2002/12/01~12/07

原本的方法(利用ACO找出motif):我認為可以利用在相同的familysequences,因為同一個familysequences中應有某一些subsequences非常相似,因此可以符合著由一個主要subsequence去尋找其他的subsequences。已經用過個例子跑出結果很好。

ACO找到的解為起點:目前已寫程式在測試,但還在測試階段,如以目前所得的結果應該算不好,因為得到的結果太雜、不一定好,不過還在看程式部分是否有錯?

 

2002/11/25~11/31

解決之前所遇到的問題,目前是在找其他相關motifpaper,看是否有其他的score function,然後嘗試找出一個較好的score function;另外修改之前程式的問題,把之前程式裡的一些bug找出來並修正。

 

 

2002/11/18~11/24

寫程式模擬motifACO的方法解的結果,因為之前所用計算score的方法效果不太理想,之前的方法是先找出一段substring,利用這一substring去指出其他的sequences跟此substring最相近的substrings,然後用此substrings的集合去算出score,但所得結果並不算理想,所以目前是以一個一個substring加入為motif的方法算score,也就是加入一個substring利用目前的motif去算出score已訂出下一個substring的位置,目前所得的解比之前好,但缺點是所花費時間太長,仍在思考可以減少計算時間的方法。