2010年12月01日

POY 日本語レビュー

POY 問題に関する日本語のレビューを書きました.以下から PDF がダウンロードできます.(2メガくらい)

吉澤和徳 2011.
直接最適化法 direct optimization の問題点
タクサ 30(印刷中)
posted by 茶坊主 at 10:53| Comment(0) | 分子系統

2010年07月28日

2010年04月09日

POY 叩き

Inference of molecular homology and sequence alignment by direct optimization
Matthew J. Morgan and Scot A. Kelchner
Molecular Phylogenetics and Evolution
Article in Press


Direct optimization に関する哲学的な考察です.

主張の柱は,相同性判定の基準(similarity, conjunction, congruence) のうち,DO は congruence のみに頼ってアライメント(homology の判定)を行うが,分岐図 (congruence 基準)は,形質状態 (character states = synapomorphy) の判定にのみ適用可能で,形質 (character = homology) の判定には適用できない.したがって,congruence に基づいて homology の探索を行う DO の方法論は正当化できない,というもの.

論文に出て来ている例で説明すると,鳥とコウモリの翼は「翼」としては非相同だけど,「前脚」としては相同.そして,鳥とコウモリの翼が独立に進化したということを分岐図に基づいて言うためには,それらが「相同な形質=前脚」の「形質状態」としてコーディングされている必要がある.つまり分岐図は,「形質状態」である翼についてはそれらの由来が異なることを説明できるが,前脚という「形質」そのものの相同性については何も語れない.前脚の相同性を議論するためには,他の判定基準を適用するか,もしくは前脚を「形質状態」としてコーディングしたより包括的な分岐分析が必要になる,と言った感じ.
posted by 茶坊主 at 17:09| Comment(0) | 分子系統

2010年03月08日

Problem in POY: Cladistics で!?!?

A problem in POY tree searches (and its work-around) when some sequences are observed to be absent in some terminals
Jan De Laet
Cladistics (in press)


Cladistics にこのタイトルが載ってるということでかなりビビりましたが,内容としては方法論批判ではなく,missing data と真の deletion を POY が上手く区別できない場合がある,程度の話でした.
posted by 茶坊主 at 15:36| Comment(0) | 分子系統

2010年01月06日

【悪霊】POY【退散】

あけましておめでとうございます.年明け早々,論文の改訂や講義があり,毎年恒例のビールブログを書かないままでした.ちなみに,新年一発目は,お約束でタイガービールを飲みました.

さてさて本題ですが,このブログをご覧の方,またバイオディバーシティの僕の書いた章を読んでいただいた方なら,僕が direct optimization という方法論,そしてこの方法論に基づくソフトである POY が大嫌いなことはご存知と思います.POY のパフォーマンスを比較検討した論文はそれなりにありますが,目指すところは「どっちの方がより正確か」と言った比較がほとんどで,その方法論的な問題点を的確に指摘した論文としては

Simmons, M. P. (2004) Independence of alignment and tree search. Molecular Phylogenetics and Evolution, 31, 874-879.

位しか無いんじゃないでしょうか?

今回,POY が決定的に問題のあるソフトであることを指摘した論文がアクセプトされましたので,宣伝もかねて紹介します.
Yoshizawa, K. (2010) Direct optimization overly optimize data. Systematic Entomology (in press).

Preprint はこちら

要点は,POY はアライメントが不確かなどんなデータ領域(完全にランダムなデータや,矛盾する系統情報を含むデータ)からでも,他のしっかりとアライメントされた領域と一致するようなシグナルを抽出してしまうこと.また,アライメントの安定した領域にわずかな系統シグナルしか含まれていない場合,不安定な領域の偶然の一致が増幅され,偽の系統情報が作り出されてしまい,またそうして作り出された人為シグナルの量と質は,アライメントの安定した領域に含まれる本来のシグナルを圧倒してしまう,という点です.論文の図3を見ていただければ一目瞭然と思います.

このブログでも POY から導き出された論文を数多く紹介してきましたが,それらはほとんど artifact と言っていいと思います.



この先はまあ雑談的な内容です.
posted by 茶坊主 at 11:00| Comment(0) | 分子系統

2007年06月06日

Holotype と Moltype

先日,新しく来た人に抽出手順を見せながら話していて,これは書いておいた方がいいなと思ったので,ブログの趣旨からは外れますが,ぼくのやっているDNA抽出の手順を.こちらの話題とも関係します.

分類をやっている人なら,必ず交尾器なりその他の部位を外して,KOH なり乳酸なりで筋肉等を溶かして,観察を行う,ということをやっていると思います.ぼくは,Qiagen のキットを使って,このKOH処理と同様の手順をふんで,抽出を行っています.詳しくはこちら.サンプルを粉砕する必要は全くなく,非常にきれいな標本を残すことができます.そして新種を記載する場合,特別な事情が無い限り,この抽出した標本を holotype に指定します.

命名規約の肝の一つが,このタイプ概念だと思います.ただ一つの客観的な実体をネームポインタートすることで,名称に関する混乱を最小限に抑えることができます.DNA バーコーディングもだいぶ一般的になって来ましたが,ここで問題となるのは,形態の holotype と分子の moltype とでも言うべき2つのネームポインターが混在する状況が生まれつつあるということです.タイプ標本が古い場合には,抽出した証拠標本と照らし合わせるなどしてこの混乱を最小限に抑える努力をするべきですし,可能であれば,holotype からDNA を抽出する,もしくは DNA を抽出した個体を holotype に指定することで,このような混乱の心配は全くなくなります.
posted by 茶坊主 at 09:56| Comment(0) | 分子系統

2007年03月12日

標本からの DNA 抽出

とある昆虫研究者のメモより

Gilbert MT, Moore W, Melchior L, Worobey M.
DNA Extraction from Dry Museum Beetles without Conferring External Morphological Damage.
PLoS ONE. 2007 Mar 7;2:e272.


最初見たとき,え”え”〜〜〜っ,ウッソ〜〜〜ん,と思いました.だって,こんな方法,ずーっと前から使ってますから (たとえば, Ohshima & Yoshizawa, 2006では,1960年代に採れた 2 mm くらいの小さなガを使ってます).これで PLoS なのぉ…って思ったら,PLoS Biology じゃなくて PLoS One .... って何?About Journal を見てみると,方法がきっちりしてれば何でものせます!論文の価値は,私たちではなく読者が決めます!みたいなことが書いてありますけど,そんなんで良いの?ジャーナルのシステム自体,ちょっと良く理解できません.

まあ,いずれにしても,きちんとした証拠標本を残すことは極めて重要ですし,DNA Barcoding なんかでも,将来的にはホロタイプからの配列決定が必要になることも多々あるでしょう.分子使って系統やる人は,この論文にあるような方法を使うことが求められます.小型の昆虫をすりつぶして DNA を抽出して,元の標本は跡形もなし,なんてのは論外です.
posted by 茶坊主 at 17:05| Comment(0) | 分子系統

2007年02月15日

RETROELEMENTS 特集

Systematic Biology の最新号が,retroelements の系統解析の有用性に関する特集をやっています.

GENOME ANALYSIS AND THE MOLECULAR SYSTEMATICS OF RETROELEMENTS SYMPOSIUM ARTICLES
Systematic Biology, Volume 55 Issue 6 2006


Retroelements を用いた系統解析といえば,東工大の岡田チームによる SINE を用いたクジラの系統解析が有名です.ホモプラシーのヒジョーーーーーーに少ないマーカーとして,注目を集めており,今回の特集でも,かなり肯定的な論調となっています.

前にもちらっと書きましたが,昆虫の一番深い分岐関係を,塩基配列情報で解こうとする試みは,見通しが明るいとは到底思えません.Phylogenomic analysis をやるくらいなら,同じ情報を用いてこういった有用なマーカーを探す方が実り多いと思います.
posted by 茶坊主 at 09:48| Comment(0) | 分子系統

2007年01月25日

アライメントレビュー

L. A. S. JOHNSON REVIEW No. 8. Multiple sequence alignment for phylogenetic purposes
David A. Morrison
Australian Systematic Botany 19(6) 479−539


60ページを超える巨大レビューで,まだちらっと眺めた程度ですが,アブストの出だしの一文,「I have addressed the biological rather than bioinformatics aspects of molecular sequence alignment by covering a series of topics that have been under-valued, particularly within the context of phylogenetic analysis.」からして期待が持てそう.
posted by 茶坊主 at 09:23| Comment(0) | 分子系統

2007年01月16日

脱皮動物分子系統

Stuart J. Longhorn, Peter G. Foster, Alfried P. Vogler
The nematode-arthropod clade revisited: phylogenomic analyses from ribosomal protein genes misled by shared evolutionary biases
Cladistics (OnlineEarly Articles).
doi:10.1111/j.1096-0031.2006.00132.x


一般に節足動物と線虫類は単系統群,脱皮動物 Ecdysozoa に分類され,18S rDNA 塩基配列Hox 遺伝子に基づく解析でもこれが支持されます.一方で,数百から数千の遺伝領域に基づく phylogenomic analyses では,節足動物と脊索動物が姉妹群 Coelomata となる傾向があるそうです.ただし,進化速度の速い領域を除いて解析すると,Coelomata の支持は弱くなる,ということで,long branch attraction が強く疑われてもいます.

この論文では,この問題についての検討を行っていますが,シミュレーションデータに基づく解析を行っている点がポイント.脱皮動物が単系統となる系統樹上でシミュレーションデータを発生させても,そのデータを解析すると Coelomata が単系統になってしまう,つまり phylogenomic 解析の結果は,進化的バイアスによる人工産物の可能性が高い,という結果になっています.

昆虫の高次系統解析なんかでも,最近はデータが多けりゃ良いんだ!みたいな感じで,進化速度爆速のミトコンのタンパクコード領域まで含めて解析しちゃったりする例もありますが,ここら辺,肝に銘じるべきでしょうね.
posted by 茶坊主 at 16:23| Comment(0) | 分子系統

2006年11月30日

直接最適化法 追記

下の記事で,わざわざ太字で「Even with the input parameters set in advance, we recovered different trees from each investigator.」などと Kjer の主張を紹介しましたが,ちょっと考えてみると,これは direct optimization それ自体の問題点では無いだろうと思い至りました.

あまりなじみのない方法かと思いますので,簡単に direct optimization について紹介しますと,この方法は,アライメント→系統推定→系統樹に基づく再アライメント→系統推定→...を繰り返し,アライメントと系統樹を同時に最適化する方法です.

で,当然有限時間内に計算を終わらせようと思うと,heuristic search を行わざるを得ない訳で,そうなれば当然得られる結果が異なることもあるでしょう(僕自身使ったことないので,推測がはいってます.説明に不正確な点がありましたら,詳しい方,コメントいただけるとうれしいです).PAUP なんかでも heuristic search を行えば最適解にたどり着けないことは多々あるでしょうが,それは計算機側の限界ではあっても,最節約法 etc. の方法論自体の問題ではない訳です.

ということで,Kjer の指摘のうち,上記の点は direct optimization それ自体の問題点ではなかろうと思い至った次第です.ただ,Wheeler らが言うような,POY が完全に repeatable であるという主張は,やはり誤解を招くとは思います.特に彼らは,論文でアライメントパラメータを示すのみで,アライメントデータを配布していない場合が多いですが,これが大きな問題であることは明確に示されたと思います.

昆虫の分子高次系統で最も引用頻度の高い論文であろう,Wheeler らの Cladistics 論文は,direct optimization の適用の仕方を始め,問題が多々あると思います.そこら辺は,また明日にでも時間があれば,僕の意見を述べたいと思います.
posted by 茶坊主 at 21:17| Comment(0) | 分子系統

リボソーム領域のアライメント

下記のドレスデンミーティングの論文から

Kjer, K; Gillespie, J.J. & Ober, K.A. 2006. Structural homology in ribosomal RNA, and a deliberation on POY. − Arthropod Systematics & Phylogeny, 64 (2): 159-164.

リボソーム領域のアライメントに関して,ぼくは Kjer の立場を強く支持しているのですが (e.g., Yoshizawa & Johnson, 2005),direct optimization の旗振り役の一人である Wheeler らはかなり口汚く Kjer の研究をののしってきました.

Ogden, T. Heath, Whiting, Michael F. & Wheeler, Ward C. (2005)
Poor taxon sampling, poor character sampling, and non-repeatable analyses of a contrived dataset do not provide a more credible estimate of insect phylogeny: a reply to Kjer.
Cladistics 21 (3), 295-302.


しかし次の結果は direct optimization 派には強烈な一撃となるでしょう.

'... we suggest that POY is not an objective means of data analysis unless you have some objective means of selecting the input parameters, and it is not repeatable unless you are given those parameters in advance. Even with the input parameters set in advance, we recovered different trees from each investigator.' (Kjer et al., 2006: p. 163)

来年の Syst. Biol. に,より詳細な結果が出るようなので,楽しみです.
posted by 茶坊主 at 12:32| Comment(0) | 分子系統

2006年10月13日

ミトコンドリアゲノム

オーストラリアの巨人(表現型上ね),Steve Cameron がミトコンドリアゲノムの系統解析の有用性に関して,ここ数年立て続けに論文を出して来ています.目間と言ったような深い関係には,どうやらダメそう,というのがこれまでの感触でした.

Cameron, S.L., Miller, K.B., D'Haese, C.A., Whiting, M.F. & Barker, S.C. (2004) Mitochondrial genome data alone are not enough to unambiguously resolve the relationships of Entognatha, Insecta and Crustacea sensu lato (Arthropoda). Cladistics, 20, 534−557.

Cameron, S.L., Barker, S.C. & Whiting, M.F. (2006) Mitochondrial genomics and the new insect order Mantophasmatodea. Molecular Phylogenetics and Evolution, 38, 274−279.

一方,現在印刷中の Syst.Entomol.の論文では,目内の系統であれば,非常に有用な系統情報をもたらしうるという結果を,双翅目の解析から述べています.

CAMERON, STEPHEN L., LAMBKIN, CHRISTINE L., BARKER, STEPHEN C. & WHITING, MICHAEL F. (2006)
A mitochondrial genome phylogeny of Diptera: whole genome sequence data accurately resolve relationships over broad timescales with high precision.
Systematic Entomology 0 (0), ???-???.


頭っから否定する訳ではありませんが,やっぱりこの程度のサンプル数ではまだ分からんだろう,と思います.今回の結果も,基本的には形態でも比較的良く分かっていた関係を支持したにすぎない訳で,分子系統に本当に期待されているのは,形態じゃ手に負えないようなところがどれだけ解けるか,でしょう.分子形態両方からやってて思うのは,結局形態で分からないところは分子でも分からないまま,というケースがあまりにも多いということ.先日紹介したありんこの系統でもそんな感じですよね.

ちなみに第一著者の Steve は,Whiting のところでポスドクをやっていたのですが,みごとCSIROのポストをゲットしたそうです.彼はお酒が好きで,モルモン教徒の多いソルトレークシティでの生活に辟易していたので,さぞお喜びでしょう.
posted by 茶坊主 at 10:48| Comment(0) | 分子系統

2006年10月11日

バーコーディング

最近大流行りのバーコーディング.システマチックバイオロジーでも議論が盛り上がってきました.

Systematic Biology Volume 54, Number 5 / October 2005

DNA Barcoding: Perspectives from a “Partnerships for Enhancing Expertise in Taxonomy” (PEET) Debate
Vincent S. Smith


The Perils of DNA Barcoding and the Need for Integrative Taxonomy
Kipling W. Will, Brent D. Mishler, Quentin D. Wheeler


The Promise of DNA Barcoding for Taxonomy
Paul D. N. Hebert and T. Ryan Gregory


ちょうどこのディベートには参加する機会があったんですけど(Vince の論文にはぼくも謝辞で登場する),アンチバーコード派の Kip の議論はやや感情的な感じがして,いまいちって感じでした.

いっぽう,ようやくきちんとしたデータに基づくアンチ派からの議論も出てきました.

Systematic Biology Volume 55, Number 5 / October 2006

DNA Barcoding and Taxonomy in Diptera: A Tale of High Intraspecific Variability and Low Identification Success
Rudolf Meier, Kwong Shiyang, Gaurav Vaidya, Peter K. L. Ng


DNA Barcoding Will Often Fail to Discover New Animal Species over Broad Parameter Space
Michael J. Hickerson, Christopher P. Meyer, Craig Moritz


もちろん,これからデータも増え,方法論的にも洗練されることによって改善する点もあるとは思うのですが,数十億ドルかけて追っかけるような夢物語かと言うとそんなことは無いと思います.
posted by 茶坊主 at 16:55| Comment(2) | 分子系統

2006年09月11日

リボソーム RNA の2次構造

ヒメバチ上科の,rRNA 2次構造解析とそれに基づく系統推定.

J Mol Evol. 61(1):114-37.

Predicted secondary structure for 28S and 18S rRNA from Ichneumonoidea (Insecta: Hymenoptera: Apocrita): impact on sequence alignment and phylogeny estimation.

Gillespie JJ, Yoder MJ, Wharton RA.


直接「高次系統」とは関係ないけど,総論で強調したアライメント法の重要性と関係するので,アップしておきます.
posted by 茶坊主 at 09:19| Comment(0) | 分子系統

2006年08月31日

バーコーディング

J Econ Entomol. 2006 Aug;99(4):1037-45.

Standard percent DNA sequence difference for insects does not predict species boundaries.

Cognato AI.


高次系統ではないけど,流行のバーコーディングに一言もの申す!ということで.
posted by 茶坊主 at 09:33| Comment(0) | 分子系統