2010年01月06日

【悪霊】POY【退散】

あけましておめでとうございます.年明け早々,論文の改訂や講義があり,毎年恒例のビールブログを書かないままでした.ちなみに,新年一発目は,お約束でタイガービールを飲みました.

さてさて本題ですが,このブログをご覧の方,またバイオディバーシティの僕の書いた章を読んでいただいた方なら,僕が direct optimization という方法論,そしてこの方法論に基づくソフトである POY が大嫌いなことはご存知と思います.POY のパフォーマンスを比較検討した論文はそれなりにありますが,目指すところは「どっちの方がより正確か」と言った比較がほとんどで,その方法論的な問題点を的確に指摘した論文としては

Simmons, M. P. (2004) Independence of alignment and tree search. Molecular Phylogenetics and Evolution, 31, 874-879.

位しか無いんじゃないでしょうか?

今回,POY が決定的に問題のあるソフトであることを指摘した論文がアクセプトされましたので,宣伝もかねて紹介します.
Yoshizawa, K. (2010) Direct optimization overly optimize data. Systematic Entomology (in press).

Preprint はこちら

要点は,POY はアライメントが不確かなどんなデータ領域(完全にランダムなデータや,矛盾する系統情報を含むデータ)からでも,他のしっかりとアライメントされた領域と一致するようなシグナルを抽出してしまうこと.また,アライメントの安定した領域にわずかな系統シグナルしか含まれていない場合,不安定な領域の偶然の一致が増幅され,偽の系統情報が作り出されてしまい,またそうして作り出された人為シグナルの量と質は,アライメントの安定した領域に含まれる本来のシグナルを圧倒してしまう,という点です.論文の図3を見ていただければ一目瞭然と思います.

このブログでも POY から導き出された論文を数多く紹介してきましたが,それらはほとんど artifact と言っていいと思います.



この論文は最初 Cladistics に投稿したのですが,予想通りエディタリジェクト(しかもその時のコメントが振るっていて,The fantastic assertion that optimality criteria should be abandoned is hard to reconcile with the past 40 years of phylogenetic systematics. というものでした.おいおいいつから direct optimization は,Hennig の系統体系学の正統にして唯一の後継者となったんだ?ぼくも Hennig に由来する方法論に基づいて研究を続けてきた [それも Ax, Wägele と続く正統的な系譜にとても共感する] つもりでしたが,そうじゃなかったと言いたいの?ちなみに,このコメントをよこしたのは,おそらく担当編集者となった Jim).再投稿先には,Syst. Biol. も考えたのですが,それには圧倒的にテストデータが足りないし,かといって揚げ足取りのような論文にそんなに手間暇掛けたくも無いし,ということで,Wheeler, Whiting, Carpenter といった POY 学派も論文を多数出版している Syst. Ent. の Opinion コーナーに投稿しました.こちらに対するエディタのコメントは対照的で,The POY school will hate us, but I am willing to confront their untested dogmatism! というもの.査読も1週間で終わりました.

そもそものこの論文を書こうとしたきっかけはこちらの論文.最初は,コンタミを指摘するだけじゃ論文にもならんしなぁ,と思っていたのですが,Dresden Meeting で複数の人から勧められたこともあり,執筆開始.よくよく検討してみたら,POY の欠点を洗い出せる可能性に気づいたのでした.
posted by 茶坊主 at 11:00| Comment(0) | 分子系統
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

※ブログオーナーが承認したコメントのみ表示されます。