比率のある遺伝子を取得しました。小さな例として、以下に私のデータを見ることができます
Gene Control1 Control2 Control3 Treated1 Treated2 Treated3 pps-1 324680000 211350000 356350000 269770000 258080000 292830000 R11A8.7 477490000 610780000 539550000 533590000 530810000 578290000 ugt-21 105080000 103430000 74137000 78915000 42381000 31415000 spp-18 1042800000 615030000 332720000 538340000 448280000 412310000
今私の質問は、私には3つのコントロールと3つの治療があり、コントロールには2つの生物学的複製があり、治療には2つの生物学的複製
その倍率変化を計算するにはどうすればよいですか?
2つの方法があります
最初の方法コントロールグループの平均を取り、それを A (1列)処理されたグループの平均を取り、 B (1列)と呼ばないようにします。次に計算します倍率の変化(B / A)
このようにして、対照群または治療群の生物学的複製はすべて高く、平均を取るのは問題ないことを示しています
2番目の方法両方のグループで複数比較テストを実行しますI上方制御された遺伝子と下方制御された遺伝子を見つける私は対照群の平均を取る残りの遺伝子を破棄し、それを A (1列)処理されたグループの平均を取り、 B (1列)と呼ばないようにします。次に計算します倍率の変更(B / A)
どちらがより理にかなっていますか?
私の主な関心事は、生物学的複製がある場合の倍率変化の計算方法です。
生物学グループに投稿したのでここに投稿したほうがいいと言われました
それでは、倍率変化のp値を計算するにはどうすればよいですか?平均に基づいています
コメント
- 3つの複製を意味すると思います。
- @Student Tyesつまり
- Biology.SE にクロス投稿されました。 @ NikBernou2つのサイトにクロスポストしないでください。一方のサイトの方が良いと思う場合は、もう一方のサイトの質問を削除してください。
- @WYSIWYG彼がクロスポストしたことは知っています。とにかく、私の答えを確認してください。他の投稿のt検定のアイデアに触発されました。
回答
2 :)意味がありません私に。サンプル平均の差を検定する場合にのみ、対照と処理の間のt検定を実行しますが、倍率変化を計算する場合は実行しません。
倍率変化は通常、単純に
。 http://seqanswers.com/forums/showthread.php?t=49101 で、DESeq2の作成者が次のように書いていることを証明します。
(average in group2)/(average in group1)
質問はなぜにするのかこれを実行したいですか?これを実行できる優れたBioconductorパッケージがあります。たとえば、DESeq2は縮小方法をfold-changesに適用します。rawfold-changeはではありませんは、遺伝子の発現レベル(および分散)に対応していないため、生物情報統計分析に役立ちます。発現量の多い遺伝子と低い遺伝子は同じ倍率変化をもたらす可能性があり、これが起こらないようにする必要があります。
コメント
- ありがとうございます実際、私は何時間も私が欲しいものを説明しようとしていました。これは私に正しい道を与えます。私はパッケージをクリックするよりも自分でそれをすることに興味があります。少し黒いボックスに見えます。私に与えることは可能ですか?たとえば、この倍率変化のp値をどのように計算するかについての説明はありますか?ご存知ですか?
- @NikBernouちょっと知っていますが、それが役に立ったら答えを受け入れて、新しいものを始めてください。質問?これはあなたの感謝の気持ちを示し、人々はあなたをもっと助けることができるでしょう。
- @NikBernou DESeq2のような高度に開発された洗練されたパッケージを使用し、何を理解するためにいくらかの努力を払うほうがよいと思いますそのような"ブラックボックス"は実際にそうです。そのようなプログラムを再発明しようとすると、困難を伴い、エラー。コードを調べて、プログラムの作成者がp値などの問題をどのように処理しているかを確認することもできます。
- @EdM同意しますが、パッケージを作成しなかった場合、パッケージを確認するのは困難です。ほとんどのドキュメントが不足しているので、本当に苦痛なのは何であるかを過小評価してください。私は、そのようなパッケージがプログラミングの知識を持たない人のために構築されていることに同意します。そのため、私はそれを完全に理解しているものを自分で作成しようとしています。たとえば、DESeq2が連続ではなくカウント値で機能している理由を教えてください。ご覧のとおり、これはブラックボックスです
- @EdM倍率変化の計算は、難しい計算ではありません。 DESeq2は、特定の種類のデータを対象としています。これは一般的な統計ツールではありません。 そして、単にいくつかのボタンをクリックするのではなく、基礎となる統計/数学を知ることは常に良いことです。