約 9,015 件
https://w.atwiki.jp/ebmedicine/
有意(ゆうい, significance)は、確率論・統計学の用語で、「確率的に偶然とは考えにくく、意味があると考えられる」ことを指す。 p値 [編集]帰無仮説の下で実際にデータから計算された統計量よりも極端な統計量が観測される確率を、p値(p-value)という。 有意水準 [編集]有意水準(significance level) α (0 α 1) は、どの程度の正確さをもって帰無仮説H0を棄却するかを表す定数である。有意水準αの仮説検定は、p αの時にH0を棄却する。このとき、「統計量はα水準で有意である」という。H0が正しい場合に、これを棄却してしまう確率(第一種の誤り)はαに等しい。 α の値としては、0.05 (= 5%) を用いるのが一般的であるが、そのとり方は学問・調査・研究対象によっても違いがあり、社会科学などでは0.1(10%)を用いる場合もあり、厳密さが求められる自然科学では0.01(1%)などを用いる場合もある。また、データ表示に当たっては有意性に段階をつけて複数の有意水準を同時に用いることもあり、たとえば0.05水準で有意ならば * 、0.01水準と0.001水準に対してはそれぞれ ** 、 *** と表示する。 有意であるからといって「偶然ではない」と断定できるわけではなく、「偶然とは考えにくい」という意味に過ぎない。 したがって、たとえば有意水準5%で有意という場合には、「実際には偶然に過ぎないのに、誤って『意味がある』と判断している」可能性が多くて5%ある。逆に、有意でないという場合には、あくまで「偶然かもしれない」という意味であって、「偶然である」とまでは断定できない。 多重比較 [編集]同種の検定を繰り返して全体での有意性の有無を判断する場合(多重比較, multiple comparison)、1回の検定に対する有意水準をαとすると、k回の同様の試行に対して一度でも有意な結果を得る確率 αk はk回の試行の独立性に依存する。たとえば、k回の試行が独立であるときは、αk = 1 − (1 − α)k となる。しかしながら、αk の上限はkαであることから、1回の検定に対する有意水準をα/kと定めれば、k回の同様の試行に対して有意水準が高々αの検定を行うことができる。これをボンフェローニ(Bonferroni)の方法という。ただし、この方法ではkの値が大きくなるにつれて有意水準が下がり、実用性に乏しくなる。そのため、より検定力の高い手法が提案されている。古くはLSD法が、ボンフェローニ法と共に計算が容易であるため好まれた。今日では、HSD法やRyan法が最も一般的である。また、Sheffe法やWSD法も見かけるようになっている。これらは、分散分析で3水準以上の要因の主効果が有意であった場合の下位検定にも用いられる。 有意差 [編集]帰無仮説を「2つの母数に差がない」という形にした場合には、帰無仮説が棄却されることで「2つの母数の間には有意差 (statistical significance) がある」という結論が導かれる。 信頼区間と仮説検定 [編集]統計量Xが、ある母数 θ の推定量である場合を考える。このとき、有意水準 α で帰無仮説が棄却されないような X のとりうる範囲は、信頼水準 1 − α に対するθの信頼区間と等しい。 たとえば、標本平均 X を母平均 θ の推定量とみなすと、帰無仮説:θ = θ0 が有意水準5%で棄却されない X の範囲は、θ0 の95%信頼区間と一致する。
https://w.atwiki.jp/keisks/pages/181.html
http //www.sigmath.es.osaka-u.ac.jp/~kano/old/lecture/faq/q1.html#excel
https://w.atwiki.jp/niko_tan/pages/56.html
同等性検定・優越性検定・非劣性検定 の前に・・・ ・有意性検定は、母平均μと基準値μ0との差δが0かどうかを検定。 ・統計的仮説検定では、事前の探索試験などから母平均μを推定し、μ-μ0=δ*と設定し、 検出力を決めて必要例数を計算可能。その場合はδ*が実質科学的に意味のある値になるとは限らず、 対立仮説が意味のある仮説になる保証は ない。 → δ*が実質科学的に意味のある値でない限り、βエラーが実質科学的な意味を持つとは限らない。 同等性検定(統計学的検定) ・αエラー、βエラー、検出差δ*を事前に決定し、試験の必要例数を確保した上で検定。 H0:μ=μ0 H1:μ=μ0-δ* or μ=μ0+δ* 有意確率p≦αの時 有意水準αで有意 → H0を棄却し、μ≠μ0(非同値)を採用…間違える確率=α 有意確率p>αの時 有意水準αで有意ではない → H1を棄却し、|μ-μ0|<δ*(実質的同等)を採用…間違える確率=β ・この検定方式で有意になった時は、推定結果と組み合わせて実質科学的な判断を行う。 ・反対に有意にならなかった時は、βがα/2(片側検定の場合はα)と同じ値ならば、実質科学的に同等。 ・ βの値がα/2より大きい場合は、信頼区間がδ*よりも大きくなり、結果が有意の時と同じ程度の信頼性で、 実質科学的に同等と断言することはできない。 ・結論の信頼性を一定以上の水準にするためには、βとα/2(片側検定の場合はα)を同じ値にするのが理想。 ・対立仮説H1を帰無仮説H0の否定形にして、実質的な対立仮説を省略し、 帰無仮説の検証部分だけにした検定方式が有意性検定。 ・有意検定は母平均と基準値が数学的に同値かどうかを検定→「非同値検定」。 ・非同値検定はδ*を設定しない→ αエラーは決められがβエラーは決められず、必要例数の計算ができない。 ・結果が有意になった時しか仮説を検証することができず、有意にならない時は結論を保留し、再試験。 優越性検定または非優越性検定 H0:μ=μ0+δ* (δ*≠0) 有意確率 p≦α の時 有意水準αで有意 →H0を棄却し、μ<μ0+δ*(実質的非優越) または μ0+δ*<μ(実質的優越)を採用 有意確率 p>α の時 有意水準αで有意ではない →H0を保留…結論保留、再試験必要 ・この検定方式は、同等性検定の対立仮説H1を帰無仮説H0にし、βエラーをαエラーにした有意性検定に相当。 ・両側検定では、μ>μ0+δ*で実質科学的に優れているor μ<μ0+δ*では実質科学的に非優越を検定。 ・優越性または非優越性だけを検証する片側検定を行うことも可能。 :両側検定との整合性を保つために有意水準はα/2 →実質科学的な優越性・非優越性を検証可能。 劣性検定または非劣性検定 H0:μ=μ0-δ* (δ*≠0)有意確率p≦αの時 有意水準αで有意 → H0を棄却し、μ<μ0-δ*(実質的劣性) または μ0-δ*<μ(実質的非劣性)を採用 有意確率p>αの時 有意水準αで有意ではない →H0を保留…結論保留、再試験必要 ・この検定方式は、優越性検定または非優越性検定の反対。 ・同等性検定のもうひとつの対立仮説H1を帰無仮説H0にした有意性検定 ・両側検定では、μ<μ0-δ*で実質科学的に劣性or μ>μ0-δ*で実質科学的に非劣性を検定。 ・劣性または非劣性だけを検証する片側検定を行うことも可能で、 :両側検定との整合性を保つために有意水準をα/2 → 実質科学的な劣性・非劣性を検証可能。 (参考) 統計学入門 臨床試験における統計的諸問題 「臨床試験における対照群の選択とそれに関連する諸問題」について(ICH E10) ヾ(* - *)
https://w.atwiki.jp/waseda2bun_r/pages/36.html
仮説検定 参考:赤間 設定 統計量T 棄却域W 比較 TがW内か TがW内 → H0棄却(H1採用) TがW内にない → H0を捨てない 棄却域の設定 誤りを犯す確率を考慮する 第一種の誤り:H0が正しいのにH0を捨てる 第二種の誤り:H0が誤っているのにH0を捨てない 参考 ttp //www.shiga-med.ac.jp/~koyama/stat/comment.html 有意水準(危険率) P(T∈w)=α α:H0が真のときにTがwに入る確率 第一種の誤りを犯す確率 p value 仮説が棄却される有意水準のmin 測定したデータが、偶然帰無仮説通りになる確率=対立仮説通りにならない危険率! 2群に、たまたま差が出ないことは、ありえないわけではない。そのまれなことが起きる確率。 p value<有意水準 「差がない確率」は有意水準以下である!--帰無仮説は棄却→→→ 1. 帰無仮説が棄却されたので、「有意差あり!」 2. 「有意差がない」にもかかわらず、たまたま珍しい事象が観察され、検定では「有意差あり!」となった。 p value>有意水準 「差がない確率」が高い。--帰無仮説は承認 1. 帰無仮説が承認されたので、「有意差が認められない!」=「等しい」というわけではない! →まずは、データを増やして再検討! →考察例)「統計学的に有意差は認められなかったが、一定の傾向が示唆された。」 →考察例)「有意差を検出するために十分なサンプル数で検定したので、意味のある差はないと判断した。」 2. 「有意差がある」にもかかわらず、たまたま珍しい事象が観察され、検定では「有意差なし!」となった 関連 平均001
https://w.atwiki.jp/aspirin-marcov/pages/73.html
FPRP=False Positive Report Probability. 出典 Wacholder et al. JNCI 2004;96 434. オッズ比またはrelative risk (RR)について、帰無仮説H0において、対立仮説HAにおいてとする。 事前確率とする。 検定統計量TはH0が棄却されるときとすると は真を棄却するは偽 検出力はで、 は偽を棄却するは真 を厳しくし、が大きくなると、検出力は低下する。 FPRPを次のように定義する。 は真関連は統計学的に有意だと思うは真 αは帰無仮説が真であるときに統計学的に有意な結果を得る確率である FPRPは検定が統計学的に有意であったときに、帰無仮説が真である確率である 結合確率の表が以下のようになる 検定の有意性 対立仮説の真実性 有意 有意ではない 合計 真の関連 (真の陽性) (偽陰性) 関連なし (偽陽性) (真の陰性) 合計 1 したがって、 / 例 1000SNPパネルの検定で、検出力が1、αは0.05とする。 この1000個のうち1SNPが疾患と関連しているとする。() 真の関連があり検定を棄却する確率は、 関連がなく、帰無仮説を棄却する確率は 棄却する確率の合計はである。 したがって、統計学的に有意な結果が真の関連を示す可能性は2%にすぎない
https://w.atwiki.jp/studypsychology/pages/17.html
心理統計 分散分析(Analysis of Variance ANOVA) 分散分析 3つ以上の値を比較する際に用いる分析方法であり、複数ある平均値のどこに有意差があるかを算出する方法である。 分散分析を行っただけでは有意差があった場合でも有意差あるとは言えず、主効果があると記載する。 ANOVAの場合、独立変数を要因と呼ぶ場合がある。 多重比較 分散分析で主効果がみられた場合に行う分析である。具体的にどの平均値間が有意なのかを調べることができる。 Tukey法・FisherのLSD法・Newman-Keuls法・Dunnett法・Scheffe法・Bonferroni法などの分析方法がある。 引用文献 松村潤一郎・山田剛史 (2004). よくわかる心理統計 ミネルヴァ書房
https://w.atwiki.jp/kazumaru1118/pages/17.html
内容 1日 無規則性の検定 検定するために2つのノンパラメトリック法がある 1.連検定(run test) (例) あるゲームを30回行い、以下の系列が得られたとする。 +++--+----+++++-+---++---+++++ +、-などの同じ記号の並びを連runと呼ぶ。 同じ記号が連続して、r個現れるとき、その連の長さはrである。 連の数が少なすぎる場合は、同じ観測値が群れをなしているので、観測値の系列はランダムではない。 逆に連の数が多すぎる場合も、規則的に並んでるのでランダムではない。 連検定は 帰無仮説:系列は無作為である を 対立仮説:系列は無作為でない に対して検定する。 7日 ※統計学の補足 仮説検定について 珍しいことが起こったとき、それは本当に間違いではないのかどうかを調べるのが検定。 この珍しいということを有意水準といい、で表す。 このは通常、0.05や0.01といった値を用いる。 検定する際に、主張したい本音を 対立仮説といい、と表記する。 また、否定したい命題を 帰無仮説といい、と表記する。 以下に検定の簡単な手順を示す。 1.母集団のパラメータまたは分布に関する帰無仮説、対立仮説 および有意水準を設定する。ここに、の,や の、のように分布を規定する定数を 分布のパラメータという。 2.適当な統計量を考え、の下で、 このの分布を決定する。ここにはサイズの標本。 3.有意水準(危険率)に対して、 がに属する確率 となる実数の範囲を、対立仮説を考慮して決める。 このを棄却域とよぶ。 4.入手した標本値からの実現値を計算し、 が棄却域に属する ⇒ 有意水準でを棄却。 が棄却域に属さない ⇒ 有意水準でを採択。 採択されたときは帰無仮説が正しいと認めたわけではない。 棄却されないときは何の結論も下せないということ。
https://w.atwiki.jp/niko_tan/pages/52.html
Bonferroni 補正 の復習 ♪ その前に、 familywise error rate 複数回繰り返された検定全体において帰無仮説が棄却される可能性 有意水準α = 0.05 の検定を繰り返す事は、さいころを繰り返し振るのと確率論的には同じ。 検定を繰り返せば繰り返すほど、偶然棄却される帰無仮説が増える。 有意水準α = 0.05の検定を20回繰り返すと、 1回でも帰無仮説が棄却される可能性は、familywise error rate=0.642 100回繰り返すと、familywise error rate=0.994 多重比較を行う場合(=検定を繰り返す)、各々の検定の有意水準 α <0.05 未満にしなければ、 familywise error rate <0.05 にできない。 Familywise Error Rateを調整する方法 (1)F統計量やt統計量等の統計量に基づいた方法 F統計量を用いたFisher s least significant difference (Fisher s LSD)法、 t統計量を用いた Tukey s honestly significant difference (Tukey s HSD)法、 t統計量を用いてcontrol群と非コントロール群の比較のみを行う Dunnet法 (2) Bonferroni法やHolm法 統計量に依存しないため、どのような検定に対しても利用可で、汎用性が高い。 Bonferroni法 検定総数がNの場合、それぞれの検定の有意水準をαからα/Nに変更する。 検定総数が20ならば、20個の検定全てにおいて、有意水準を0.05/20 = 0.0025に変更。 非常に保守的なfamilywise error rateの調整法。 βエラーの可能性が高い。 「p値 α/N」となった帰無仮説は、棄却が保留されると考えるのが妥当。 ヾ(* - *)
https://w.atwiki.jp/cclkouryaku/pages/104.html
緊急企画:コンディション安定度の影響 さて、12/20にまたアップデートがあり、「選手のコンディションに対する調整」があったようです。 そこでコンディション安定度(コン安)の影響がどこまで変化したのか検証してみました。 急いで検証したので、絶対数が少なめで、統計的パワー不足は否めませんが、 何となくの傾向でもわかれば。 検証方法 ワシンデンタウンの6選手のコンディション安定度を3から8まで設定し、 30試合繰り返し、コンディションを記録した。 便宜上数値化した方がよいので、絶好調を5点、好調を4点、普通を3点、不調を2点、絶不調を1点とした。 30試合のコンディションをすべて記録し、平均値を算出した。 その後、それぞれについてT検定を行った。 またコンディション普通以上を試合出場と考え、出場率を算出した。 結果 コン安 5 4 3 2 1 コン3 1 6 10 4 9 コン4 2 1 18 6 3 コン5 4 4 19 1 2 コン6 1 6 19 2 2 コン7 3 6 18 3 0 コン8 5 8 15 1 1 平均値 コン安 平均値 コン3 2.5 コン4 2.8 コン5 3.2 コン6 3.1 コン7 3.3 コン8 3.5 出場率 コン安 出場率(%) コン3 56.7 コン4 70 コン5 90 コン6 86.7 コン7 90 コン8 93.3 統計的評価 コン安5と6は有意な差は得られなかったが、 その他のコン安については危険率5%で有意に平均値に差があった。 試合出場率はコン安3と4で有意に低かった(危険率5%、片側検定)が、 その他のコン安は有意な差がなかった。 結論 全体数が30と少ないので明確な結論は出せないが、今回の結果からは、 1.コンディション安定度が高いほど、コンディションは安定する可能性が高い。 2.調子普通以上を試合出場可能と判断すると、コン安5以上であれば有意な差はない。 しかし、コン安4以下は有意に出場率が低い。 バラつき等を考慮せずに単純に数字化しただけの検証なので色んなバイアスはかかっていると思われます。 しかし、何となくの傾向はあるようです。
https://w.atwiki.jp/ishiboshu/pages/13.html
Harvard School of Public Health(HSPH)老人内科医師募集 老人内科で医師募集していたのは、Public Health(公衆衛生学)の修士コースのなかでも特に数理学的解析方法を中心に学ぶコースでした。臨床疫学や生物統計基礎などの必修科目のほかに、驚くほど多くの選択科目があり、どの授業にも出たくなって選ぶのに困ったほどです。微量またはマクロアルブミン尿を有する高齢者は、正常アルブミン尿の高齢者に比べて認知機能が有意に低く、その後約5年間で認知機能低下を経験するリスクが有意に高いことが明らかになった。ONTARGET試験とTRANSCEND試験の登録患者を分析した研究で、米Emory大学のJoshua I. Barzilay氏らが、Arch Intern Med誌2011年1月24日号に報告した。微量またはマクロアルブミン尿を有する高齢者は、正常アルブミン尿の高齢者に比べて認知機能が有意に低く、その後約5年間で認知機能低下を経験するリスクが有意に高いことが明らかになった。ONTARGET試験とTRANSCEND試験の登録患者を分析した研究で、米Emory大学のJoshua I. Barzilay氏らが、Arch Intern Med誌2011年1月24日号に報告した。