2ちゃんねる ★スマホ版★ ■掲示板に戻る■ 全部 1- 最新50  

■ このスレッドは過去ログ倉庫に格納されています

確率統計で見るJリーグ

1 :U-名無しさん :02/12/02 11:12 ID:7uYoFwjg
仮説「ホームは有利とは言えない」

トト1〜69節でその他を除くと
ホーム勝ち429、ホーム負け288、計711である。

仮にホームの勝つ確率を1/2とすると
平均358.5、分散179.25、標準偏差13.38。

ホーム勝ちの平均からのズレは
429-358.5=70.5。
標準偏差σで割ると70.5/13.38=5.27。

仮にこの値を4にしても0.001%
つまり危険率を99.999%にしても仮説は棄却できる。
つまりこういう結果になるのはかなーり
少なく見積もっても0.001%以下である。

よって元の帰無仮説は棄却され
「ホームは有利である」と言える。


みたいな事を語りましょ。
あんまり専門的にしないようにしたいけどね。


2 :βακα..._〆(゚▽゚*) :02/12/02 11:20 ID:8++uGkd7
意味分からん

3 :U-名無しさん:02/12/02 11:25 ID:MLln/vpF
711試合に対して勝ちは429event
ガウス分布を仮定して統計誤差の1σは20.7
ホーム有利で無いとした時のexpectationは355.5
そこからのずれは3.5σ
2σ離れたら統計的に有意な差があると見てもいいんじゃねーの?

>仮にホームの勝つ確率を1/2とすると
>平均358.5、分散179.25、標準偏差13.38。
こっちはexactに355.5でいいでしょ。
勝ちがどれだけ離れてるかをみるんじゃない?

結果は同じだけどね。


4 ::02/12/02 11:31 ID:s6GroUTy
>>3
まあそうでもいいんだけど
実際は5.62σだったけど
この時の値がわからんかったから
本に載ってた4σを使いますた

5 ::02/12/02 11:38 ID:s6GroUTy
今考えてるのが
あるチームAと別のチームBの試合において
Aが勝つ確率を求める
みたいな事です。

例えばこの前の柏ー大阪戦で
年間勝ち点は柏は29、大阪は54。
よって柏の勝つ確率は29/(29+54)
みたいなの。

これはまだ予測の段階なんで色々試す必要が
ありそうだけど。


6 : :02/12/02 11:42 ID:XDu07YB8
統計的有意差の話をしはじめたらスポーツは楽しめんな。
「磐田とガンバの間には有意な力の差は見られない」
って結論になっちゃう。

7 :U-名無しさん:02/12/02 11:43 ID:MLln/vpF
>>4
チームごとに見た方が面白いかも。
サンプル減るからこのやり方だと何にも見えなくなるかもしんないけど。

医薬関係者が治験で使ってる検定方法使えば出てくるかな。
奴ら20〜30人のデータ弄って結果だしてるからね(w

totoの為にこの板で講義しておくんなまし。

8 : :02/12/02 11:48 ID:YTVVTpk4
新予想形態キター…のか?

9 :   :02/12/02 11:55 ID:Vreth/SF
俺としてはむしろ効果的な削減の方法を教えてほしいのだが

10 :U-名無しさん:02/12/02 12:07 ID:s6GroUTy
>>6
いやそんなことないんじゃない?
大阪54磐田71だからね。1.3倍離れてるし。

11 :U-名無しさん:02/12/02 12:11 ID:s6GroUTy
でもスポーツを楽しめないっていうのはわかる。
けどさ、今年は初めて降格争いに巻き込まれて
11月中は計算とかしまくりだったからさ、、、

12 : :02/12/02 12:19 ID:XDu07YB8
>>10
セカンドのみで考えてた。
でも今みたら35と27だから差は出るかな。
計算してみたいが、勝ち点だとやりかたがわからん。

13 :U-名無しさん:02/12/02 12:36 ID:MLln/vpF
勝ち点だけで見ると大穴わかんないから
チームの1試合あたりの得点と失点、さらにその偏差をみるのは?

これと勝ち負けの結果を比較するとイレギュラーが多いチームとか判りそう。

toto的には、コンスタントにショボイチームは捨てられるし、
爆発出来るチームは大穴として残せる。

14 : :02/12/02 12:44 ID:XDu07YB8
えーと、暇だから勝ち点で分散分析やってみた。
(13すまん。計算してたから)
・セカンドのみズビロVSガムバ
F=1.43 p=0.24(有意差なし)
・通年でズVSガ
F=4.1 p<0.5(差あり)

15 : :02/12/02 18:51 ID:1Iwms/zr
統計とはちと離れるが、クラブ単位でレーティングをつけれないかなと
思ってるのだが。
過去の記録はあるわけだし、レーティング算出方法さえ決めれば
統計的に表せると思うのだが。

16 :U-名無しさん:02/12/02 20:26 ID:Kf6L/l+M
>>15
その算出方法ってのがむずいよな、、、
万人を納得させる物を作るには。

一試合の平均勝ち点とかかな?

17 :井原正巳:02/12/02 20:28 ID:6LZZZ8Ul
中学生では数学5!井原正巳の見解が見れるかも!?

井原正巳本スレへ即行って、質問してみよう!
http://sports.2ch.net/test/read.cgi/soccer/1037605807/

18 :U-名無しさん:02/12/02 22:48 ID:14T7OIlu
取り敢えず2nd120試合を
磐田35−大阪27で磐田の勝つ確率を35/(35+27)
磐田35−鹿島26で磐田の勝つ確率を35/(35+26)

仙台12−札幌9で仙台の勝つ確率を12/(12+9)
としてその総和を取ったら69.79試合になりますた。

が、勝ち点の多いチームが勝っている数は75試合あるので
勝ち点の比よりも勝ち点の多いチームの方が勝ち易い
と思われる。

つまり
蟹12ー袋9で蟹の勝つ確率は12/(12+9)=57%ではなく
(12-α)/(12+9-α)になりそう。

でこのαの割り出しはちと計算がだるいな。
でも92からの19シーズンすべてで出してみたいな。

19 :U-名無しさん:02/12/03 02:03 ID:EODaTJxI
へ〜
こんなスレ立ったんだ。

トト当てられるようになるかな?

20 :_:02/12/03 02:17 ID:MlU894dQ
age

21 :U-名無しさん:02/12/03 02:30 ID:RWseZJ3r
俺は馬鹿だから意味わかんねえよ!
誰かもっと解りやすく言ってくれ。スマソ


22 :U-名無しさん:02/12/03 04:30 ID:9Wl0Lpco
>>21
どれに対して?

23 :名無し:02/12/03 04:35 ID:rgmBuQNP
個人的に、一番、勝率を割り出すのに適した手法は
共分散構造分析だと思うけど。ただ、変数の設定が
難しかったな。

少なくとも新聞紙上の専門家の人たちよりは勝率は
完全に上だった。

24 :名無し:02/12/03 04:42 ID:rgmBuQNP
>>14
勝ち点は、名義尺度だから分散分析は・・・(苦笑)

25 : :02/12/03 04:48 ID:Cqi1QMAV
チームの構成要素である選手が入れ替わっている以上、チームに対しての検定はちょっとなあ。
エジムンドがいるベルデーといないベルデーじゃ比較する意味すらないし。

こういうのは好きだけどね。

>>18
勝ち点の比を求めてる時点で本質的じゃない気がするな。
やるならもっと原子的な要素に分解しなければ。
それに、勝ち点の比のクラスごとに試合結果を検証しないと意味がない。

しかも、予想に使うなら試合時点の勝ち点でやるべきだし。

しかし、もし、このやり方が完成したとして、レッズに適用してたら悲惨だったね・・・



26 : :02/12/03 04:58 ID:9oR/vEGB
今、レーティングを出してる最中。
レーティング方式は
レートが同じなら勝てば+16点、負ければ−16点。
レーティング上位が勝った場合の得点をR、レート差をXとして、
R=16*(0.5^(X/200)) (小数点2位を四捨五入)
下位が勝った場合は32-Rね。
問題のVゴル勝ちなんだが、90分勝ちの半分増減で計算してみる。
まだ93年のデータでやってるから出てこないけどね。
ちなみに、PK戦は勝敗ついても引き分け(増減なし)の扱いにしてます。


27 : :02/12/03 05:03 ID:Cqi1QMAV
>>26
あのさあ、適当に数式を作って大体あってる!!っていうんじゃ確率統計になんないよ・・・
どういうモデルを想定してるのかしらないけどさ。

それは過去の現象にたまたま当てはまるように表面的な数字を掛けたり足してみてるだけでしょ。

28 : :02/12/03 05:06 ID:9oR/vEGB
サッカーのモデルが分からないからこそ、
数式を作って想定して、適宜修正して見るんじゃないの?
それさえもしないでどうやって数式をみちびきだすのさ。

29 : :02/12/03 05:08 ID:9oR/vEGB
>>27
あ、ごめん、漏れは厳密な確率統計に当てはめたくてレーティング
やろうとしてるんじゃないから。
なにか単純な2値比較で勝率などの目安ができないかと
模索しているだけなので。
すれ違いならスマソ。

30 : :02/12/03 05:11 ID:Cqi1QMAV
あと、それから、

試合結果から強さの尺度を導く手法の参考として
http://www.fifa2.com/scripts/runisa.dll?s7.66264:gp:300953:67173+rank/procedures+E

がんばってね・・・


31 : :02/12/03 05:18 ID:Cqi1QMAV
>>29
厳密云々じゃなくてさ、勝ち点なんて人間が順位付けのために勝手に決めたルールじゃん。
勝ち点3じゃなくて10だったらどうすんのさ。

勝ち負けを予想したいなら、勝ち負けの要因をベースにレーティングしなきゃ。
シュート数とかでもいいし、選手の年俸とかでもいいし。

ま、俺がやるんじゃないからスジワルでもいいけど。

32 : :02/12/03 05:32 ID:9oR/vEGB
>>31
べつに勝ち点に依ってレーティングしてないんだが・・・
Jリーグのルールがころころ変わってるから、90分勝ちと延長勝ち、
それにPK&引き分けに分けてるのだが。

勝ち負けの要因が選手の年俸にある?かなりスジワルですね。


33 : :02/12/03 11:00 ID:T5FMI8z3
>>24
名義尺度の意味がわかっているのかと小一時間、、、。

34 :U-名無しさん:02/12/03 12:49 ID:Gpz08bGt
漏れはある程度の実力差がある時は
○40%□20%△10%■10%●20%
で計算してる。
例えばこの前なら
G−粕、安ー牛、熊ー札で。
したら降格の確率は
粕10%、牛35%、熊55%だった。
まぁ全部漏れが齢と思った方が勝ったが、、、

35 :名無し:02/12/03 13:29 ID:rgmBuQNP
>>33
あのなぁ・・・
名義尺度は、仮につけた数字。男性1とか、女性を2とかね。
勝ち点もこれと同じなんだよ。

まぁこの場合は、順序と言ってもいいけどね。2>1>0の
順位付けにはなっているから。
ただし、この際、使えるのはノンパラ。分散分析はダメ。


36 : :02/12/03 16:26 ID:IBT0Byo8
難しい話はわからないけど、サッカーって他のスポーツと比較して
予想外の事が起きるからくじの対象になるんでしょ?。
確立や統計は客観的に考える分にはいいかもしれないけどね。

37 : :02/12/03 16:31 ID:T5FMI8z3
>35 
おいおい。
特に前半部はそうとうおもしろいぞ。
Jの順位算出においては、引き分け×3が90分勝ち×1と等価なわけだから
ここでは勝ち点は比率尺度だ。
離散量であっても間隔尺度以上なら分散分析は適用可能だ。
(勝敗のつきかたが互いに独立じゃないからダメではあるが)


38 : :02/12/03 16:33 ID:T5FMI8z3
えーっと、スレよごすのなんなので、私退出いたします。

39 : :02/12/03 17:55 ID:Cqi1QMAV
>>32
・・・
だめだこりゃ。
本質を理解しようとする気もないのか。

つか、>>26っぽいおもちゃなら俺ならExcelで1分で作れるっていうか。
小学生でも考え付くって言うか。
統計じゃないとか言ってる時点でスレ違いだし。




40 :U-名無しさん:02/12/03 18:01 ID:qbhmCA6R
あのー、面白そうなスレなんですけど
算数すら苦手だったもので、標準偏差とか
名義貸しでタイーホとかよくわからないんです。
アタマの良い方、単語の意味まとめておいてくれると
バカでも読めるスレになると思うんですが。

41 : :02/12/03 18:12 ID:9oR/vEGB
>>39
だめだこりゃ。

42 : :02/12/03 18:14 ID:Cqi1QMAV
>>41
あきらめたの?
まだ出来ないんだ。「自信作w」

いや、式の意味は聞かないでおいてあげるよw

43 : :02/12/03 18:22 ID:/it5vG7r
俺にはよく分からんが、喧嘩しないで協力して、ある答えを出してみてくらないかな?

44 : :02/12/03 18:32 ID:Cqi1QMAV
>>43
協力する価値があるモデルなりがあるならともかく、小学生レベルの数字合わせを
みんなでやって何がうれしいの?

45 : :02/12/03 18:47 ID:9oR/vEGB
>>41
スレ違いと言われたので公表はやめたんだが。
煽ってどうするの。
まあそんな態度でスレが続くはずもねえよな。
というわけで退出。

46 : :02/12/03 18:53 ID:Cqi1QMAV
>>45
やっぱりね。さようなら。

47 : :02/12/03 18:59 ID:Cqi1QMAV
じゃあ提案しよう。

「今期の柏は大野の出場時間帯に弱くなっていた」

この命題を検証せよw

これは面白そうでしょ。

参考サイト
http://www.j-league.or.jp/game_sitemap/index.html

48 :U-名無しさん:02/12/03 20:07 ID:e5+Kcfdm
>>35の前半部凄まじいな(w 教授が泣くぞ。

49 :  :02/12/03 20:55 ID:S9AQg+hO
つか、9oR/vEGBは、単にレーティングを算出したかっただけで、
それを、予想に使おうとはしてなかったんじゃないかと思うんだが。

まあ、だれでも紙と鉛筆があればできるんだろうが、
俺みたいなど素人だとexcel使っても1時間以上かかりそう。
>>39さん、もし暇なら、excelで作ってどこかにupしてくれると嬉しいな。

50 :_:02/12/03 21:35 ID:rgmBuQNP
>>48
では、正しい解説をどうぞ!

51 : :02/12/03 22:06 ID:Cqi1QMAV
>>49
っていうかね、正直言うと、俺も昔いろいろそういうことやって遊んでたことあるんだよね。
でね、適当に出したレーティングって、結局「適当」な部分による結果しか出ないわけよ。
だってさ、自分の印象を元に適当に式作ってりゃ、自分のほしい印象どおりのレーティングに
なるに決まってるでしょw
印象があってるかどうかを問題にしてるのにさ・・・

だから、結局のとこは、式が説得力を持つかどうか、最適化したものと主張できるかどうか
くらいしかよりどころがないのよね。で、そういうものを説明するためにいろんなモデルがある
わけ。勝つための要因に分解して、時系列モデルとか分散分析とかするならわかるけど。

その辺すっ飛ばしてるから、意味ないんじゃないのと突っ込みたくなるんですわ。


52 : :02/12/03 22:24 ID:ot93c04Y
確かに、勝敗パフォーマンスの要因分析をするには、
サッカーはあまりにもアナログ的な要素が多すぎるため、
どのモデルも説得力が持てないのは当たり前だな。
机上の空論化してしまう。

53 : :02/12/03 22:57 ID:sKfaP4Z2
>>52
確かにそうなんだけど、>>51が言いたいのは、それでも、モデルとしての信頼性を検証しないこと
には統計的な議論の土台にすら載ってないということじゃないだろうか・・・

極端なことを言えば、勝ち数=レーティングです。
って言ってもいいんだから。

54 ::02/12/03 23:22 ID:FLIcA4o2
>>40
例えば10000人くらいが
100点満点のテストを受けたとしましょう。

点数によって棒グラフを作ったとして
平均点が60点とすると形はどうなると思う?
60点が頂点になる山になりそうだよね?

で、60点から+-7点ぐらいの所
つまり53〜67点の人が70%くらい、
60+-21点つまり39〜81点の人が99%くらいに
なる感じだよね。

つづく

55 ::02/12/03 23:30 ID:FLIcA4o2
今のは棒グラフだったけど
なめらかな理想的な山ってのを
昔の偉い人(具体的にはガウスさん)が
決めたんだな。

で、平均点をaとすると
山の面積が68%になる範囲がa-b以上a+b以下だった時
このbの事を標準偏差って決めたわけだ。
(ことばじゃうまく言えんな、、、)

ちなみに幅を今の3倍とると、
つまりa-3b以上a+3b以下だと面積は99%になる。

上の例の7点ての標準偏差です。

56 ::02/12/03 23:32 ID:FLIcA4o2
長文+連続スマソがわかってもらえたかな、、、?

57 :U-名無しさん:02/12/03 23:33 ID:wzULqYMV
これは便利! 2ちゃんサカー用語辞典

http://www45.tok2.com/home/soccer2ch/dictionary/index.html

58 : :02/12/03 23:34 ID:sKfaP4Z2
>>1
ほいっ

http://www.et.soft.iwate-pu.ac.jp/mirror/stat2000/DATA/INDEX.HTM

59 ::02/12/03 23:50 ID:FLIcA4o2
>>58
乙!
40さん、これも見てね。

もひとつ
最後に帰無仮説(きむかせつ)って用語について。

最初にある「ホームは有利じゃない」ってのは
当然漏れの主張したい内容とは逆の事だよね。
でもそれを仮定して、でなんだかんだいって
おかしいとなれば
漏れの主張が正しいってことになるわな。

こんな感じに否定されることが前提になってる仮説を
帰無仮説っていうんだな。

60 :_:02/12/03 23:54 ID:rgmBuQNP
>>54
それこそ、標準偏差だせよ

61 :_:02/12/03 23:57 ID:rgmBuQNP
>>55
55で書いてな

62 : :02/12/04 00:05 ID:CrYp5NgD
1のような場合には二項検定をするのがいいんじゃないか?
いきなり確率を計算できるし。
で、ちょっと計算してみた。
ホーム勝:アウェイ勝が429:288以上に偏る確率は0.000000233(片側)

63 :1(ちなみに柏サポ):02/12/04 00:14 ID:ftTnlioF
>>62
まぁどっちでもいいんじゃないかな。
結果が変わらんからね。

>>60-61
文盲ですまんが
先に標準偏差を表に出したくなかっただけだが、、、

64 : :02/12/04 01:14 ID:e//+Qtun
ん?
平均値の差の検定をやりたかったんだろ?

t検定だろ。>>1でなんでいきなり正規分布なのかも不明だし。

65 : :02/12/04 13:17 ID:lu05JNI/
名義尺度の二値しかとらない(たぶん引き分けはなしって前提?)ので、
t検定でなく二項検定じゃないかな。
名義尺度に関しては、ID:rgmBuQNPが詳しいらしいw。

66 :名無し:02/12/04 19:59 ID:KPa7NIYd
>>63
ごめんね、よく読んでいなかった。

>>65
詳しくないけどね。
     
名義尺度の可能な統計処理
 最頻値、関連係数、カイ2乗検定
順序尺度の可能な統計処理
 メディアン、四分位偏差、順位相関係数、マン・ホイットニーの検定、符号つき順位、和検定
間隔(距離)尺度の可能な統計処理
 平均と標準偏差、ピアソンの相関係数、t検定、分散分析など
比率(比)尺度
 あらゆる統計処理が可能

先の分散分析(勝ち点)の場合は、間隔尺度までいかないため、
分散分析も、t検定もダメ。

結局65が言うように、二項検定だろうね。まぁ後は、ID:lu05JNI/
が説明してくれるだろう。詳しいようなので。

67 :U-名無しさん:02/12/04 20:08 ID:lwgrerEK
スレの流れがようわからんが、
勝ち点は比率尺度じゃないのか?

引き分け×3回=勝ち1回、だろ?

68 : :02/12/04 21:05 ID:lu05JNI/
>>67
いや、67「は」スレの流れが読めている。勝ち点は比率尺度だとおもう。
名義尺度であらわされた量は、違う値同士を加算したり平均は出来ない(66もいっている)。
(例:男=1、女=2として、42人中15人が男だというデータを
 15×1+27×2=39などとしてはいけない)

勝ち点計算に関しては値間の加算をしているので、少なくとも間隔尺度以上。
間隔尺度でなく比率尺度だという理由は67のいうとおり。

ただし、勝ち点は4つの値しかとらんエトセトラの理由で
分散分析が出来ない可能性はあるかもしれんが、詳しいことは知らん。長レス失礼。

69 : :02/12/04 22:06 ID:lu05JNI/
68だが補足。
「勝ち数の比較」をするにはカテゴリカルな名義尺度なので二項検定、
「勝ち点の比較」をするには分散分析そのほか、といいたかった。
これでいいかな →66?

えらそうに書いといてナンなのだが、実は1の検定方法がよくわからん(恥)。
1=63がいうように二項検定と結果はほんとにかわらんのじゃろか?

20 KB
■ このスレッドは過去ログ倉庫に格納されています

★スマホ版★ 掲示板に戻る 全部 前100 次100 最新50

read.cgi ver 05.02.02 2014/06/23 Mango Mangüé ★
FOX ★ DSO(Dynamic Shared Object)