感覚的な仮説を検証【AI分析シリーズ②】

ブリードルーム

進化を続けるAI!現時点での評価はGEMINIがChat-GPTを上回ったと語られる。前回はGEMINI 3 PROで「メスはオスより早く羽化するか」という仮説を証明した。今回はChat-GPT5.2 Thinkingを使って同様の解析を行い結果に相違があるか確認した。

AI使用で重要なことはプロンプトと呼ばれる指示文である。プロンプトは日々新しい考え方が更新されている。しかし、今回は前回使った単純な自然言語を用いる。同じプロンプトのコピー&ペーストならば、GEMINIとChat-GPTの比較はよりフェアにできる。

結果はほぼ同じだった。「ほぼ」と書いた訳は前回よりも1カ月新しいデータを使い、13年分を分析したためだ。小数点第1位は違うものの四捨五入すると、メスは春ブリードで22日、秋で5日の差で早く生まれると統計学的に証明できた。AIの計算能力は疑問符が打たれるが、この程度ならば及第点だろう。

AIはLLM(大規模言語モデル)なため文章生成の検証も必要だ。下記の文章はAIが生成し校正したものだ。「羽化記録で「メスの方が早く羽化するか」を調べた。春はメス11,748件・オス8,400件で、羽化日は平均でメスが約22日早い(中央値でも13日早い)。統計的にも偶然とはほぼ考えにくい結果だ(p=2.24×10^-99)。一方、秋はメス4,177件・オス2,927件で、早さは平均約4日(中央値10日)と春より小さめ。それでも統計的には差があると言える(p=6.32×10^-7)。つまり、春は差が大きく安定、秋の差はあるが春ほど強くないのがポイントである。」

文章はどちらのAIも2度程度の修正を指示して、最後に手動で整えれば使える。また、計算結果の検算は二つのAIに全く同じことをやらせれば精度確認が可能になる。一番大切な事は使う側がやる事を論理的に理解して、適格なソースを選び、「AIが分かるように」説明することだ。向き合い方は人もAIも変わらない。(吉虫)

タイトルとURLをコピーしました