AIが数学の難問を次々と解いている｜国際数学オリンピック金メダル・未解決問題の突破まで

総合情報サイト / AI活用事例・AI導入事例 / AIが数学の難問を次々と解いている｜国際数学オリンピック金メダル・未解決問題の突破まで

AIが数学の難問を次々と解いている｜国際数学オリンピック金メダル・未解決問題の突破まで

AIが国際数学オリンピックで金メダルレベルを達成し、30年間未解決だった数学の難問まで突破しています。AlphaProof、Gemini Deep Think、AlphaEvolve、FunSearchなど、数学を変えつつあるAIの実力と具体的な成果をまとめました。

AIが数学を「解く」時代が来た

「AIが数学の問題を解いた」と聞いて、どんなイメージを持ちますか？電卓のように計算するだけでしょ、と思った方もいるかもしれません。でも、いま起きていることはそんなレベルではないんです。

2024年、Google DeepMindのAI「AlphaProof」が国際数学オリンピック（IMO）で銀メダルレベルを達成しました。そして2025年には「Gemini Deep Think」が金メダルレベルに到達。さらに、人間の数学者が30年間解けなかった未解決問題までAIが突破しています。

これは単なる「計算が速い」という話ではありません。AIが論理的な証明を組み立て、創造的なアプローチで難問に挑み、人間の数学者を驚かせるような解法を見つけているんです。

この記事では、AIが数学の世界でどんな成果を上げているのか、具体的な事例をわかりやすくご紹介していきます。数学が苦手な方でも楽しめる内容になっていますので、ぜひ最後まで読んでみてくださいね。

年	AI	成果
2023年	FunSearch	未解決問題「キャップ集合問題」に新解法
2024年	AlphaProof + AlphaGeometry 2	IMO銀メダルレベル（6問中4問正解）
2025年	AlphaEvolve	56年間破られなかった行列乗算の記録を更新
2025年	Gemini Deep Think	IMO金メダルレベル（6問中5問正解）
2025年	GPT-5.2 Pro	エルデシュの未解決問題を解決

AlphaProof — 国際数学オリンピックで銀メダルレベルを達成

2024年7月、Google DeepMindが開発した「AlphaProof」と「AlphaGeometry 2」が、国際数学オリンピック（IMO）の問題に挑戦し、6問中4問を正解して銀メダルレベルを達成しました。これは歴史上、AIがIMOレベルの数学問題をこの規模で解いた初めての快挙です。

国際数学オリンピックとは？

IMOは毎年開催される、高校生を対象とした世界最高峰の数学コンテストです。各国から選ばれた精鋭が6問の難問に挑み、その成績で金・銀・銅メダルが授与されます。問題は単なる計算ではなく、独創的な証明や論理的推論が求められる超難問ばかり。プロの数学者でも手こずるレベルなんですよ。

AlphaProofの仕組み

AlphaProofのすごいところは、単に答えを出すだけでなく、数学的に厳密な証明を生成できる点です。形式証明言語「Lean」を使い、一歩一歩論理的なステップを踏んで証明を組み立てます。しかも、チェスや囲碁で人間を超えた「AlphaZero」の強化学習アルゴリズムを応用しています。

具体的には、AlphaProofは代数の2問と整数論の1問を解き、AlphaGeometry 2は幾何学の問題をわずか19秒で解きました。特に注目すべきは、AlphaProofが今年のIMOで最も難しいとされた問題（人間の参加者630人中わずか5人しか解けなかった問題）を解いたことです。

ただし、1問は数分で解けたものの、他の問題は最大3日間かかっています。人間の制限時間は4.5時間×2日なので、時間の面ではまだ改善の余地がありますね。
Gemini Deep Think — IMO金メダルを獲得、AIが人間の天才に並ぶ

AlphaProofの銀メダルからわずか1年後の2025年、Google DeepMindは再び数学界を驚かせました。「Gemini Deep Think」がIMOで金メダルレベルを達成したのです。

5問正解、42点中35点

Gemini Deep Thinkは6問中5問を正解し、42点満点中35点を獲得。IMO会長のグレゴール・ドリナー教授は「Google DeepMindは待望のマイルストーンに到達した」と公式に認定しました。ちなみに、2025年のIMOでは人間の参加者630人中、金メダルを獲得したのはわずか67人。AIはその中に入るレベルの成績を収めたわけです。

2024年からの大きな進化

前年のAlphaProofとの決定的な違いは、Gemini Deep Thinkが自然言語でエンドツーエンドに動作した点です。2024年のAlphaProofでは、人間の専門家が問題を形式言語（Lean）に翻訳する必要がありました。しかし2025年のGeminiは、公式の問題文をそのまま読み取り、4.5時間の制限時間内に厳密な数学的証明を生成しました。

さらに「並列思考（Parallel Thinking）」という新技術も導入されています。これは複数の解法を同時に探索し、最も有望なアプローチを組み合わせるという手法で、人間の数学者が「いくつかのアプローチを頭の中で並行して考える」のに似ています。

たった1年で銀メダルから金メダルへ — AIの数学的推論能力の進化スピードには、本当に驚かされますよね。
AlphaEvolve — 56年間破られなかった数学の記録を更新

2025年5月、Google DeepMindはまた新たなAIを発表しました。「AlphaEvolve」です。このAIは、56年間誰も破れなかった行列乗算の記録を打ち破りました。

行列乗算の効率化 — 56年ぶりの記録更新

1969年、ドイツの数学者フォルカー・シュトラッセンが、4×4の複素数行列の乗算を49回のスカラー乗算で行える方法を発見しました。これは当時の常識を覆す画期的な発見でしたが、その後56年間、この記録は破られませんでした。

AlphaEvolveは、これを48回のスカラー乗算で実現する方法を発見。たった1回の改善に聞こえるかもしれませんが、行列乗算はコンピュータ科学の根幹に関わる演算であり、この改善は膨大な計算資源の節約につながります。

接吻数問題（Kissing Number Problem）にも挑戦

AlphaEvolveは「接吻数問題」という、ニュートンが1694年に提起した歴史的な数学問題にも取り組みました。これは「ある球に、同じ大きさの球を重ならないようにいくつ接触させられるか」という問題です。3次元では答えは12（これ自体証明に数百年かかりました）ですが、11次元では下限が592とされていました。

AlphaEvolveはこの下限を593に引き上げることに成功。一見地味な「1」の改善ですが、高次元の幾何学における新しい対称構造の発見を意味しており、数学者たちを驚かせました。

AlphaEvolveの技術的なアプローチ

AlphaEvolveはGeminiの言語モデルと進化的アルゴリズムを組み合わせたシステムです。単に問題を「解く」のではなく、仮説を生成し、最適化戦略をテストし、未探索のパターンを発見するという、まさに数学研究者のような探索的アプローチを取っているんですよ。
FunSearch — 未解決だった「キャップ集合問題」に新解法を発見

AIが数学の未解決問題を解く流れは、実は2023年末から始まっていました。Google DeepMindの「FunSearch」がその先駆けです。

キャップ集合問題とは？

キャップ集合問題は、組合せ数学における有名な未解決問題です。簡単に言うと、「特定の条件を満たす数の集合の最大サイズはいくらか？」という問題で、暗号理論やコンピュータ科学にも応用がある重要なテーマです。

AIが人間を超える解法を発見

FunSearchは、Googleの大規模言語モデル「Codey」（PaLM 2をコード向けにチューニングしたもの）と、生成された解を自動で検証・評価するシステムを組み合わせたものです。数日間かけて数百万の候補解を生成・検証し、その中から人間が考案したどの方法よりも優れた解法を見つけ出しました。

フィールズ賞受賞者のテレンス・タオ教授は、FunSearchについて「有望なパラダイム」と評価しています。世界最高峰の数学者がAIの数学的能力を認めたという事実は、非常に大きな意味を持ちますよね。

FunSearchの革新的なポイント

従来のAIは数学の問題に対して「もっともらしいが正しいとは限らない」回答を出すことが多く、いわゆるハルシネーション（幻覚）のリスクがありました。しかしFunSearchは、生成した解を自動で検証する仕組みを組み込んでいます。「間違いを自分でチェックできるAI」とも言えますね。これが数学問題に対するAI活用の大きなブレークスルーとなりました。

GPTシリーズやその他のAIも数学で急成長

Google DeepMindだけでなく、他のAIも数学の分野で目覚ましい成果を上げています。

GPT-5.2 Pro — エルデシュの未解決問題を解決

2025年、OpenAIのGPT-5.2 Proが、20世紀最大の数学者の一人ポール・エルデシュが提起した未解決問題の一つを解いたと報告されました。テレンス・タオ教授は「これは既存の文献では再現されていない近自律的な解決であり、AI能力の真の向上を表している」とコメントしています。

AIME（米国数学招待試験）でのAI性能

米国の数学コンテストAIME 2025では、AIモデルの性能が劇的に向上しています。

AIモデル	AIME正答率	備考
o3 Mini	86.5%	OpenAIの推論特化モデル
o3	91.6%	AIME 2024の結果
o4-mini（ツール使用）	99.5%	ほぼ全問正解
GPT-5 Pro（ツール使用）	100%	完全正解を達成

Princeton大学の定理証明AI「Goedel-Prover-V2」

プリンストン大学が開発したオープンソースの定理証明AI「Goedel-Prover-V2」は、数学的定理を自動で証明するベンチマーク（miniF2F）で正答率60%から90%へと大幅に改善されました。これは「最強のオープンソース定理証明器」と評されています。

もはやAIの数学的能力は、一部の分野で人間の専門家と肩を並べるレベルに達しているんですよ。

AIは数学者の仕事を奪うのか？ — 研究パートナーとしての可能性

ここまで読んで、「AIがこんなに数学ができるなら、数学者はもう必要ないのでは？」と思った方もいるかもしれません。でも、現時点ではそうはなりません。むしろ、AIは数学者の最強の研究パートナーになりつつあります。

AIが得意なこと・苦手なこと

分野	AIの実力
形式的な証明の検証	◎ 人間を超える正確さ
計算集約的な探索	◎ 数百万の候補を高速に検証
パターン認識	○ 人間が見逃す構造を発見
新しい問題の着想	△ まだ人間の直感に及ばない
数学的な「美しさ」の判断	× 人間にしかできない

MITやプリンストン大学では、AIを使って数学的発見を加速させるプロジェクトが本格的に始まっています。数学者がアイデアを出し、AIがそれを高速に検証・拡張するという「人間×AI」のコラボレーションが、今後の数学研究の主流になっていくかもしれませんね。

数学の歴史を振り返ると、計算機の登場がそうだったように、AIもまた数学者の能力を拡張する道具として受け入れられていくのではないでしょうか。

AIと数学をもっと深く知りたい方におすすめの本

人工知能プログラミングのための数学がわかる本
AIの裏側にある数学をわかりやすく解説した入門書です。微分・線形代数・確率統計の基礎から、実際のAIプログラミングへの応用まで、数学が苦手な方でもステップバイステップで学べますよ。AIがどうやって数学の問題を「考える」のか、その仕組みに興味がある方におすすめです。

機械学習のための数学
機械学習の理論的な基盤となる数学を体系的に学べる一冊です。線形回帰や主成分分析など、4つの基本手法の数学的導出が丁寧に解説されています。AlphaProofやGeminiの背後にある数学に触れたい方に最適ですよ。

生成AIの法的リスクと対策【増補改訂版】
AIの進化に伴うリスクも知っておきたいという方に。AIが生成した数学的証明の著作権は誰のもの？ AIの出力に誤りがあった場合の責任は？そんな疑問に答えてくれる、AI時代の必読書です。
まとめ

この記事では、AIが数学の難問を解いた具体的な事例をご紹介しました。

2023年のFunSearchによる未解決問題への挑戦に始まり、2024年のAlphaProofによるIMO銀メダル、2025年のGemini Deep ThinkによるIMO金メダル、AlphaEvolveによる56年ぶりの記録更新、そしてGPT-5.2 Proによるエルデシュ問題の解決 — AIの数学的能力はまさに急速に進化しています。

特に印象的なのは、AIが単なる計算機ではなく、創造的な問題解決ができるようになっている点です。人間の数学者が見つけられなかった対称性やパターンを発見し、これまでにない証明方法を生み出しています。

とはいえ、AIが数学者に取って代わるわけではありません。「どんな問題に取り組むべきか」「その結果にどんな意味があるのか」を判断するのは、依然として人間の仕事です。AIと人間がそれぞれの強みを活かして協力する — そんな新しい数学研究の時代が、もう始まっているんですよ。