AIが数学の難問を次々と解いている|国際数学オリンピック金メダル・未解決問題の突破まで
AIが国際数学オリンピックで金メダルレベルを達成し、30年間未解決だった数学の難問まで突破しています。AlphaProof、Gemini Deep Think、AlphaEvolve、FunSearchなど、数学を変えつつあるAIの実力と具体的な成果をまとめました。
-
AIが数学を「解く」時代が来た
「AIが数学の問題を解いた」と聞いて、どんなイメージを持ちますか? 電卓のように計算するだけでしょ、と思った方もいるかもしれません。でも、いま起きていることはそんなレベルではないんです。
2024年、Google DeepMindのAI「AlphaProof」が国際数学オリンピック(IMO)で銀メダルレベルを達成しました。そして2025年には「Gemini Deep Think」が金メダルレベルに到達。さらに、人間の数学者が30年間解けなかった未解決問題までAIが突破しています。
これは単なる「計算が速い」という話ではありません。AIが論理的な証明を組み立て、創造的なアプローチで難問に挑み、人間の数学者を驚かせるような解法を見つけているんです。
この記事では、AIが数学の世界でどんな成果を上げているのか、具体的な事例をわかりやすくご紹介していきます。数学が苦手な方でも楽しめる内容になっていますので、ぜひ最後まで読んでみてくださいね。
年 AI 成果 2023年 FunSearch 未解決問題「キャップ集合問題」に新解法 2024年 AlphaProof + AlphaGeometry 2 IMO銀メダルレベル(6問中4問正解) 2025年 AlphaEvolve 56年間破られなかった行列乗算の記録を更新 2025年 Gemini Deep Think IMO金メダルレベル(6問中5問正解) 2025年 GPT-5.2 Pro エルデシュの未解決問題を解決 -
AlphaProof — 国際数学オリンピックで銀メダルレベルを達成
2024年7月、Google DeepMindが開発した「AlphaProof」と「AlphaGeometry 2」が、国際数学オリンピック(IMO)の問題に挑戦し、6問中4問を正解して銀メダルレベルを達成しました。これは歴史上、AIがIMOレベルの数学問題をこの規模で解いた初めての快挙です。

国際数学オリンピックとは?
IMOは毎年開催される、高校生を対象とした世界最高峰の数学コンテストです。各国から選ばれた精鋭が6問の難問に挑み、その成績で金・銀・銅メダルが授与されます。問題は単なる計算ではなく、独創的な証明や論理的推論が求められる超難問ばかり。プロの数学者でも手こずるレベルなんですよ。
AlphaProofの仕組み
AlphaProofのすごいところは、単に答えを出すだけでなく、数学的に厳密な証明を生成できる点です。形式証明言語「Lean」を使い、一歩一歩論理的なステップを踏んで証明を組み立てます。しかも、チェスや囲碁で人間を超えた「AlphaZero」の強化学習アルゴリズムを応用しています。
具体的には、AlphaProofは代数の2問と整数論の1問を解き、AlphaGeometry 2は幾何学の問題をわずか19秒で解きました。特に注目すべきは、AlphaProofが今年のIMOで最も難しいとされた問題(人間の参加者630人中わずか5人しか解けなかった問題)を解いたことです。
ただし、1問は数分で解けたものの、他の問題は最大3日間かかっています。人間の制限時間は4.5時間×2日なので、時間の面ではまだ改善の余地がありますね。
-
Gemini Deep Think — IMO金メダルを獲得、AIが人間の天才に並ぶ
AlphaProofの銀メダルからわずか1年後の2025年、Google DeepMindは再び数学界を驚かせました。「Gemini Deep Think」がIMOで金メダルレベルを達成したのです。
5問正解、42点中35点
Gemini Deep Thinkは6問中5問を正解し、42点満点中35点を獲得。IMO会長のグレゴール・ドリナー教授は「Google DeepMindは待望のマイルストーンに到達した」と公式に認定しました。ちなみに、2025年のIMOでは人間の参加者630人中、金メダルを獲得したのはわずか67人。AIはその中に入るレベルの成績を収めたわけです。
2024年からの大きな進化
前年のAlphaProofとの決定的な違いは、Gemini Deep Thinkが自然言語でエンドツーエンドに動作した点です。2024年のAlphaProofでは、人間の専門家が問題を形式言語(Lean)に翻訳する必要がありました。しかし2025年のGeminiは、公式の問題文をそのまま読み取り、4.5時間の制限時間内に厳密な数学的証明を生成しました。
さらに「並列思考(Parallel Thinking)」という新技術も導入されています。これは複数の解法を同時に探索し、最も有望なアプローチを組み合わせるという手法で、人間の数学者が「いくつかのアプローチを頭の中で並行して考える」のに似ています。
たった1年で銀メダルから金メダルへ — AIの数学的推論能力の進化スピードには、本当に驚かされますよね。
-
AlphaEvolve — 56年間破られなかった数学の記録を更新
2025年5月、Google DeepMindはまた新たなAIを発表しました。「AlphaEvolve」です。このAIは、56年間誰も破れなかった行列乗算の記録を打ち破りました。

行列乗算の効率化 — 56年ぶりの記録更新
1969年、ドイツの数学者フォルカー・シュトラッセンが、4×4の複素数行列の乗算を49回のスカラー乗算で行える方法を発見しました。これは当時の常識を覆す画期的な発見でしたが、その後56年間、この記録は破られませんでした。
AlphaEvolveは、これを48回のスカラー乗算で実現する方法を発見。たった1回の改善に聞こえるかもしれませんが、行列乗算はコンピュータ科学の根幹に関わる演算であり、この改善は膨大な計算資源の節約につながります。
接吻数問題(Kissing Number Problem)にも挑戦
AlphaEvolveは「接吻数問題」という、ニュートンが1694年に提起した歴史的な数学問題にも取り組みました。これは「ある球に、同じ大きさの球を重ならないようにいくつ接触させられるか」という問題です。3次元では答えは12(これ自体証明に数百年かかりました)ですが、11次元では下限が592とされていました。
AlphaEvolveはこの下限を593に引き上げることに成功。一見地味な「1」の改善ですが、高次元の幾何学における新しい対称構造の発見を意味しており、数学者たちを驚かせました。
AlphaEvolveの技術的なアプローチ
AlphaEvolveはGeminiの言語モデルと進化的アルゴリズムを組み合わせたシステムです。単に問題を「解く」のではなく、仮説を生成し、最適化戦略をテストし、未探索のパターンを発見するという、まさに数学研究者のような探索的アプローチを取っているんですよ。
-
FunSearch — 未解決だった「キャップ集合問題」に新解法を発見
AIが数学の未解決問題を解く流れは、実は2023年末から始まっていました。Google DeepMindの「FunSearch」がその先駆けです。

キャップ集合問題とは?
キャップ集合問題は、組合せ数学における有名な未解決問題です。簡単に言うと、「特定の条件を満たす数の集合の最大サイズはいくらか?」という問題で、暗号理論やコンピュータ科学にも応用がある重要なテーマです。
AIが人間を超える解法を発見
FunSearchは、Googleの大規模言語モデル「Codey」(PaLM 2をコード向けにチューニングしたもの)と、生成された解を自動で検証・評価するシステムを組み合わせたものです。数日間かけて数百万の候補解を生成・検証し、その中から人間が考案したどの方法よりも優れた解法を見つけ出しました。
フィールズ賞受賞者のテレンス・タオ教授は、FunSearchについて「有望なパラダイム」と評価しています。世界最高峰の数学者がAIの数学的能力を認めたという事実は、非常に大きな意味を持ちますよね。
FunSearchの革新的なポイント
従来のAIは数学の問題に対して「もっともらしいが正しいとは限らない」回答を出すことが多く、いわゆるハルシネーション(幻覚)のリスクがありました。しかしFunSearchは、生成した解を自動で検証する仕組みを組み込んでいます。「間違いを自分でチェックできるAI」とも言えますね。これが数学問題に対するAI活用の大きなブレークスルーとなりました。
-
GPTシリーズやその他のAIも数学で急成長
Google DeepMindだけでなく、他のAIも数学の分野で目覚ましい成果を上げています。
GPT-5.2 Pro — エルデシュの未解決問題を解決
2025年、OpenAIのGPT-5.2 Proが、20世紀最大の数学者の一人ポール・エルデシュが提起した未解決問題の一つを解いたと報告されました。テレンス・タオ教授は「これは既存の文献では再現されていない近自律的な解決であり、AI能力の真の向上を表している」とコメントしています。
AIME(米国数学招待試験)でのAI性能
米国の数学コンテストAIME 2025では、AIモデルの性能が劇的に向上しています。
AIモデル AIME正答率 備考 o3 Mini 86.5% OpenAIの推論特化モデル o3 91.6% AIME 2024の結果 o4-mini(ツール使用) 99.5% ほぼ全問正解 GPT-5 Pro(ツール使用) 100% 完全正解を達成 Princeton大学の定理証明AI「Goedel-Prover-V2」
プリンストン大学が開発したオープンソースの定理証明AI「Goedel-Prover-V2」は、数学的定理を自動で証明するベンチマーク(miniF2F)で正答率60%から90%へと大幅に改善されました。これは「最強のオープンソース定理証明器」と評されています。
もはやAIの数学的能力は、一部の分野で人間の専門家と肩を並べるレベルに達しているんですよ。
-
AIは数学者の仕事を奪うのか? — 研究パートナーとしての可能性
ここまで読んで、「AIがこんなに数学ができるなら、数学者はもう必要ないのでは?」と思った方もいるかもしれません。でも、現時点ではそうはなりません。むしろ、AIは数学者の最強の研究パートナーになりつつあります。

AIが得意なこと・苦手なこと
分野 AIの実力 形式的な証明の検証 ◎ 人間を超える正確さ 計算集約的な探索 ◎ 数百万の候補を高速に検証 パターン認識 ○ 人間が見逃す構造を発見 新しい問題の着想 △ まだ人間の直感に及ばない 数学的な「美しさ」の判断 × 人間にしかできない MITやプリンストン大学では、AIを使って数学的発見を加速させるプロジェクトが本格的に始まっています。数学者がアイデアを出し、AIがそれを高速に検証・拡張するという「人間×AI」のコラボレーションが、今後の数学研究の主流になっていくかもしれませんね。
数学の歴史を振り返ると、計算機の登場がそうだったように、AIもまた数学者の能力を拡張する道具として受け入れられていくのではないでしょうか。
-
AIと数学をもっと深く知りたい方におすすめの本
人工知能プログラミングのための数学がわかる本
AIの裏側にある数学をわかりやすく解説した入門書です。微分・線形代数・確率統計の基礎から、実際のAIプログラミングへの応用まで、数学が苦手な方でもステップバイステップで学べますよ。AIがどうやって数学の問題を「考える」のか、その仕組みに興味がある方におすすめです。機械学習のための数学
機械学習の理論的な基盤となる数学を体系的に学べる一冊です。線形回帰や主成分分析など、4つの基本手法の数学的導出が丁寧に解説されています。AlphaProofやGeminiの背後にある数学に触れたい方に最適ですよ。生成AIの法的リスクと対策【増補改訂版】
AIの進化に伴うリスクも知っておきたいという方に。AIが生成した数学的証明の著作権は誰のもの? AIの出力に誤りがあった場合の責任は? そんな疑問に答えてくれる、AI時代の必読書です。 -
まとめ
この記事では、AIが数学の難問を解いた具体的な事例をご紹介しました。
2023年のFunSearchによる未解決問題への挑戦に始まり、2024年のAlphaProofによるIMO銀メダル、2025年のGemini Deep ThinkによるIMO金メダル、AlphaEvolveによる56年ぶりの記録更新、そしてGPT-5.2 Proによるエルデシュ問題の解決 — AIの数学的能力はまさに急速に進化しています。
特に印象的なのは、AIが単なる計算機ではなく、創造的な問題解決ができるようになっている点です。人間の数学者が見つけられなかった対称性やパターンを発見し、これまでにない証明方法を生み出しています。
とはいえ、AIが数学者に取って代わるわけではありません。「どんな問題に取り組むべきか」「その結果にどんな意味があるのか」を判断するのは、依然として人間の仕事です。AIと人間がそれぞれの強みを活かして協力する — そんな新しい数学研究の時代が、もう始まっているんですよ。
編集部Pickup記事
-
Excelを使った在庫管理のやり方、表の作り方、使える関数をご紹介!
企業の活動において、消費者であるユーザーが欲しがる商品を、欲しいタイミングで、欲しい分だけ適切に提供できることが、企業が目指すひとつの理想の形ではないでしょうか。 実際、「適正な在庫水準とは何か?」という問いにパーフェクトに答えるのは難しいとはいえ、ある程度の健全な在庫水準を保ち、欠品を防止に務めるのは、およそ商品を扱う企業にとっては共通の使命ともいえるのでしょう。 適性な在庫水準を保つために必要となるのが在庫管理表です。 実際に、紙での在庫管理をしていることも少なくないと思いますが、扱う商品などのアイテム数が多い場合、紙の在庫管理表では管理しきれなくなる可能性も出てきます。そこで便利でかつ的確な在庫管理を可能にするのが、Excelです。 本記事では、Excelを活用した在庫管理の方法について、在庫管理のやり方、表の作り方、使える関数をまとめてご紹介します!
-
AI動画生成ツール徹底比較!Sora・Runway・Kling・Pika・Veo、2026年最強はどれ?
Sora 2、Runway Gen-4.5、Kling 2.6、Pika 2.5、Google Veo 3.1など主要AI動画生成ツールを料金・画質・生成時間まで徹底比較。無料プランの有無や商用利用、日本語対応まで、2026年に動画制作を始めるならどのツールを選ぶべきかわかりやすく解説します。
-
主要生成AIモデルの比較:ChatGPT、Gemini、Claude、Llama 3、Grok
生成AIは、ビジネス、教育、クリエイティブ分野で急速に進化しており、その中でもChatGPT(OpenAI)、Gemini(Google)、Claude(Anthropic)、Llama 3(Meta)、Grok(xAI)の5つのモデルは注目されています。本記事では、これらのモデルを以下のポイントで比較します。
-
AI × Excel活用術!Copilot・ChatGPT・Gemini、エクセル業務を劇的に効率化する方法
Excel × AIの最新活用術を徹底解説。COPILOT関数・Agent Mode・ChatGPT for Excel・Gemini in Sheetsなど、エクセル業務を自動化する3つの方法を、料金・機能比較から具体的な活用例まで紹介します。
-
NotebookLM活用術|海外で話題の使い方10選と日本では知られていない裏ワザ【2026年最新】
NotebookLMを「音声要約ツール」としてしか使っていませんか? 実は海外では、法律文書の横断分析、AIポッドキャスト制作、競合インテリジェンス、大学の論文レビューなど、日本ではまだ知られていない驚きの活用法が広がっています。2026年3月にはCinematic Video Overviewsも登場。この記事では、英語圏の最新事例・パワーユーザーの裏ワザ・知っておくべき落とし穴まで、日本語記事では読めない情報を徹底解説します。
-
【業界別】AI・人工知能の活用事例20選!ビジネスにおけるAIの今後は?
近年、AI(人工知能)は様々な分野で活用が進んでいます。 AIを組み込んだ便利な仕組みやサービスが次々に登場し、あらゆる業界で活用され始めています。 この記事では、AIがどのように我々の生活や仕事を便利にするのか、業界・産業別にAI活用事例を解説していきます。
関連した事例
-
FIRE×生成AI|ChatGPTで資産形成・節約・副業を加速して早期リタイアを実現する方法【2026年版】
FIRE(経済的自立・早期リタイア)をAIで加速!ChatGPTで4%ルールシミュレーション、支出分析、AI副業で入金力UP、投資判断のセカンドオピニオンまで。FIREを目指す人のためのAI活用完全ガイド。
-
新入社員×ChatGPT|入社1週間目から同期と差がつく生成AI仕事術10選【2026年版】
新入社員こそAIを使え!ビジネスメール・議事録・企画書・敬語チェック・業界研究——入社直後から即戦力になるChatGPT活用術を10個厳選。先輩に聞けない「今さら質問」もAIなら何度でもOKです。
-
筋トレ×生成AI|ChatGPTをAIパーソナルトレーナーにして理想の体を手に入れる方法【2026年版】
パーソナルトレーナーは月3万円。ChatGPTなら月$20。AIが毎日のメニュー自動作成・フォーム解説・食事PFC管理・停滞期の打開策まで担当。筋トレ初心者から上級者まで使えるプロンプト付き完全ガイド。
-
「苦労キャンセル」時代到来!面倒なことを全部AIに丸投げする方法10選【2026年版】
日経トレンディ2026年ヒット予測のキーワード「苦労キャンセル」。家事・手続き・調べ物・買い物・文章作成——人生の面倒ごとをChatGPT・Geminiに丸投げする具体的な方法を10個紹介します。
-
SNS疲れのZ世代がAIに逃げ込む理由|「アテンション・デトックス」時代の新しい心の居場所【2026年版】
Z世代の62%がスマホ疲れを実感、67%がSNS時間を減らしたい——SNS利用率が初めて伸びなくなった2025年、若者はなぜAIに本音を話し始めたのか。SHIBUYA109 lab.調査データで読み解きます。
-
GW旅行はChatGPTに丸投げ!最高の旅行プランを作るプロンプト術&裏ワザ【2026年版】
GWの旅行計画をChatGPTで完全自動化!行き先提案・タイムスケジュール・持ち物リスト・穴場スポット・予算管理まで。コピペで使えるプロンプト付きで、最高のGW旅行プランの作り方を解説します。
-
女子学生はなぜ生成AIにハマるのか?恋愛相談から就活ESまで、リアルな活用術を徹底解説【2026年版】
女子高生の72%が「ChatGPTがなくなったら困る」と回答。恋愛相談、就活ES作成、コーデ提案、勉強プランナー、セルフケアまで——Z世代女子のリアルなAI活用術を日本と海外の事例で徹底解説します。
-
デイトレーダーは生成AIをどう使っているのか?ChatGPTで銘柄分析・戦略立案・リスク管理【2026年版】
個人投資家の73%が生成AIを活用する時代。ChatGPTでの銘柄スクリーニング、センチメント分析、トレード日誌の自動化から、海外トレーダーの実践プロンプトまで。デイトレード×AIの最前線を徹底解説します。
-
歴史研究×生成AIの最前線|古文書AI解読・ナスカの地上絵発見・ChatGPTで史料分析【2026年版】
AIが歴史を変える!5万枚の古文書を1ヶ月で解読、ナスカの地上絵303個をAI発見、ローマ碑文をAIが復元——Nature掲載の最新研究から古文書カメラアプリまで、歴史×AIの最前線を徹底解説します。



