Shoji Times

#2026-05-09
20 sources → 14 news printed at 2026/05/10
ai science
フィールズ賞数学者がChatGPT 5.5 Proに数論の未解決問題を解かせ、博士論文級の指数→多項式バウンド改善を得る

フィールズ賞数学者がChatGPT 5.5 Proに数論の未解決問題を解かせ、博士論文級の指数→多項式バウンド改善を得る

数学研究の参入条件が「誰も解けていない問題を解く」から「LLMが解けない問題を解く」へと変わり、PhD課程・査読制度・著者性の議論が再構築される

OpenAI ChatGPT 5.5 Pro、数論の未解決問題で指数バウンドを多項式バウンドに改善し、博士課程相当の数学論文を1時間以内に独力で生成


何が変わったか

これまで「LLMが数学研究を担う」という主張は、Erdős問題で文献内に既存解を再発見する程度の事例が中心で、独力での新規証明は限定的だった。

トリニティ・カレッジ・ケンブリッジのフェローでフィールズ賞受賞者の Timothy Gowers が ChatGPT 5.5 Pro に Mel Nathanson の整数和集合に関する未解決問題を投げ、指数バウンドの改善を求めたところ、モデルは17分で最良構成の二次バウンドを返し、その後の一般化版でも31分で指数→多項式の改善を独力で達成した。Gowers自身は数学的貢献ゼロ、プロンプト工夫もなかったと述べる。

AIと数学のヘッダー画像
The Decoder のキービジュアル。GPT-Image-2 で生成された記事ヘッダー。

社会にどんな影響があるか

数学研究の参入条件が再定義される。Gowersは「数学研究への貢献の下限は『誰も解けていない問題を解くこと』ではなく『LLMが解けない問題を解くこと』になる」と述べた。博士論文の評価基準・査読制度・著者性 (authorship) の概念がこの一年で揺り戻しを受ける可能性が高い

副作用として、Google DeepMind の Aletheia は700の未解決問題で正答率6.5%にとどまったように、LLMの数学的「成功」は正解と幻覚の振れ幅が大きい。LLMが返した証明を人間が検算する負荷が研究プロセスのボトルネックになる構造が定着する。

俺にどんな影響があるか

PRESの「研究室の暗黙知をAIで企業に橋渡しする」モデルにとって、研究側の生産関数が変わる事象は重大だ。研究者がLLMを「下請けの計算機」ではなく「対等な共同推論者」として扱う時代に入ると、研究室が企業に提供できる暗黙知の中身も「アルゴリズム実装力」から「LLMが解けない問題の特定能力」に重心が移る。レンタルDX推進室のサービス設計でも、研究室にプロンプティング能力ではなく検証・問題設定の上流能力を求める方向に商品定義を寄せるべき示唆になる。

ニュースの詳細

実験対象は数論者 Mel Nathanson の論文 (arXiv:2603.15556) における、特定性質を持つ整数和集合のサイズに関する未解決問題。第一問題ではモデルが17分5秒で指数バウンドを二次バウンドに改善し、その鍵となる発想は「Nathanson の証明内の構成要素を組合せ論で既知のより効率的な変種に置き換える」というもの。LaTeX組版に2分23秒。

一般化問題では MIT 学生 Isaac Rajagopal の先行論文 (arXiv:2510.23022)を入力し、モデルが16分41秒で第一改善 (Rajagopal 評価:「ルーチン的な拡張」)、続く13分33秒+9分12秒の追加検証を経て指数→多項式の改善を完成。Rajagopalは鍵となるアイデアを「代数構造を組合せ的性質を保ったまま小さい数値範囲に圧縮する反直観的手法」と評し、「完全にオリジナル」と判定。

Gowersはこの結果を「組合せ論PhDの章として完全に妥当だが驚異的ではない」と位置づけ、人類数学者の同等作業には数週間を要するとしている。プレプリントはGoogle Drive上で公開済み。

キーワード解説

フィールズ賞 とは、国際数学者会議で4年ごとに40歳以下の数学者2-4名に授与される賞。数学界における最高権威の賞のひとつとされ、ノーベル賞に数学部門がない代替として位置づけられる。Timothy Gowersは1998年受賞者で、組合せ論・関数解析を専門とする。

Erdős問題 とは、ハンガリー出身の数学者Paul Erdős (1913-1996) が生涯で約1,500件提示した未解決問題群の総称。難易度の幅が「数桁レベル」で異なるとTerence Taoが警告するように、新しい技法を必要とする深い問題と、誰も真剣に挑戦しなかったために残っていただけの問題が混在する点に注意が必要となる。

指数バウンドと多項式バウンド とは、問題のサイズ$n$に対して解の上限値が$2^n$型で増えるか$n^k$型で増えるかという証明の強度の違い。多項式バウンドは指数バウンドより遥かに強く、計算可能性・効率性の観点で実用的に意味のある改善とみなされる。

プレプリント とは、査読を経る前に著者が公開する論文ドラフト。物理学・数学・コンピュータサイエンス分野ではarXivで公開するのが慣行で、査読プロセスと並行して同分野の研究者が即座にコメントできる仕組み。Gowersらが今回公開した結果もこの形式。

source: The Decoder , Timothy Gowers ブログ , Mel Nathanson 元論文 (arXiv)