国产精品久久久久久一区二区三区_美女诱惑一区_久久99免费视频_国模大胆一区二区三区_成人精品电影在线观看_综合久久国产九一剧情麻豆_亚洲欧美日韩国产综合_国产精品久久久久久久久搜平片

陶哲軒用GPT5-Pro跨界挑戰!3年無解的難題,11分鐘出完整證明

2025-10-11 15:59:56

夢晨 鷺羽 發自 凹非寺

量子位 | 公眾號 QbitAI

陶哲軒與GPT-5 Pro這對搭檔再大發神威,解決了一個3年無人解決的難題。


【資料圖】

而且是 “不太在自己專業范圍內”的問題:微分幾何領域的開放問題。

要知道,陶哲軒擅長的分析、數論、組合學等研究的往往是整數、函數、算子的性質。而微分幾何更側重于流形的性質,常用的工具也很不一樣。

陶哲軒只是按自己直覺給了一個大致方向,GPT-5 Pro就從復雜計算到嚴謹證明一氣呵成,幫助陶哲軒捕捉關鍵邏輯,突破傳統思維局限。

甚至在AI幫助下最終發現自己的直覺有誤,但通過這個過程更好理解了問題。

有了這次跨界解題的經驗,陶哲軒對AI在學術研究上的作用也有了新的思考,他總結到:

AI在小尺度上很有用,中尺度上有些無益,大尺度上又有幫助。

AI從計算到證明一氣呵成

先來看看原始問題,是3年前就在mathoverflow上提出的:

設一個三維空間中的光滑拓撲球面圍成的區域,且曲面的主曲率絕對值不超過1,那么它包圍的體積是否至少等于單位球的體積?

陶哲軒最初的思路是將問題限制在星形區域上,借助積分不等式推進。但他的微分幾何有些生疏,所以請AI幫他進行這些計算。

結果GPT-5 Pro思考了 11分18秒,不僅完成了所有計算,還直接給出了星形情況下問題的完整證明。

證明過程運用了各種不等式和恒等式,其中有些陶哲軒熟悉(比如Stokes定理和Willmore不等式),也有一個他也第一次接觸的Minkowski第一積分公式。

有了這些不等式,加上算術-幾何平均不等式,星形情況的證明實際上就是一行論證。

到目前為止,一切順利。

接下來他需要驗證證明的各個步驟,但網絡上沒有找到有用的資源。

再次詢問AI后,直接 得到兩個令他滿意的證明:一個是按照他建議使用散度定理的路線,另一個是基于他沒想到的流方法。

通過AI的計算和證明,陶哲軒打算將其視為一個擾動橢圓偏微分方程問題,AI在這個思路上表現也良好。

雖然在估計一個擾動非線性項時出現了輕微的錯誤,但并非無法修復。而且AI還主動指出一個特殊情況其實又能回到星形的結果。

成功地用偏微分方程擾動理論的方法,解決了 當曲面形狀與單位球面差距不大(Small Data)時的情形。

但真正困難且未解決的,是 當曲面形狀與球面差距巨大(Large Data)時的問題。

陶哲軒意識到可以用將問題簡化為一個大型有限計算,但AI用這個方法給出的結果非常混亂且缺乏啟發性,本質上是對所有可能形狀的窮舉。

最終陶哲軒發現他設想的數值方法或許可以在有限的時間內解決所有給定條件的特殊情況,但無法處理一般情況,但AI只是按照提問照做了。

最后總結一下:雖然問題最終還是沒有完全解決,但在AI的幫助下陶哲軒對這個問題的理解深入了很多。

陶哲軒的思考:AI工具的多尺度價值

雖然解題告一段落,但陶哲軒的思考還在繼續。

回顧整個解題過程,AI在 “小尺度”問題上表現得很好,只犯了一些小錯誤,并貢獻了一些文獻中已有的,但陶哲軒之前并不知道的有用想法。

但是要想進一步推進這個問題,就需要真正的微分幾何專家的幫助了。

在 “中等尺度”的策略上,AI略微顯得無益,它強化了陶哲軒對問題的錯誤直覺,而不是提出質疑。

陶哲軒一開始的直覺是錯的,AI也沒有發現問題,基本上只是附和同意他說的一切。

但是在從獲得對問題理解的“大尺度”指標來看,AI又是有幫助的,盡管主要是間接意義上的:在AI的幫助下能夠更快地研究并最終放棄一種現在認為不適合的方法。

陶哲軒將這次經歷與他之前的實驗進行了對比。

在之前的實驗中,他給AI一個他對結果有很好直覺的任務。這種情況下AI更有創造力,提供了他不知道的信息,但引導AI朝著富有成效的方向前進也明顯更加困難。

他認為,在自己專業領域之外的問題上與AI互動似乎確實有一些價值,但必須謹慎行事并保持對情況的認知。

這次經歷還印證了陶哲軒之前提出的觀點:必須在多個尺度上衡量一個工具的有效性。

此前他提出了四個不同的效率衡量尺度:形式化證明中的任何單行、任何單個引理、任何定理的完整證明,以及整本教科書。

許多當前的自動化工具可以在其中一個尺度上加速形式化,但反直覺的是,過度依賴這樣的工具可能最終會降低在其他尺度上形式化的能力。

他認為最優的自動化水平實際上嚴格介于0%和100%之間。

在每個尺度上都有足夠的自動化來減少繁瑣的重復工作,但在每個尺度上仍然有足夠的”人在回路中“來審查和修復局部問題,以便讓人類保持對所有尺度上任務結構的感知。

如果過度地在單一尺度上對AI進行基準測試,最終可能會對長期目標產生不利影響。

陶哲軒與ChatGPT合作史

而陶哲軒對AI輔助數學工作的可能性探索還要追溯到三年前——ChatGPT剛剛發布的時候。

陶哲軒在其誕生伊始就敏銳地察覺到它的作用,并就黎曼假設進行試探性詢問,但得出的結果卻讓他大失所望:

ChatGPT給出了看似合理且相關的回答,但仔細檢查后卻沒有任何實際的深度內容。

此時的ChatGPT還不能完全理解數學問題的本質,只是在將一些低質量內容進行包裝掩蓋,這意味著常規的表面檢測方法不再準確,需要對核心內容進行人工篩查,例如逐行地閱讀文本。

所以早期的陶哲軒對AI工具抱有懷疑審視的態度,認為AI在數學中的作用,是為答案提供近似值,然后人類數學家再通過傳統方法進行逐步細化。

轉機出現在GPT-4,陶哲軒嘗試使用GPT-4協助處理統計數據,即把原始數據輸入電子表格,并查找對應函數、計算所需內容。

短短幾分鐘,GPT-4就完成了人類一天的工作,期間只有非常少的部分需要校驗,這也讓陶哲軒開始期待將AI集成到軟件工具中,尤其是處理90%以上的LaTeX編譯問題。

我可以明確地說,今天是GPT4為我節省了大量繁瑣工作的第一天。

隨后,他開始使用GPT-4處理一些自己熟悉領域的數學問題,比如下面這個問題:證明遞歸式(定義R)能夠推導出a(n+1)。

GPT4從合作者的角度提出了八種不同方法,其中生成函數法引起了陶哲軒的注意,并隨即沿著該解決路徑,利用人工計算最終解決了這個問題。而最初陶哲軒想使用的是漸近分析方法,但事實證明AI可以更快地協助找到正確方案。

與此同時,他開始讓ChatGPT編寫Python來計算序列長度,雖然與預期的目標序列存在差異,只考慮到了連續整數的子序列而非任意子序列,但已經足夠接近,而且其中在計算totient函數時還使用了非常獨到的方案。

但代碼本身有時也不夠簡潔、效率不高,或者邏輯不夠嚴密,還是需要人工校正與重寫。

他還嘗試使用Copilot書寫數學論文,不過在攥寫證明大綱時,AI陷入了長篇敘述有關隨機分析數論的廢話,只有在編寫非常短或重復的文本上有效。

所以此時的AI在陶哲軒看來,AI寫數學論文仍然是有趣多過于有用。

在GPT-o1發布后,陶哲軒同樣第一時間測試了其數學能力,顯然相比于前代,GPT-o1的幻覺問題得到解決,在形式化任務中也作用顯著,但在復雜分析問題上仍然令人失望,沒有產生關鍵的概念思想。

陶哲軒將這一代模型定義為平庸但并非完全無能的數學“研究生”,而此前的模型則更接近為無能的“研究生”水平,不過他也相信再迭代一兩次,加上與其他工具的集成,AI將在研究級別的任務中大有所為。

而今年七月份,OpenAI斬獲IMO金牌一事讓AI的數學能力再次引起熱議,陶哲軒也對此做出了長文回應,認為缺乏統一的評測標準。

但同時他也開始讓ChatGPT處理一些更為復雜的數學問題,比如在判斷該集合是否是HA的子集時,陶哲軒通過理論分析已經確定該問題的答案是否定的,但仍需要一些數值參數來驗證部分不等式。

起初,直接要求AI提供一個Python代碼的反例,但由于初始參數問題始終失敗,隨后陶哲軒調整策略轉而與AI逐步對話,使其執行啟發式計算并找到可行的參數選擇,通過單獨驗證生成的參數,最終解決了該問題。

陶哲軒總結認為,在數值搜索這類任務上,AI工具顯然可以節省大量時間,如果沒有AI,甚至他可能都不會考慮這種解決方法,而是尋求理論漸進分析。

而對于如何減少AI在數學問題中的幻覺或廢話問題,陶哲軒也顯然有了自己的一套心得,那就是在計算任務的每一步都做到詳細解釋,每一次和AI的對話都先確認再執行下一步,在對話結束后再使用Python進行外部驗證,得到輸出。

正如他一直所說的那樣,AI正在重塑人類科學范式,其最合理的角色是成為數學家的“副駕駛”或助理,而不是取代人類在創造性、直覺性、策略性上的工作。

在AI的協助下,數學將在未來擁有更多的實驗,而不僅僅是理論。

參考鏈接:

[1]https://chatgpt.com/share/68e85cba-7228-800e-8804-a0f41aa64e14

[3]https://terrytao.wordpress.com/mastodon-posts/

標簽: 方法 陶哲軒 -Pro 不等式 尺度 問題

關閉
最新熱文
成人高清一区| av在线电影播放| 2024国产精品| 蘑菇福利视频一区播放| 不卡一二三区| 日韩理论片久久| 大桥未久av一区二区三区| 91丨九色丨蝌蚪富婆spa| 国产69精品久久777的优势| 国产一区二区三区成人欧美日韩在线观看 | 在线观看av影片| 欧美色综合网站| 欧美国产精品v| 亚洲三级色网| 蜜乳av综合| 欧美日韩一本到| 国产美女一区二区三区| 美女主播精品视频一二三四| av手机免费在线观看| 免费播放av| 色哟哟亚洲精品| 亚洲手机成人高清视频| 久久精品二区亚洲w码| 欧美成人精品一级| 视频三区在线| 91精品国产一区二区三区| 精品一区二区三区影院在线午夜| 亚洲一区二区三区日本久久九| 中文日本高清免费| 91久久国产最好的精华液| 国产精品乱码久久久久久| 午夜国产精品视频| 91精品国产自产在线观看永久∴| 93在线视频精品免费观看| 日本欧洲一区二区| ㊣最新国产の精品bt伙计久久| 亚洲免费观看高清完整版在线| 一区二区三区四区蜜桃| 国内精品久久久久影院薰衣草| 国产午夜精品一区二区三区欧美| 亚洲日本va午夜在线电影| 日韩精品看片| 欧美黄色免费| 国产精品啊啊啊| 黄色不卡一区| 玖玖玖视频精品| 波多野结衣欧美| 亚洲人成亚洲精品| 国产麻豆精品久久| 大胆人体一区二区| 亚州av中文字幕在线免费观看| 日韩av在线高清| 欧美变态凌虐bdsm| 欧美一级黄色录像| 精品国内二区三区| 国产网站观看9久| 宅男午夜电影| 亚洲福利视频专区| 欧美性大战久久久久久久| 91啪亚洲精品| 国产精品免费久久| 久久久久久夜精品精品免费| 国产成人午夜精品5599| 日本中文字幕不卡| 欧美激情亚洲| 极品尤物久久久av免费看| 清纯唯美综合亚洲| 久久国产福利国产秒拍| 欧美特黄视频| 日韩国产在线| 日韩精品一区二区三区免费观看| 丰满少妇一区| www.youjizz.com在线| 欧美电影免费观看| 污视频网站在线观看| 亚洲精品国产综合久久| 精品久久一区二区| 精品日韩在线一区| 日韩av在线免费观看| 欧美午夜精品伦理| 69日小视频在线观看| 欧美成人三区| 成人香蕉视频| 人人狠狠综合久久亚洲| 日韩精品一区在线| 91p九色成人| 国产欧美日韩综合一区在线播放 | 91丨精品丨国产| 久久人人97超碰com| 大地资源高清播放在线观看 | 欧美69视频| 亚洲国产毛片aaaaa无费看| 蜜桃视频免费网站| 色噜噜成人av在线| 激情综合网最新| 亚洲一区二区中文在线| 日韩女同互慰一区二区| 青草影视电视剧免费播放在线观看| 一本不卡影院| 精品欧美乱码久久久久久| 色吧亚洲日本| 亚洲在线播放| 欧美亚洲免费在线一区| 青青草视频在线免费直播| 欧美激情1区2区| 日本欧美一区二区在线观看| 欧美精品一区二区三区久久久| 精品国产三级| 国产精品久久久久久一区二区三区| 91黄页在线观看| 国产亚洲人成网站| 岛国一区二区| 狠狠久久五月精品中文字幕| 6080成人| 日本福利一区二区| 久草在线成人| 欧美日韩久久久| 精品中文字幕一区二区三区| 国模一区二区三区白浆| 在线91免费看| 亚洲校园激情春色| 91麻豆精东视频| 国产在线制服美女| 日韩精品免费| 一本一本大道香蕉久在线精品 | 中文字幕巨乱亚洲| 黄页网址在线观看| 欧美久久99| 日韩成人性视频| 亚洲婷婷丁香| 99在线精品观看| 粉嫩tv在线播放| 在线一区欧美| 在线成人免费视频| 成人三级视频| 亚洲视频第一页| 91丨九色丨国产丨porny| 亚洲精品一二三**| 欧美一区中文字幕| 久久激情视频| 国产在线日本| 国产亚洲精品bt天堂精选| 毛片大全在线观看| 久久一二三国产| 一区二区三区四区日本视频| 国产91丝袜在线播放九色| 在线观看黄色片| 国产精品中文字幕日韩精品| 水中色av综合| 成人国产精品视频| 看黄在线观看| 国产一区二区精品久久| 色黄视频在线| 伊人激情综合| 在线观看国产麻豆| 国产在线视频不卡二| 九色porny丨首页入口在线| 91麻豆免费看| 国产99在线| 亚洲精品第一国产综合野| 九九热播视频在线精品6 | 国产午夜亚洲精品理论片色戒 | 超碰在线cao| 97精品国产露脸对白| 精品欧美一区二区三区在线观看 | 成人免费观看在线观看| 国产欧美一区视频| 三级成人黄色影院| 国产精品免费观看视频| 福利一区二区免费视频| 久久精品人人做| 国产丝袜在线| 成人免费观看av| 亚洲成人三级| 97成人超碰视| 宅男网站在线免费观看| 菠萝蜜视频在线观看一区| 午夜毛片在线| 91在线你懂得| 日韩专区视频网站| 精品成人av一区| 久久免费大视频| 国产资源在线播放| 99九九99九九九视频精品| 九七电影院97理论片久久tvb| 欧美色中文字幕| 欧美jizz19性欧美| 亚洲国模精品私拍| 亚洲国产电影| 免费在线观看av| 亚洲大片精品永久免费| 日韩av在线播放网址| 在线国产网址| 91丨porny丨户外露出| 国内精品久久久久国产| 久久精品视频一区| 欧美jizz18| 91精品国产一区二区三区蜜臀| 狠狠入ady亚洲精品| yw193.com尤物在线|