陶哲軒轉發、菲爾茲獎得主領銜:AI正在顛覆數學家的工作方式

陶哲軒轉發、菲爾茲獎得主領銜:AI正在顛覆數學家的工作方式
2024年04月08日 13:51 快科技

陶哲軒點贊轉發,《美國數學學會通報》用一整期特刊介紹了AI給數學帶來的改變。

這些文章讀起來很有趣,盡管使我自己即將發表的一篇文章顯得多余……這個領域發展太快了!

作者陣容非常豪華,包括菲爾茲獎得主Akshay Venkatesh、華裔數學家鄭樂雋、計算機科學家Ernest Davis等多位知名學者。

其中鄭樂雋表示,如果最終機器能做得比人類更好,那很好,她將樂意退出數學領域去彈鋼琴。

他們提出的觀點包括:

AI的數學能力不完全反映人類的認知過程,依賴于訓練數據中的模式,而不是真正理解問題的本質。

合成數學如合成拓撲學和合成微分幾何學,提供了一種全新的數學實踐方式,允許數學家專注于更深層次的概念和問題。

交互式證明系統與軟件工程中的“規范驅動開發”,可以降低數學家的認知負荷、促進數學家之間的合作。

形式化證明技術可能改變數學證明的本質、顛覆數學家的工作方式。

數學屆不應被科技公司主導的議程所綁架。

在開篇,編委會寫道:

純粹的數學家習慣于享有很大程度的研究自主和智力自由,這是一種脆弱而寶貴的遺產,可能會因機器的盲目使用而被掃除。

另一方面,對同一技術進行深思熟慮和深思熟慮的方法可能會極大地豐富我們的學科。

學科應該如何發展是由我們自己決定的,因此我們邀請數學界認真思考和討論專刊中提出的問題,并聆聽其他領域同行對這些問題進行了深入思考。

現在,是數學家們了解并推動這場辯論,并決定學科未來方向的時候了。

AI能自動證明定理嗎?

計算機已經在數學中發揮了重要作用,尤其是在計算效率方面的提升,但是否能夠幫助人類進行數學推理?有一天它們是否會自主進行推理?

數學家Kevin Buzzard概述了神經網絡、計算機定理證明器和大型語言模型的最新發展。

Kevin Buzzard現任英國倫敦帝國理工學院數學教授,他專門研究算術幾何和朗蘭茲綱領。

回顧整個計算工具的歷史,最早Computer一詞還指人類作為“計算員”,他們的成就不應被低估。

17世紀早期,蘇格蘭數學家John Napier構造了第一個對數表,他提出如果有更多“計算員”來幫忙,就可以進一步推進這一工作。

另一個代表性成果是Felkel和Vega在18世紀70年代發表的整數因式分解表,這使研究素數分布成為可能,最終導致了素數定理的證明。

早期電子計算機出現后,機器在高速計算方面已經遠超人類,Computer一詞的含義也發生了變化。

如劍橋大學在1957年購買了EDSAC II計算機,用于海洋學計算,為現代板塊構造理論奠定基礎。

這個階段計算機還只是一個工具,即使目前的計算機也難以像人類一樣進行數學推理和定理證明。

神經網絡可以用于搜索定理、猜測新定理和尋找反例,如發現了拓撲學中關于結點和邊的關系的新定理,以及在表示論中發現了關于Kazhdan-Lusztig多項式的新結果,但對于證明深奧復雜的定理還有局限性。

自動定理證明系統(ATP)可以自動證明一些復雜的定理,如羅賓斯猜想。但ATP生成的證明往往過于冗長,難以被人類理解。

交互式定理證明系統(ITP)可以用于驗證定理的正確性,幫助發現和修正數學文獻中的錯誤,如數學家Peter Scholze在液體張量實驗(Liquid Tensor Experiment)中承認自己無法掌握所有涉及的數學對象和概念,最終在Lean系統幫助下完成。

大模型如ChatGPT雖然可以生成相關數學內容,但容易產生錯誤。Buzzard建議大模型與ITP等系統結合使用,通過大模型生成初步證明,然后由ITP進行驗證,從而提高可靠性。

Buzzard認為,這些新興技術可以幫助數學家突破認知障礙,探索更加復雜和更加新穎的數學領域,并最終改變數學家的工作方式,使他們能夠將更多時間和精力投入到數學思維和理解上。

另外三篇文章,從不同角度探討了這些新興技術如何幫助數學家應對日益增長的復雜性,并開拓新的數學領域。

數學的形式化轉向

邏輯學家Jeremy Avigad討論了自20世紀初以來,數學定義和證明可以在具有精確語法和使用規則的形式系統中表示。

Jeremy Avigad任卡內基梅隆大學哲學和數學教授,在數理邏輯和基礎、形式驗證和交互式定理證明以及數學哲學和歷史領域做出了貢獻。

他認為這種轉向可能改變數學的本質,依賴機器驗證的證明可能減少了數學家對直觀理解和洞察的重視,從而可能影響數學發現的過程和數學思想的發展。

純數學中的抽象邊界和規范驅動開發

數學家Johan Commelin和Adam Topaz探討了抽象邊界(Abstraction Boundaries)如何在交互式定理證明器的幫助下,幫助控制數學研究中的復雜性。

Johan Commelin任荷蘭烏得勒支大學助理教授,Adam Topaz阿爾伯塔大學助理教授,兩人研究興趣的交點是代數幾何,共同參與了液體張量試驗。

△左:Johan Commelin,右:Adam Topaz△左:Johan Commelin,右:Adam Topaz

抽象邊界是指在數學研究和定理證明過程中,將數學對象的實現細節與其外在屬性和行為進行形式化區分的界限。這種界限使得數學家可以在不依賴具體實現細節的情況下,使用和推理這些數學對象。

抽象邊界的概念在軟件工程中非常常見,例如通過C語言的頭文件、面向對象編程中的公共方法或者函數式編程中的typeclass來實現。

基于抽象邊界的“規范驅動開發”方法,不僅降低了認知負荷,還促進了數學家之間的合作,使得工作可以輕松地分配給具有不同專長的合作者。

奇異新世界:定理證明助手和合成基礎

數學家Michael Shulman認為,現有的計算機程序如Lean證明助手,能夠驗證數學證明的正確性,但它們專門的證明語言對許多數學家來說是一道門檻。

Michael Shulman任圣地亞哥大學副教授,研究領域是范疇論和代數拓撲。

現有的計算機證明助手能夠驗證數學證明的正確性,但它們專門的證明語言對許多數學家來說是一道門檻。大模型有潛力降低這一門檻,使數學家能夠以更熟悉的語言與證明助手進行交互。

這可能允許數學家使用由模型支持的證明助手探索根本上全新的數學領域,現有的證明助手已經在同倫類型論(homotopy type theory)等領域發揮了這一作用。

當前的人工智能可以做嚴肅的數學嗎?

紐約大學計算機科學家Ernest Davis指出,當前AI在解決文字描述的數學問題上,無法可靠地結合基礎數學和常識推理。

AI通過三種主要方法嘗試解決數學問題,但每種方法都有其優勢和局限。

直接生成答案,適用于簡單數學問題。

生成可執行代碼,已在實踐中取得成功。

翻譯成邏輯規范,對于復雜問題仍存在挑戰。

他認為AI在解決數學奧林匹克問題時可能會依賴于訓練數據中的模式,而不是真正理解問題的本質,這與人類通過直觀和邏輯推理解決問題的方式有顯著差異。

AI真正解決數學問題需要三類知識:基礎數學、語言理解和世界常識。例如理解硬幣的價值和物理特性。常識在解決問題時經常被忽視,但實際上是至關重要的。

基準測試集是評估AI系統性能的重要工具,但它們可能無法全面覆蓋AI的所有能力。

但同時他也指出,盡管AI在處理基礎問題時存在局限,但這可能不會影響其進行高級數學研究的能力。

一方面,高級數學研究可能不需要與解決基礎問題相同的常識推理能力。

另一方面,在棋類游戲上,即使AI無法理解棋局的基本概念,在棋局分析和策略制定上的能力能遠超人類棋手。

數學家如何看待AI?

關于自動化與數學研究的一些想法

菲爾茲獎得主Akshay Venkatesh探討了數學自動化對數學研究的影響。他指出,機器可能大大增強數學解決問題的能力,但也會徹底改變數學的核心問題和價值觀,使其難以被人類所認知。

他分析了當前數學界決定“什么是重要”的機制,如期刊、獎項、數學理論在應用領域得到認可、教育體系、聘用和資助過程等,都不足以解釋數學界相對較高的共識水平。

他認為“證明”這種特殊的學術交流方式能引發一致同意,類似于自由市場中信息傳播的機制。

AI會導致當前數學界對“重要性”的判斷發生劇變。

機器如何使數學更包容

數學家鄭樂雋(Eugenia Cheng)認為,技術已經在改變人們研究數學的方式,可以利用這些技術使數學更加包容,而不是使數學家變得多余。

鄭樂雋在謝菲爾德大學任教,除了范疇論研究和本科教學之外,她的目標是消除世界上的“數學恐懼癥”。

她分析了技術如何影響數學教學、提出問題、協作、傳播以及研究:

教學:標準的“粉筆和黑板”式講授變得沒有必要,她開始采用交互性更強的教學方式。同時對于學生來說,記憶現在已經無關緊要,應當將大腦留給更有趣的事情

提出問題:技術使得任何人都可以在網上提問并獲得答復,但繼承和放大了數學界的精英主義和競爭性。

協作:技術大大便利了遠程協作,使地理位置不再是障礙。電子白板等工具也大大增強了協作的便利性。

傳播:互聯網使論文傳播變得普及,不再局限于有限的紙質期刊。這讓論文發表過程更加公開透明,論文質量而非發表渠道成為關鍵。

研究:通過智能手機可以隨時隨地展開研究,不受地點限制。搜索引擎等也讓她不必記住所有事實,可以隨時查閱。

總的來說,鄭樂雋認為技術可以使數學變得更加包容,只要數學家善用這些技術,而不是固步自封。

同時她也提出,如果最終機器能做得比人類更好,那很好,她將樂意退出數學領域去彈鋼琴。

機器時代下的證明

數論學家Andrew Granville關注證明的本質以及計算機證明與人類證明之間的關系。

他認為,純數學中的“客觀性”并非如我們所想那樣牢不可破。

定義和概念的困難:現代數學中很多概念沒有單一明確的定義,存在多種可能的定義和闡釋。這就難以談“客觀”。

公理系統的局限性:根據哥德爾不完備性定理,即使采用一致的公理系統,也無法證明所有關于整數的正確語句。這說明“客觀的”數學基礎是有局限性的。

歷史演變的影響:不同時代數學家對“數學證明”的理解和標準有所不同,這體現了客觀性標準的變遷。

他探討了計算機自動證明可能同時帶來的挑戰和機遇。計算機證明可以幫助確認人類直觀證明的正確性,提高可信度。但計算機證明可能會取代人類,成為“黑箱”證明。但這種證明可能缺乏人類應有的可理解性和適應性。

Granville希望未來的計算機證明能夠吸收人類證明的優點,在形式化的基礎上保持足夠的靈活性和易理解性。

自動化迫使數學家反思自己的價值觀

哥倫比亞大學數學家Michael Harris強調數學需要吸收其他學科、尤其是人文社科的經驗。

他建議經常反思學科的價值追求和物質基礎,有助于數學家在面對自動化等挑戰時,更好地捍衛數學的核心價值。

此外,他還警示數學界不應被科技公司主導的議程所綁架,科技公司的價值取向與數學家的價值取向并不完全一致,數學家應保持獨立思考的勇氣,而不是被動接受來自產業的價值導向。

特刊的第二部分將于2024年7月發布,內容將包括:

自動化與哲學:

形式化所引發的許多問題并不新鮮。McLarty的文章描述,龐加萊在一個多世紀前就在討論“推理機器”。龐加萊已經關注到形式化證明與數學實踐之間的關系,這一主題在de Toffolli的文章中得到了進一步的探討。

技術改變思維

DeDeo的文章檢驗了自動證明對數學家認知過程的潛在影響。

深度學習與數學的互動

Bengio和Malkin的文章考慮了進行數學研究對機器學習帶來的特定挑戰。Fraser和Poggio的文章則提出了與深度學習數學基礎相關的問題。

敬請期待~

期刊地址:https://www.ams.org/journals/bull/2024-61-02/

參考鏈接:[1]https://mathstodon.xyz/@tao/112221953164171331

責任編輯:隨心

新浪科技公眾號
新浪科技公眾號

“掌”握科技鮮聞 (微信搜索techsina或掃描左側二維碼關注)

創事記

科學探索

科學大家

蘋果匯

眾測

專題

官方微博

新浪科技 新浪數碼 新浪手機 科學探索 蘋果匯 新浪眾測

公眾號

新浪科技

新浪科技為你帶來最新鮮的科技資訊

蘋果匯

蘋果匯為你帶來最新鮮的蘋果產品新聞

新浪眾測

新酷產品第一時間免費試玩

新浪探索

提供最新的科學家新聞,精彩的震撼圖片