天才數(shù)學(xué)家陶哲軒搞數(shù)學(xué)研究,已經(jīng)離不開(kāi)普通人手里的“數(shù)學(xué)菜雞”GPT 了!
就在他最新解決的一個(gè)數(shù)學(xué)難題下面,陶哲軒明確指出自己“使用了 GPT-4”,后者給他提出了一種可行的解決方法。
借助 GPT-4,他不僅成功地突破了這一難題,還將答案分享在了 MathOverflow 上:
(資料圖片)
它給我提供了最終的解題思路,接下來(lái)我只需要繼續(xù)計(jì)算就行。
為了給更多數(shù)學(xué)家分享用 GPT-4 工作的便利性,陶哲軒還將自己的聊天記錄 po 了出來(lái),里面完整地記載了他和 GPT-4 的對(duì)話。
可以看見(jiàn),在這份聊天記錄中,他把 GPT-4 稱呼為“專業(yè)數(shù)學(xué)合作者”,而不僅僅是一個(gè)普通的數(shù)學(xué)助手。
這個(gè)身份屬實(shí)不一般了,不知道之后陶哲軒寫論文的時(shí)候會(huì)不會(huì)把 GPT-4 列為共同作者(手動(dòng)狗頭)。
不僅如此,戳對(duì)話記錄底部的“continue this conversation”按鈕,還能一鍵把對(duì)話記錄導(dǎo)入自己的 ChatGPT 中,突然闖入人類大師和 AI 的交談。
陶哲軒解決了什么新問(wèn)題?
陶哲軒研究的問(wèn)題,是一個(gè)兩天前在數(shù)學(xué)網(wǎng)站 MathOverflow 上更新的提問(wèn)。
這個(gè)名叫“優(yōu)雅的遞歸之 A301897”問(wèn)題,具體長(zhǎng)這樣:
其中,A301897 是一個(gè)被整數(shù)數(shù)列網(wǎng)站 OEIS 收錄的數(shù)列:
這個(gè)數(shù)列中有一系列來(lái)自長(zhǎng)度為 n 的排列 b 的數(shù),它們有一個(gè)共同點(diǎn),就是滿足 Diaconis-Graham 不等式且等號(hào)成立。
Diaconis-Graham 不等式由戴康尼斯(Persi Diaconis)和葛立恒(沒(méi)錯(cuò),就是“最大數(shù)”之父 Ronald Graham)于 1977 年共同提出,屬于概率統(tǒng)計(jì)方面的研究。
顯然,這一大段提問(wèn)中不僅夾雜著大量專業(yè)數(shù)學(xué)公式,而且還涉及需要跳轉(zhuǎn)的網(wǎng)頁(yè)資料。
作為數(shù)學(xué)公認(rèn)不太好的“數(shù)學(xué)菜雞”,GPT-4 真的能像一名專業(yè)數(shù)學(xué)家那樣快速讀懂公式、給出解決問(wèn)題的專業(yè)建議嗎?
事實(shí)上,相比直接把問(wèn)題復(fù)制粘貼給 GPT-4,陶哲軒做了三件事:
首先,做一些提示工程,明確 GPT-4 的“身份”和“目標(biāo)”。其中身份是“一個(gè)擅長(zhǎng)給技巧性建議的數(shù)學(xué)合作專家”,目標(biāo)是“提供一些建議”而非解決問(wèn)題。
然后,相比直接把大段公式復(fù)制進(jìn) GPT-4 提問(wèn)欄(確實(shí)可以這樣做),陶哲軒選擇將問(wèn)題描述轉(zhuǎn)成 Markdown 格式。
最后,涉及需要 GPT-4 自己查找資料的內(nèi)容,陶哲軒將它轉(zhuǎn)變成一個(gè)引用注釋,并在結(jié)尾給出網(wǎng)址。
完整的提問(wèn)過(guò)程長(zhǎng)這樣:
也就是說(shuō),相比讓 GPT-4 直接化身數(shù)學(xué)家去“解決問(wèn)題”,陶哲軒只是把它當(dāng)成一個(gè)提供靈感來(lái)源的“專家”,給自己建議一些研究的方向。
GPT-4 很快給出了 8 個(gè)具體的建議:
1、理解問(wèn)題:在深入證明之前,確保你理解了問(wèn)題中的每一項(xiàng)。如果你不熟悉 Diaconis-Graham 不等式,研究一下它,了解表達(dá)式 a (n) 和 R (n, q) 中的每一項(xiàng)代表什么。
2、簡(jiǎn)化表達(dá):有時(shí)候,復(fù)雜的表達(dá)可以被簡(jiǎn)化。例如,你可能想看看表達(dá)式中 a (n) 的二項(xiàng)式系數(shù)是否可以簡(jiǎn)化,或者是否可以用更簡(jiǎn)單的方式計(jì)算總和。
3、歸納法:由于 R (n, q) 是遞歸定義的,因此證明猜想的一種自然方法是使用數(shù)學(xué)歸納法。你可能想要證明,如果這個(gè)猜想對(duì) n 成立,那么它對(duì) n+1 也成立。
4、生成函數(shù):另一種方法是使用生成函數(shù)。嘗試找到 a (n) 和 R (n, 0) 的生成函數(shù),然后證明它們是相等的。這有時(shí)可以把一個(gè)復(fù)雜的組合問(wèn)題變成一個(gè)更簡(jiǎn)單的代數(shù)問(wèn)題。
5、漸近分析:正如你提到的,分析 a (n) 和 R (n, 0) 的漸近行為可能會(huì)對(duì)它們的關(guān)系有一些深入的了解。這有時(shí)可以用斯特林的階乘近似來(lái)實(shí)現(xiàn),或者通過(guò)分析表達(dá)式中的主導(dǎo)項(xiàng)來(lái)實(shí)現(xiàn)。
6、數(shù)值證據(jù):雖然不是證明,但收集數(shù)值證據(jù)有時(shí)可以讓我們了解如何證明一個(gè)猜想。因?yàn)槟阌?PARI / GP 代碼,可以用數(shù)值來(lái)檢查猜想,你可能想讀一讀每個(gè)序列的前幾項(xiàng),看看是否能發(fā)現(xiàn)任何模式。
7、尋找類似問(wèn)題:有時(shí),一個(gè)問(wèn)題或猜想是一個(gè)已知問(wèn)題的泛化或變體。在組合文獻(xiàn)中尋找類似的問(wèn)題或定理,看看它們的證明是否可以適用于這個(gè)問(wèn)題。
8、尋求反饋和合作:不要猶豫,從同事那里尋求反饋,或者在 MathOverflow 這樣的論壇上發(fā)布你的部分結(jié)果。協(xié)作和同行評(píng)議通常是解決復(fù)雜數(shù)學(xué)問(wèn)題的關(guān)鍵。
最終,陶哲軒使用建議 4,也就是生成函數(shù)的方法,成功解決了問(wèn)題。
當(dāng)然,解決問(wèn)題的過(guò)程并不需要用到 GPT-4,采用 MAPLE 工作表 + 紙筆手動(dòng)計(jì)算就能完成。陶哲軒也嘗試了漸進(jìn)分析(建議 5)的方法,不過(guò)事實(shí)證明還是用生成函數(shù)更有效。
簡(jiǎn)單來(lái)說(shuō),陶哲軒只是用 GPT-4 給自己提供不同的解題思路,也就是“解題靈感”,但具體怎么解答,也就是更加數(shù)學(xué)的方法,他則不會(huì)交給 GPT-4 來(lái)完成。
至于“查資料”這種 GPT-4 的應(yīng)用,陶哲軒也發(fā)揮到了極致。
例如在思考問(wèn)題時(shí),他還會(huì)把自己的“靈光乍現(xiàn)”拿出來(lái)和 GPT-4 討論一下,例如他覺(jué)得這個(gè)問(wèn)題和卡特蘭數(shù)(Catalan numbers)有相似之處,希望 GPT-4 幫他查找一下對(duì)應(yīng)的資料。
GPT-4 很快給出了對(duì)應(yīng)的回答,這也促使陶哲軒對(duì)另一個(gè)問(wèn)題產(chǎn)生了新的靈感。
簡(jiǎn)單來(lái)說(shuō),陶哲軒在短短兩段與 GPT-4 的對(duì)話中,展示了數(shù)學(xué)家使用 GPT-4 的正確姿勢(shì) —— 找靈感和查資料。
這樣一來(lái),即使“數(shù)學(xué)菜雞”如 GPT-4,也能成為數(shù)學(xué)家的 AI 助理了。
大佬是怎么玩兒 GPT 的
分享人類大師和 AI 的聊天記錄之余,陶哲軒的乳齒象博文里還附帶著一份貼心指南,是他使用 ChatGPT 和 GPT-4 的經(jīng)驗(yàn)之談。
根據(jù)他過(guò)去的實(shí)操經(jīng)驗(yàn),最要緊的第一點(diǎn):
不要試圖讓 AI 直接回答問(wèn)題,因?yàn)檫@幾乎肯定會(huì)得到一些看起來(lái)專業(yè)的廢話。
為了避免 GPT 成為廢話文學(xué)大王,行之有效的方案如下:
讓 AI 扮演合作者的角色,而后讓它提供策略建議。
Like this:
除此之外,“數(shù)學(xué)菜雞”GPT,在大數(shù)學(xué)家手里能有什么用處?
陶哲軒大概的意思是醬嬸兒的:
ChatGPT 數(shù)學(xué)能力雖然不咋滴,但對(duì)做學(xué)術(shù)研究的人來(lái)說(shuō)是個(gè)發(fā)散思維的好工具。
(對(duì)普通人來(lái)說(shuō)有點(diǎn)不太專業(yè),但對(duì)搞數(shù)學(xué)的學(xué)術(shù)人員來(lái)說(shuō)剛剛好)
怎么解釋用來(lái)“發(fā)散思維”這句話呢?
陶哲軒表達(dá)出來(lái)的觀點(diǎn)是,既然 ChatGPT 在具體數(shù)學(xué)問(wèn)題上給出的答案是不完全正確的,那不如索性發(fā)揮發(fā)揮它生成答案部分正確的特性。
簡(jiǎn)而言之,就是讓它幫你找靈感 balabalabla:
在處理數(shù)學(xué)問(wèn)題時(shí),可以讓 ChatGPT 這類大語(yǔ)言模型做一些半成品的語(yǔ)義搜索工作。
也就是說(shuō),ChatGPT 不用提供確切的答案,只用生成一些可能的提示。
這樣一來(lái),依據(jù) GPT 生成的提示 + 傳統(tǒng)搜索引擎搜索,就能很輕松 get 答案。
而且他還自曝,在GPT-4 發(fā)布之前,他本人就從微軟那里獲得了訪問(wèn)資格。
也就是和微軟 154 頁(yè)《AGI 的火花》論文里同款,未經(jīng)過(guò)安全訓(xùn)練但能力更強(qiáng)的滿血版。
從陶哲軒的反饋中可以看到,GPT-4 非常擅長(zhǎng)在和人類對(duì)話時(shí)進(jìn)行一些 cosplay,比如充當(dāng)富有同情心的傾聽(tīng)者、熱情洋溢的反饋者、富有創(chuàng)造力的靈感來(lái)源、翻譯者或教師,或者是魔鬼的代言人。
與此同時(shí),對(duì)于 AI 在數(shù)學(xué)研究中的表現(xiàn),陶哲軒給出的大膽卻又嚴(yán)謹(jǐn)?shù)念A(yù)言:
當(dāng)與形式證明驗(yàn)證器、互聯(lián)網(wǎng)搜索和數(shù)學(xué)符號(hào)包等工具整合時(shí),2026 年的 AI,如果使用得當(dāng),將成為數(shù)學(xué)研究中值得信賴的共同作者,而且在許多其他領(lǐng)域也是如此。
除了數(shù)學(xué)研究,GPT-4 已經(jīng)是陶哲軒生活中的全方位小助手了。
他經(jīng)常使用 GPT-4 回答一些隨意、措辭含糊的問(wèn)題,這些問(wèn)題以前需要在搜索引擎里精心調(diào)整關(guān)鍵詞才行。
還有位同事,因?yàn)橛H戚拿到重癥診斷而郁郁寡歡。為此,陶哲軒讓大手一揮,讓 GPT-4 洋洋灑灑寫了封慰問(wèn)信。
結(jié)果呢?同事眼含熱淚,被感動(dòng)哭了。
最后說(shuō)回陶哲軒用 GPT-4 解決數(shù)學(xué)難題這事兒上來(lái)。
在 MathOverflow 下,有的網(wǎng)友覺(jué)得他不應(yīng)該用 GPT 來(lái)回答數(shù)學(xué)問(wèn)題,感覺(jué)是個(gè)很敏感的話題。
但還是有人表示了資瓷,表示覺(jué)得真的是泰庫(kù)辣~
陶哲軒倒是毫不避諱地站出來(lái)表明了自己的立場(chǎng),他倒不覺(jué)得有啥不好:
現(xiàn)在的擔(dān)憂,跟維基百科流行初期時(shí)大家討論的重點(diǎn)也沒(méi)啥區(qū)別……
現(xiàn)在在維基百科上 get 初始線索,并且在引為論點(diǎn)時(shí)附上鏈接,展現(xiàn)它是我論據(jù)的一部分,都是大伙兒習(xí)以為常的事情。