頭條・AI/機器學習
OpenAI reasoning model independently disproves Erdős 80-year planar geometry conjecture
OpenAI 內部通用推理模型無需人類引導,自主引入代數數論工具推翻「平面單位距離猜想」,發現平方格以外能實現多項式改進的無限族構造,菲爾茲獎得主 Tim Gowers 稱之為「AI 數學里程碑」,普林斯頓數學家 Will Sawin 確認常數 δ ≈ 0.014。
- 問題本身:1946 年 Erdős 提問「n 個平面點,最多多少對距離恰為 1」;80 年主流共識認為平方格幾乎最優,Spencer-Szemerédi-Trotter 定理上界自 1984 年起從未被突破。
- AI 的突破路徑:模型跨域引入 Golod-Shafarevich 代數數論與無限類域塔工具——此前數學家從未嘗試用這類工具攻克幾何問題——構造出一族比平方格更優的無限點集,實現 n^(1+δ) 單位距離對數(多項式改進)。
- 驗證與反應:完整推理鏈公開;Tim Gowers(1998 菲爾茲獎)審核後確認為有效突破,稱讚模型使用了「無人預期在此有用的工具」;Will Sawin(普林斯頓)精煉常數為 δ ≈ 0.014。
- 意義:AI 首次在純數學開放前沿,透過跨域類比推理而非蠻力搜尋,產生人類未曾採用的創造性策略;與蛋白質折疊、棋類不同,這次是無結構搜尋的開放問題。
AI/機器學習
Gemini 3.5 Flash goes GA: frontier reasoning at 4x output speed, $1.50/$9 per million tokens
Google 於 I/O 2026(5 月 19 日)同步發布並正式開放 Gemini 3.5 Flash,在代理任務和程式開發基準上超越 Gemini 3.1 Pro,輸出速度是同級前沿模型的 4 倍,定價 $1.50/$9 每百萬 token,Gemini app、Google Search AI Mode 與 GitHub Copilot 同日啟用。
- 能力定位:Flash 定價(比 Pro 便宜),Pro 以上效能——在代理任務、長鏈推理與程式設計基準上超越 Gemini 3.1 Pro;1M token 上下文窗口,知識截止 2025 年 1 月。
- 速度:輸出 token 每秒是其他前沿模型的 4 倍,適合多步代理工作流(計劃→執行→驗證循環中 LLM 延遲的累計效應直接影響任務完成時間)。
- 生態整合:Google Search AI Mode、Gemini app、Android Studio 當日切換;GitHub Copilot 宣布正式上線;Google Antigravity 2.0 多代理平台同步引入該模型。
- 定價警示:$1.50/$9 比 Gemini 3.1 Flash-Lite 貴 6 倍;Simon Willison 指出各大 AI 廠商正同步測試 API 客戶的「價格承受能力」,2025 年搶市占的低價時代快速終結。
頭條・科技/產品
AMD EPYC Venice 6th Gen enters production: world's first 2nm HPC chip, 256 cores, 70%+ performance gain
AMD 宣布第六代 EPYC 處理器「Venice」於 TSMC 2nm 製程正式進入量產,這是業界首款在 2nm 節點投產的高效能運算產品,搭載 Zen 6 架構最多 256 核心,整體效能與效率較前代 Turin 提升逾 70%,未來將在 TSMC 亞利桑那廠擴產。
- 首款 2nm HPC 晶片:AMD 搶先 Intel 在 TSMC 2nm 節點完成量產,Venice 是業界第一個在此製程節點投入量產的高效能運算產品,TSMC 2nm 亦是首次用於伺服器 CPU。
- 規格:Zen 6 架構,最高 256 核心版本(針對高密度資料中心工作負載),線程密度提升 30% 以上;TSMC 2nm FinFlex 製程帶來更低功耗與更高電晶體密度。
- 效能提升:AMD 宣稱相較前代 Turin(EPYC 9004,5nm 製程)整體效能與能源效率提升超過 70%,在 AI 推論、HPC 運算和雲端虛擬化工作負載上的效益尤為顯著。
- 地緣策略:初始量產在台灣 TSMC,未來將擴展至 TSMC 亞利桑那廠;AMD CEO Lisa Su 本週訪台,與供應鏈夥伴確認出貨時程,商業出貨預計 2026 年下半年開始。
頭條・程式開發
WebMCP: Chrome 149 origin trial opens, letting websites expose JavaScript functions as AI agent tools
Google 在 I/O 2026 提出 WebMCP 開放網頁標準,讓開發者將 JavaScript 函式和 HTML 表單宣告為結構化工具,供瀏覽器端 AI 代理直接呼叫;Chrome 149 origin trial 已開放,Expedia、Booking.com、Shopify 等已在測試中,代理任務完成速度比視覺爬取快 8–12 倍。
- 核心概念:網站開發者在頁面宣告哪些 JS 函式和 HTML 表單可作為「工具」暴露給代理,附帶結構化 schema 描述輸入、輸出和副作用;代理直接呼叫函式,不需截圖→點擊的視覺迴圈。
- 效能差異:Chrome 團隊基準測試顯示,WebMCP 啟用的站台代理任務完成速度比視覺 agent 快 8–12 倍;錯誤率也大幅降低(代理不再猜測按鈕位置)。
- 安全設計:代理只能呼叫網站明確宣告的工具,無法任意操控未授權的 UI 元素,減少「代理越權」的攻擊面;原有工具仍需通過網站自己的認證與授權機制。
- 現狀與路線:Chrome 149 origin trial 即日開放;Gemini in Chrome 即將支援 WebMCP API;標準提案由 Google Chrome 團隊發起,規格文件已公開,尋求其他瀏覽器廠商跟進。
頭條・股市財經
Nvidia Q1 FY27 record $81.6B revenue, Q2 guidance $91B, dividend raised 25x
Nvidia 5 月 20 日公布 Q1 FY27(截至 2026 年 4 月 26 日)財報:營收 $816 億美元,年比增長 85%、季比增長 20%,資料中心收入 $752 億佔比 92%;Q2 指引 $910 億超預期;另宣布 $800 億股票回購授權並將季度股息從 $0.01 提升至 $0.25(25 倍增幅)。
- Q1 FY27 數字:總營收 $816 億(+85% YoY,+20% QoQ),毛利率 74.9%(GAAP);資料中心收入 $752 億(+92% YoY)由 Blackwell 300 系列量產驅動;Edge Computing $64 億(+29% YoY)由工作站需求拉動。
- Q2 指引 $910 億:超出市場預期的 ~$870 億,指引不含任何中國資料中心算力收入(出口管制影響),顯示非中國市場需求已足以填補缺口。
- 資本回報:宣布追加 $800 億股票回購授權(截至 2026 年 4 月末剩餘回購額度,Nvidia 歷史上最大規模的回購計畫之一);季度股息從 $0.01 升至 $0.25,增幅 25 倍,年化股息率顯著提升。
- 市場反應:5 月 22 日公布財報,儘管業績超預期,股價當日小跌 0.9%;分析師解讀為「爬牆式下滑」(buy the rumor, sell the news),市場此前已充分 priced in。紀念日後 5/26 美股恢復交易。
頭條・臺灣本地
Jensen Huang arrives Taiwan a week early, trillion-dollar dinner set for May 28, GTC Taipei keynote June 1
Nvidia CEO 黃仁勳 5 月 23 日飛抵台北松山機場,在 Computex 2026(6/2 開幕)前提早一週登台,隨即出席南港 Meet-A-Claw 開發者活動,5 月 28 日「兆元晚宴」將宴請 TSMC 魏哲家、鴻海劉揚偉、聯發科蔡明介等台灣 AI 供應鏈領導人;GTC Taipei 主題演講定 6 月 1 日台北流行音樂中心登場。
- 提早一週登台:黃仁勳 5/23 抵台,遠早於 Computex 6/2 開幕;隨即前往南港出席 Meet-A-Claw(面爪?)開發者活動推廣代理 AI,預告 GTC Taipei 的主題。
- 兆元晚宴(5/28):黃仁勳將宴請 TSMC 董座魏哲家、鴻海科技集團董座劉揚偉、聯發科 CEO 蔡明介、台達電董座鄭平等台灣 AI 供應鏈領袖,確認合作夥伴關係與 Vera Rubin / Blackwell Ultra 出貨時程。
- GTC Taipei 主題演講(6/1):地點台北流行音樂中心,時間上午 11 時台灣標準時間,預期宣布最新 AI 硬體路線圖和台灣夥伴生態;AMD CEO Lisa Su 也在本週訪台,兩大 CPU/GPU 廠商同場角力。
- 背景:Vera Rubin 平台量產對台灣供應鏈(CoWoS 先進封裝 TSMC、HBM SK Hynix、散熱廣達/緯穎)需求龐大,黃仁勳此行預計就量產規模和供應鏈產能分配進行最後確認。
推薦閱讀・工程文化
Simon Willison: AI coding agents are ending programming language lock-in
Simon Willison 在 5 月 14 日的文章中指出,程式語言的「技術鎖定」正在消失——AI 程式代理讓技術遷移成本大幅降低,工程師和公司可以更自由地選擇當下最合適的工具,而不必為未來的遷移代價恐懼;文章以一家公司將原生 iOS/Android 應用遷移至 React Native 的決策為例,揭示了代理驅動開發正在重塑技術選型的底層邏輯。
- 核心論點:「程式語言過去是技術鎖定,但這個現象正在快速消失。」AI 程式代理讓重寫和遷移的成本大幅下降,降低了在特定技術棧上「押錯注」的風險。
- 案例:一家中型科技公司用 React Native 重寫了原生 iOS/Android 應用,選擇時工程師的心理是「如果 React Native 不合適,我們以後可以再遷回原生」——這個自信在幾年前幾乎不可能。
- 為什麼可能:AI 代理能快速生成大量樣板程式碼,自動化測試與回歸驗證降低了遷移風險;框架本身也在進步(React Native 現在確實成熟很多),兩者相互強化。
- 值得思考的問題:如果「鎖定效應」消失,工程師和 CTO 的技術選型決策邏輯需要重寫——當下的最優選比未來遷移成本更重要,「賭一個平台贏得未來」的必要性降低。
推薦閱讀・AI 與數學
Quanta Magazine: The AI revolution in math has arrived — how mathematicians are working with machines
Quanta Magazine 4 月深度報導,AI 在 2025–2026 年間快速滲透純數學研究:從 IMO 五題(2025 年夏)到 OpenAI 的 Erdős 猜想突破,AI 不再只是計算工具,而是能提出人類數學家未曾考慮的策略;數學家對此又敬畏又焦慮,文章剖析這場靜悄悄的革命正在如何重塑數學研究的文化與方法論。
- 轉捩點:2025 年夏,多個 AI 模型在國際數學奧林匹亞(IMO)答對六題中的五題,這被數學社群視為 AI 進入「研究數學」門檻的歷史節點;此後 AI 工具在各大數學系的使用顯著升溫。
- 兩種使用方式:輔助式(AI 幫助驗證和形式化已知思路,如 Lean/Mathlib 定理機械化)和主動式(AI 提出人類未考慮的策略,如 OpenAI 引入代數數論工具解幾何問題);前者已普及,後者 2026 年才開始出現。
- 數學家的矛盾心理:論文中「AI assisted」的聲明越來越普遍,但頂尖數學家對「AI 找到的證明是否有數學美感」存在深刻爭論——若 AI 能在幾分鐘內找到任何猜想的反例,數學研究的意義是否改變?
- 方法論挑戰:AI 產生的證明有時過長、難以人類閱讀,引發「嚴謹性」的哲學討論;與此同時,AI 也在加速數學的「形式化運動」,要求所有推理步驟可機械驗證。