輝達財報前夜，OpenAI下一代模型「泄漏」：吃「草莓」的「獵戶座」

2024-08-29科技

GPT-5遲遲未出，等來了神秘的「草莓」和「獵戶座」模型，OpenAI再次站在風口浪尖。

據科技媒體The Information最新報道， OpenAI神秘「草莓」（Strawberry，前身為Q*）計畫，計劃最早今年秋季推出。同時用「草莓」合成數據來開發的最新大模型「獵戶座」（Orion），該模型或於明年年初推出。

此前，OpenAI多次「放風」將推出「草莓」模型，ChatGPT曾於8月初在X上釋出了草莓的表情，似乎在暗示在「草莓」大模型，Sam Altman最近也在社交媒體上釋出了一張草莓的圖片。

「草莓」是一個推理模型，核心能力在於強大的推理能力，可處理復雜的問題；「獵戶座」則是超越GPT-4的下一代大模型，減少過程中幻覺或錯誤大幅減少。

此外，「草莓」模型不僅會為獵戶座提供訓練數據，OpenAI可能還會用「草莓」的簡化版本整合在ChatGPT中，增強GPT-4的推理能力。

神秘的「草莓」和「獵戶座」模型是什麽？

具體來看，「草莓」是一個推理模型：

核心能力在於強大的推理能力， 它並不局限於回答技術問題，而是擁有處理復雜問題的能力，例如解決編程和數學問題，這在傳統的對話式AI中一直是一個難題。

盡管提高語言理解和推理能力，但同時需要額外更多地時間去「思考」；

而「獵戶座」則是超越GPT-4的下一代大模型：

使用「草莓」的高品質數據訓練，從而減少模型產生的幻覺或錯誤。

「草莓」技術對「獵戶座」的重要性不言而喻。據研究人員透露，使用「草莓」可以為「獵戶座」生成高品質的訓練數據， 「獵戶座」透過訓練數據學習，接觸到的正確復雜推理範例越多，學習效果就越好。

推理能力大爆發，「草莓」更像個推理外掛程式

OpenAI創始人兼CEO阿特曼曾強調，今後AI發展的關鍵將圍繞推理能力展開。

由於推理能力限制，目前AI技術在諸如航空航天、結構工程之類的數學密集型行業中並沒有得到廣泛套用。因此，大模型數學推理能力的最佳化成為普及AI套用的必備條件，也是AI公司們進一步提升盈利能力的必經之路。

「草莓」模型的前身是Q*演算法模型，Q*能夠解決棘手的科學和數學問題。如果AI模型掌握了數學能力，將擁有更強的推理能力， 甚至可以解決從未見過的數學問題或者自發解決變成問題，與人類智慧相媲美。

值得一提的是，「草莓」模型在 MATH 基準測試中的得分已經超過90%，整體效能十分驚艷。

有網友稱，相信草莓模型會成為金融等科技的行業改變規則，徹底解決復雜計算、推理的方式。

從產品路線上看，OpenAI或將原始的「草莓」模型透過「蒸餾」生成簡化版本， 將改進的推理能力整合到GPT中。簡化版本旨在保持與原始模型相同的效能水平，同時操作更容易、成本更低。

盡管這可能會使答案更準確，但花費的時間可能更多，這意味著「草莓」可能不適合需要即時響應的套用，預計ChatGPT使用者將能夠根據需求選擇開啟或關閉「草莓」功能。

本文來自華爾街見聞，歡迎下載APP檢視更多