當前位置: 華文世界 > 科技

輝達財報前夜,OpenAI下一代模型「泄漏」:吃「草莓」的「獵戶座」

2024-08-29科技

GPT-5遲遲未出,等來了神秘的「草莓」和「獵戶座」模型,OpenAI再次站在風口浪尖。

據科技媒體The Information最新報道, OpenAI神秘「草莓」(Strawberry,前身為Q*)計畫,計劃最早今年秋季推出。同時用「草莓」合成數據來開發的最新大模型「獵戶座」(Orion),該模型或於明年年初推出。

此前,OpenAI多次「放風」將推出「草莓」模型,ChatGPT曾於8月初在X上釋出了草莓的表情,似乎在暗示在「草莓」大模型,Sam Altman最近也在社交媒體上釋出了一張草莓的圖片。

「草莓」是一個推理模型,核心能力在於強大的推理能力,可處理復雜的問題;「獵戶座」則是超越GPT-4的下一代大模型,減少過程中幻覺或錯誤大幅減少。

此外,「草莓」模型不僅會為獵戶座提供訓練數據,OpenAI可能還會用「草莓」的簡化版本整合在ChatGPT中,增強GPT-4的推理能力。

神秘的「草莓」和「獵戶座」模型是什麽?

具體來看,「草莓」是一個推理模型:

  • 核心能力在於強大的推理能力, 它並不局限於回答技術問題,而是擁有處理復雜問題的能力,例如解決編程和數學問題,這在傳統的對話式AI中一直是一個難題。
  • 盡管提高語言理解和推理能力,但同時需要額外更多地時間去「思考」;
  • 而「獵戶座」則是超越GPT-4的下一代大模型:

    使用「草莓」的高品質數據訓練,從而減少模型產生的幻覺或錯誤。

    「草莓」技術對「獵戶座」的重要性不言而喻。據研究人員透露,使用「草莓」可以為「獵戶座」生成高品質的訓練數據, 「獵戶座」透過訓練數據學習,接觸到的正確復雜推理範例越多,學習效果就越好。

    推理能力大爆發,「草莓」更像個推理外掛程式

    OpenAI創始人兼CEO阿特曼曾強調,今後AI發展的關鍵將圍繞推理能力展開。

    由於推理能力限制,目前AI技術在諸如航空航天、結構工程之類的數學密集型行業中並沒有得到廣泛套用。因此,大模型數學推理能力的最佳化成為普及AI套用的必備條件,也是AI公司們進一步提升盈利能力的必經之路。

    「草莓」模型的前身是Q*演算法模型,Q*能夠解決棘手的科學和數學問題。如果AI模型掌握了數學能力,將擁有更強的推理能力, 甚至可以解決從未見過的數學問題或者自發解決變成問題,與人類智慧相媲美。

    值得一提的是,「草莓」模型在 MATH 基準測試中的得分已經超過90%,整體效能十分驚艷。

    有網友稱,相信草莓模型會成為金融等科技的行業改變規則,徹底解決復雜計算、推理的方式。

    從產品路線上看,OpenAI或將原始的「草莓」模型透過「蒸餾」生成簡化版本, 將改進的推理能力整合到GPT中。簡化版本旨在保持與原始模型相同的效能水平,同時操作更容易、成本更低。

    盡管這可能會使答案更準確,但花費的時間可能更多,這意味著「草莓」可能不適合需要即時響應的套用,預計ChatGPT使用者將能夠根據需求選擇開啟或關閉「草莓」功能。

    本文來自華爾街見聞,歡迎下載APP檢視更多