當前位置: 華文世界 > 科技

AWS搭載「最強大模型」!40億美元投向OpenAI競對,打通商業化落地「最後三公裏」

2024-04-02科技

智東西
作者 | 香草
編輯 | 李水青

智東西4月2日報道,今天,亞馬遜雲科技(AWS)與智東西等少數媒體分享了與AI創企Anthropic合作的最新進展,並現場演示了Claude 3大模型的多模態、長文本、語境理解等能力。

AWS近日宣布向Anthropic追加投資27.5億美元,截至目前已經向這家OpenAI強力競對累計註資40億美元。此外,雙方的合作關系也再次加深,Amazon Bedrock引入了Anthropic最新釋出的Claude 3模型。

會後,AWS大中華區產品部總經理陳曉建向我們分享了大模型落地實踐的解讀。在他看來,大模型想要打通落地最後N公裏,需要選擇一個具體的、簡單的切入點,從點到面逐步擴充套件套用場景,由簡單到復雜逐步切入。

當談到AWS下一步的發展戰略時,他稱從客戶需求來看,目前芯片等硬體設施仍然落後於大模型的發展,其叠代速度跟不上模型參數規模的指數級提升,如何將底層能力與大模型復雜度相匹配,是現在面臨的主要挑戰。

一、從基礎設施、工具鏈到AI套用,構建生成式AI完整技術棧

陳曉建首先解讀了AWS的生成式AI技術棧。目前,AWS在基礎設施層面提供GPUs、自研Trainium芯片、Nitro系統等底層設施,在大模型構建工具層面提供大模型托管平台Amazon Bedrock,在套用層面則推出了智慧助手Amazon Q、程式碼助手Amazon CodeWhisperer等。


▲AWS生成式AI技術棧

在模型層面,除了此前提供的AI21Labs、Cohere、Meta、Stability AI以及亞馬遜自研的模型之外,近期新增了Anthropic和法國創企Mistral AI的新模型。其中,Anthropic的Claude 3以其多模態推理、轉譯、總結等方面的優異能力突出。


▲Amazon Bedrock提供的基礎模型

Claude 3於3月初推出,分為Opus、Sonnet、Haiku三個規模,其中效能最強的Opus模型引各方面測評結果超越GPT-4一舉成為「最強大模型」。


▲Claude 3各模型效能對比

與Claude 2相比,Claude 3最明顯的叠代體現在多模態能力、幻覺的降低、長文本能力等方面。例如借助視覺能力,Claude 3可以理解圖表、圖形、報告等檔,並從中提取數據。


▲Claude 3的多模態能力

在準確率方面,Claude 3大幅改善了幻覺問題,對沒有把握的答案會進行標明,而不是直接給出錯誤答案。


▲Claude 3幻覺降低

在套用場景上,Claude 3可以適用於程式碼輔助、內容續寫、長文本知識召回總結等,也可以用在亞馬遜的「老本行」電商領域,用來撰寫電商商品描述。

基於Amazon Bedrock的能力,AWS面向企業提供了知識庫工具Knowledge Bases,為基礎模型和Agents提供來自企業內部資料來源的上下文資訊,用於RAG(檢索增強生成),從而提供更相關、更準確和更個人化的響應。

Amazon Bedrock的Agents功能則利用基礎模型,提供使用自然語言進行互動和響應來執行多步驟業務任務的能力。

二、現場演示為老黃續寫PPT,扮演不同MBTI人格答題

AWS技術人員為我們現場演示了Claude 3「中杯」模型Sonnet的多模態、長文本、程式碼、轉譯等能力。

在第一個演示中,演示人員輸入了一張輝達CEO黃仁勛演講的PPT,讓Claude總結PPT的內容。


▲輸入的PPT影像

明顯能看出,Amazon Bedrock上搭載的Claude 3生成速度非常快,迅速總結出了PPT上主要內容。


▲Claude 3總結PPT內容

隨後,演示人員追問Claude 3下一頁PPT可以考慮放哪些內容,又讓其按年份總結圖中內容,並歸納為表格形式。


▲Claude 3將PPT內容總結為表格形式

第二個演示展現了Claude 3的長文本能力。演示人員輸入小說【流浪地球】中的一個片段,在其中插入了一句【三體】中的內容,讓Claude 3從中找出不合理的部份。

這是大模型長文本能力評測中十分重要的一種測試。AWS大中華區產品技術總監王曉野談道,之所以長文本能力這麽重要,是因為在情感陪伴、資料讀取等套用場景中,對大模型的「記憶」能力要求很高。尤其是AI陪伴類產品,如果大模型能記住幾個月甚至幾年前使用者聊過的內容,體驗感會大幅提升。


▲Claude 3大海撈針能力

隨後演示人員又展示了Claude 3的詩歌轉譯能力,並與GPT-4做對比。雖然二者都未達到「信達雅」的水準,但Claude 3的轉譯用語更貼合中文用詞習慣一些。


▲Claude 3轉譯能力

第四個演示針對程式碼能力,演示人員要求Claude 3生成一個貪吃蛇遊戲的Python程式碼設計,並給出了基本玩法和失敗條件。


▲貪吃蛇遊戲Prompt

Claude 3按照需求生成了一個完整的程式碼文件,演示人員將程式碼復制到編譯器中執行,貪吃蛇遊戲成功執行起來,並且符合失敗條件,在蛇撞到地圖邊緣時遊戲結束。


▲貪吃蛇遊戲演示

最後,演示人員展示了Claude 3的開放性問題理解能力。透過一個網上很火的性格測試MBTI的問題,讓大模型判斷不同MBTI人格對同一個問題的反應:如果看到一匹馬進入酒吧,你認為馬會說什麽?

在扮演ESTJ、ENFP兩種不同人格時,Claude 3分別站在理性務實、富有想象力和創造力的角度回答了這個問題。


▲Claude 3扮演ESTJ人格


▲Claude 3扮演ENFP人格

結語:AWS為企業客戶打通大模型落地「最後三公裏」

透過投資Anthropic和提供Claude 3模型,AWS再次提升了作為雲平台的競爭力。相比直接使用Claude 3的API(應用程式介面),Amazon Bedrock能夠提供更為穩定的大模型能力,並透過知識庫、Agents等工具提供差異化價值,幫助企業平衡成本與模型能力。

透過構建完整的生成式AI技術棧,從基礎設施到工具鏈,再到具體的AI套用,AWS全方位支持企業客戶數位化轉型。Amazon Bedrock平台為企業提供了強大的知識庫工具和Agents功能,使得大模型的套用更加貼合實際業務需求,同時,AWS還透過試驗叠代、專業培訓、原型開發等服務,為企業使用者提供打通大模型落地的「最後三公裏」。