當前位置: 華文世界 > 遊戲

Claude 3反超GPT-4競技場登頂!小杯版成開發者新寵:性價比無敵

2024-03-30遊戲
魚羊 發自 凹非寺 量子位 | 公眾號 QbitAI
GPT-4真的被反超了!
大模型競技場上,Claude 3大杯Opus新王登基,Elo分數來到榜首。
連小杯Haiku也躋身第二梯隊,超過了GPT-4-0613這個型號,把GPT-3.5-turbo遠遠甩在身後。
Haiku的輸入token價格,可是比GPT-3.5-turbo還便宜了一半,輸出方面,每100萬token也比GPT-3.5-turbo便宜近2塊錢。
跟GPT-4相比,價格更是只有1/20。並且Haiku同樣支持200k上下文。
難怪有開發者直言:
GPT-3.5在Claude Haiku面前不堪一擊。 不僅僅是價格更便宜,Haiku還更上一層樓了。
而在Claude 3加入競技之前,GPT-4家族已經霸榜快一年了。
給新來的朋友補充一下背景知識:大模型競技場榜單(LMSYS Chatbot Arena Leaderboard)的評分標準是人類打分,同一個問題同時拋給A、B兩個模型,人類裁判覺得哪個回答得好就給哪個投票。
小杯Haiku成開發者新寵
值得一提的是,在競技場官方賀電中,Haiku這個型號也被專門高亮了出來:
根據我們的使用者偏好,Claude 3 Haiku達到了GPT-4級別。 其速度、功能和上下文長度在目前的市場上是獨一份的。
具體有多快,已經有網友做了個直觀的對比:
博爾特還沒跑完100米,Haiku已經讀完100k token的文件了……
事實上,憑借其超高的性價比,在開發者社群中,Claude 3小杯Haiku確已成新寵。
已經有人第一時間大開腦洞,搞出了能讓Haiku效果「超頻」到大杯Opus水準的開源專案,吸引不少關註。
簡單來說,就是讓Opus給Haiku當老師 :
先用Opus生成執行任務的範例,再用這些教學案例來提高Haiku的姿勢水平。
劃重點:Haiku的價格僅為Opus的1/60,而響應速度則是Opus的10倍。
這個名為gpt-prompt-engineer 的專案目前在GitHub上累計攬下7.3k標星。
還是這位馬特老哥,還用Opus和Haiku搞了個「AI股票分析師」,直接火上了GitHub熱榜。
不少套用產品也在第一時間接入了Haiku。比如能依據Prompt自動生成網站UI的Vercel。
△就說快不快吧
不過,就在一片給Claude 3新王點贊的聲音中,也有網友認為:
GPT-3.5作為一個「老」模型,至今仍在與最新的模型競爭,這件事本身就很瘋狂了。
但最讓開發者們期待的當然還是:
OpenAI,快起來卷(doge)。