當前位置: 華文世界 > 科技

大模型價格又砍一刀 這次「屠夫」竟是量化私募?

2024-05-10科技

【科創板日報】5月10日訊 連AI大模型也開始「卷」價格了, 這次舉起「砍價屠刀」的攪局者,沒有科技巨頭加持,也沒有互聯網大廠背景,而是和幻方這家量化私募有著千絲萬縷關系

日前,深度求索開源第二代MoE大模型DeepSeek-V2,頂著「價格屠夫」的稱號一炮而紅—— 效能比肩GPT-4、價格僅有GPT-4的近百分之一

值得註意的是,DeepSeek出品公司是杭州深度求索人工智能基礎技術研究有限公司(以下簡稱「杭州深度求索」),此前多家媒體報道顯示, 深度求索為幻方旗下組織機構。且幻方量化曾在去年4月釋出公告稱,將全力投身到人工智能技術之中,成立新的獨立研究組織「深度求索」

另據天眼查數據顯示,杭州深度求索的背後為幻方量化實控人梁文鋒,後者在杭州深度求索最終受益的股份比例超八成。

效能方面,DeepSeek-V2擁有2360億參數,其中每個token210億個活躍參數。據官網介紹,DeepSeek-V2中文綜合能力(AlignBench)「在眾多開源模型中最強」,超過GPT-4,與GPT-4-Turbo,文心 4.0等閉源模型在評測中處於同一梯隊;英文綜合能力(MT-Bench)與LLaMA3-70B處於同一梯隊,超過最強MoE開源模型Mixtral8x22B。

算力需求方面,分析機構SemiAnalysis指出,DeepSeek-V2訓練參數量達8.1萬億個token,而表現出「難以置信」的訓練效率, 計算量僅為Meta Llama 3 70B的1/5,更只有GPT-4 的1/20

如果說上述這些只是AI技術叠代浪潮中常見的「技術炫技」,那麽價格則是該模型最引發關註的要點。

目前DeepSeek-V2 API定價為: 每百萬token輸入1元、輸出2元(32K上下文),僅是GPT-4的近百分之一水平

SemiAnalysis給出了「便宜得難以置信」的評價。據該機構計算,在其算力服務力利用率最高的情況下, DeepSeek每台伺服器每小時收益可達35.4美元,毛利率在70%以上

幻方量化,這家號稱量化界「四大天王」之一的私募,管理規模曾一度飆升至千億,但之後幻方產品大幅回撤,管理規模也迅速縮水。去年年末,幻方還遭投資者控訴稱,「花100萬元買了幻方量化的產品兩年多,贖回時只剩約80萬元,還要被計提3萬多的業績報酬」。

幻方量化去年4月公告成立「深度求索(DeepSeek)」之後,深度求索釋出了第一代大模型,並將免費商用,完全開源。

彼時,幻方量化的公告曾在業內引發「AI炒股說」的議論,但幻方量化董事總經理陸政哲表示,「我用中文重申一下:AGI不是用來炒股的,有大得多的用處和大得多的價值。」

在此之前,幻方量化已於2019年投資2億元自主研發深度學習訓練平台「螢火一號」,搭載了1100塊GPU; 2021年幻方量化對「螢火二號」投入增加到10億元,且搭載了約1萬張輝達A100顯卡——也是在那一年末,OpenAI的ChatGPT橫空出世,掀起全球AI熱潮和輝達GPU「搶購潮」

值得一提的是, 為了投入人工智能,幻方還租下「20個網球場」 。去年末有媒體報道稱,北京深度求索人工智能(以下簡稱「北京深度求索」)正在進行裝修招標,辦公室選址於北京海澱區融科中心,裝修工程面積達1950平方米,並獲得了施工特許證。

而天眼查顯示,北京深度求索則由上文提到的杭州深度求索100%控股。