大模型價格又砍一刀 這次「屠夫」竟是量化私募？

2024-05-10科技

【科創板日報】5月10日訊 連AI大模型也開始「卷」價格了， 這次舉起「砍價屠刀」的攪局者，沒有科技巨頭加持，也沒有互聯網大廠背景，而是和幻方這家量化私募有著千絲萬縷關系 。

日前，深度求索開源第二代MoE大模型DeepSeek-V2，頂著「價格屠夫」的稱號一炮而紅—— 效能比肩GPT-4、價格僅有GPT-4的近百分之一 。

值得註意的是，DeepSeek出品公司是杭州深度求索人工智能基礎技術研究有限公司（以下簡稱「杭州深度求索」），此前多家媒體報道顯示， 深度求索為幻方旗下組織機構。且幻方量化曾在去年4月釋出公告稱，將全力投身到人工智能技術之中，成立新的獨立研究組織「深度求索」 。

另據天眼查數據顯示，杭州深度求索的背後為幻方量化實控人梁文鋒，後者在杭州深度求索最終受益的股份比例超八成。

效能方面，DeepSeek-V2擁有2360億參數，其中每個token210億個活躍參數。據官網介紹，DeepSeek-V2中文綜合能力（AlignBench）「在眾多開源模型中最強」，超過GPT-4，與GPT-4-Turbo，文心 4.0等閉源模型在評測中處於同一梯隊；英文綜合能力（MT-Bench）與LLaMA3-70B處於同一梯隊，超過最強MoE開源模型Mixtral8x22B。

算力需求方面，分析機構SemiAnalysis指出，DeepSeek-V2訓練參數量達8.1萬億個token，而表現出「難以置信」的訓練效率， 計算量僅為Meta Llama 3 70B的1/5，更只有GPT-4 的1/20 。

如果說上述這些只是AI技術叠代浪潮中常見的「技術炫技」，那麽價格則是該模型最引發關註的要點。

目前DeepSeek-V2 API定價為： 每百萬token輸入1元、輸出2元（32K上下文），僅是GPT-4的近百分之一水平 。

SemiAnalysis給出了「便宜得難以置信」的評價。據該機構計算，在其算力服務力利用率最高的情況下， DeepSeek每台伺服器每小時收益可達35.4美元，毛利率在70%以上 。

幻方量化，這家號稱量化界「四大天王」之一的私募，管理規模曾一度飆升至千億，但之後幻方產品大幅回撤，管理規模也迅速縮水。去年年末，幻方還遭投資者控訴稱，「花100萬元買了幻方量化的產品兩年多，贖回時只剩約80萬元，還要被計提3萬多的業績報酬」。

幻方量化去年4月公告成立「深度求索（DeepSeek）」之後，深度求索釋出了第一代大模型，並將免費商用，完全開源。

彼時，幻方量化的公告曾在業內引發「AI炒股說」的議論，但幻方量化董事總經理陸政哲表示，「我用中文重申一下：AGI不是用來炒股的，有大得多的用處和大得多的價值。」

在此之前，幻方量化已於2019年投資2億元自主研發深度學習訓練平台「螢火一號」，搭載了1100塊GPU； 2021年幻方量化對「螢火二號」投入增加到10億元，且搭載了約1萬張輝達A100顯卡——也是在那一年末，OpenAI的ChatGPT橫空出世，掀起全球AI熱潮和輝達GPU「搶購潮」。

值得一提的是， 為了投入人工智能，幻方還租下「20個網球場」 。去年末有媒體報道稱，北京深度求索人工智能（以下簡稱「北京深度求索」）正在進行裝修招標，辦公室選址於北京海澱區融科中心，裝修工程面積達1950平方米，並獲得了施工特許證。

而天眼查顯示，北京深度求索則由上文提到的杭州深度求索100%控股。

大模型價格又砍一刀 這次「屠夫」竟是量化私募？

大模型價格又砍一刀這次「屠夫」竟是量化私募？