開欄語:【AIGC行業周報】梳理AIGC行業一周內發生的重要動態,產品釋出和業內大咖的最新觀點。
圖片來源:每經制圖
一、市場企業動態
1、輝達全面開源GPU內核驅動
輝達官宣全面開源GPU內核驅動,兩年前已開始相關舉措,此次開源部份驅動程式碼仍在主線內核之外。
新產品和旗艦平台支持開源GPU內核模組,舊版GPU不支持,開源可讓開發者改進驅動程式並增加功能。
網友認為輝達開源有多種動因,包括應對內核修改、被合作夥伴敦促等,其真正在意的是增長的市場。
2、AI教母李飛飛創業打造空間智能獨角獸
李飛飛創辦的World Labs短短3個多月成為估值10億美元的AI獨角獸,並獲1億投資。
World Labs瞄準空間智能理念,旨在教導演算法具備常識,克服技術局限性。
李飛飛在電腦視覺領域成果斐然,其理念註重將AI訓練得以人為本。
3、矽谷大廠被曝用YouTube影片訓練AI引爭議
Proof News調查發現Anthropic、輝達、蘋果等矽谷巨頭使用YouTube影片字幕訓練AI,創作者對此毫不知情。
YouTube數據被視為「金礦」,但AI公司使用這些數據引發了版權和合理使用等問題,許多創作者對未來感到迷茫。
EleutherAI建立的YouTube字幕數據集引發爭議,谷歌表示采取行動防止未經授權的數據抓取行為。
二、產品技術動態
1、OpenAI釋出GPT-4o mini,引發大模型價格戰
OpenAI深夜釋出GPT-4o mini,效能更強、更便宜,GPT-3.5退場。
GPT-4o mini在各方面表現出色,性價比極高,將擴充套件AI套用範圍。
GPT-4o mini的作者包括清華同濟校友,其推出為開發者構建套用帶來便利。
2、谷歌Gemini升級可在Android器材釘選狀態下回答提問
谷歌對Gemini進行功能升級,使其能在Android器材釘選狀態下回答各種提問。
此前Gemini功能局限,提問某些問題需解鎖手機,現在新增了免提體驗功能。
使用者偏好設定頁面新增「Gemini在鎖屏狀態」選項,該功能剛推出不久。
3、Mistral AI釋出數學推理和程式碼生成大模型
Mistral AI釋出了專註於數學推理的7B大模型Mathstral,能解決高級數學問題。
同時釋出的Codestral Mamba模型使用Mamba2架構,用於程式碼生成,在基準測試中表現優異。
兩個模型均遵循Apache 2.0 license開源協定,模型權重可在HuggingFace上獲取。
4、安卓版Claude釋出
Anthropic釋出安卓版Claude套用,功能強大,輕量且反響不錯。
Claude安卓版具有多語言處理、影像分析等功能,旨在擴大使用者群,挑戰OpenAI。
未來人工智能助手在流動通訊器材上的競爭將更激烈,關鍵在於技術創新和消費者信任的平衡。
5、北大釋出Prompt自動增強系統PAS
北大釋出Prompt自動增強系統PAS,可自動增強Prompt,提升大模型效能,超越SOTA。
PAS透過數據收集、生成和微調等步驟實作,能整合到不同LLMs中,且在實驗中表現優異。
PAS減少了數據消耗,具有高效性和靈活性,人工評估也顯示其在多個場景中優於基線模型。
6、快手開源LivePortrait可控人像影片生成框架
快手開源LivePortrait,能將驅動影片的表情、姿態遷移到人像影片上,在全網快速「走紅」。
LivePortrait基於隱式關鍵點框架,采用高質素訓練數據和混合訓練策略,模型訓練分為兩階段。
LivePortrait已在快手諸多業務落地,並將探索多模態驅動的人像影片生成,持續為使用者創造價值。
7、OpenAI的「草莓」計劃與AGI進展
OpenAI被曝出新專案「草莓」,能提前計劃、自主瀏覽網頁和進行深度研究,推理能力顯著提高,疑似已達AGI L2級別。
「草莓」包括「後訓練」等特殊方法,OpenAI希望其能顯著提高AI模型的推理能力,並具備執行長時間任務等能力。
OpenAI最近展示了GPT-4o等模型的新演示,若加上「草莓」的推理能力,離AGI的實作或將更近。
三、前沿觀點
1、專訪「生成式人工智能之父」Schmidhuber:關於人工智能的歷史、現狀與未來
被譽為「生成式人工智能之父」的Schmidhuber認為人工智能的開端早於1956年,他在1990 - 1991年的研究成果為當今生成式AI奠定基礎。
Schmidhuber認為「深度學習三巨頭」未恰當參照他人成果,違反學術道德,應被剝奪獎項,他還對AI學界和業界的現狀發表了看法。
Schmidhuber認為未來將出現自我復制、自我改進的機器文明,同時強調了研究過往論文對年輕科學家的重要性。
來源:每經科技提供
每日經濟新聞