AI 領域的巨頭們不斷推陳出新,以引領行業發展潮流。
(一)OpenAI 的神秘新模型
OpenAI 被曝 12 月推出 Orion,引起了廣泛關註。據報道,OpenAI 的高管曾透露 「Orion」 要比 GPT - 4 強大 100 多倍。OpenAI Japan 執行長長崎忠雄也表示,GPT Next 預計會有更大的飛躍,效能將提高 100 倍。雖然在 OpenAI 內部,Orion 被視為 GPT - 4 的繼任者,但尚不清楚公司是否會在外部稱其為 GPT - 5。目前,OpenAI 尚未就此事作出明確回應,但這一訊息已經在行業內引發了熱議。
(二)谷歌的激烈競賽
谷歌在 AI 競賽中也不甘示弱。訊息稱谷歌計劃 12 月釋出 Gemini 2.0 模型。盡管最新報告指出,Demis Hassabis 領導的團隊未能在新模型中實作預期的效能提升,但該模型仍受到廣泛關註。谷歌宣布 Gemini 套用團隊將並入 DeepMind,計劃將產品分別面向開發者與終端使用者推出。此外,谷歌可能最早在 12 月預覽其對 Rabbit 大型動作模型概念的詮釋,代號為 「Project Jarvis」 的計畫將為使用者執行任務,包括 「收集研究資料、購買產品或預訂航班」。Jarvis 由未來版本的谷歌 Gemini 提供支持,僅在網路瀏覽器中工作,特別針對 Chrome 進行了最佳化。
(三)Meta 的新聞合作
Meta 與路透社簽署了人工智慧協定,這是 Meta 在人工智慧時代促成的第一筆新聞業務相關的交易。Meta 的人工智慧聊天機器人將參照路透社的報道回答新聞相關問題。從周五開始,美國 Meta 公司人工智慧聊天機器人功能的使用者在詢問有關新聞或時事的問題時,可以獲得路透社的即時新聞和資訊。路透社將因其內容出現在 Meta 的 AI 聊天機器人中而獲得報酬。這一合作將有助於確保為那些尋求時事資訊的人提供更有用的體驗。
二、技術突破點亮未來
AI 技術的不斷突破,為未來帶來了無限可能。
(一)仿生機器人的獨特魅力
波蘭 Clone Robotics 公司推出的仿生機器人 Torso 令人矚目。這款機器人采用創新的人造肌肉技術,其核心由模制碳纖維骨頭制成,其余部份全由軟組織構成,包括韌帶、肌腱、靜脈、脂肪、結締組織等。它的動力系統包括一個電液泵和一個能存水的容器,電液泵就像人的心臟一樣,可以為肌肉提供動力,讓肌肉收縮和放松。Torso 的手部設計也十分獨特,名為 Clone Hand 的機械手是世界上最接近人類肌肉骨骼結構的機械手,由該公司特制的液壓肌肉和閥門驅動。它有 24 個可以動的地方,能像人的手指和手腕那樣彎曲和轉動,所用的材料是公司自己研發的一種聚合物,比金屬輕,但更結實柔軟。手裏面裝了 37 條特殊的肌肉,叫做 McKibben 肌肉,收縮起來只需 0.3 秒,可以快速靈活地做動作。Torso 動作靈活性極高,腦袋可以上下左右轉動,肩膀到指尖的每個關節都能活動,可以凹出各種造型,為執行更精密的操作,比如拿手術刀、打針等提供了可能。
(二)動作捕捉工具的革新意義
Runway 推出的 AI 視訊生成工具 Act-One 具有重大的革新意義。在面部表情捕捉方面,Act-One 能夠使用任何視訊網路攝影機,包括內建於智慧型手機中的網路攝影機,來錄制自己或演員的面部表情,並以極高的精確度將這些表情對映到 AI 生成的角色上。這一功能極大地簡化了動畫制作過程,傳統上制作面部動畫是一個既復雜又繁瑣的過程,涉及到動作捕捉裝置、手工面部繫結和多角度的參考影像,而 Act-One 讓使用者只需提供一段簡單的視訊,就能將表演中的各個細節轉移到一個或多個風格迥異的 AI 生成角色之上。同時,Act-One 在各種攝影機角度下呈現電影級的真實感,能夠在多變的攝影機角度和不同的焦距下,創造出具有電影質感的真實畫面,為視訊敘事帶來了更廣闊的能力。使用者僅需一台普通的消費級相機,一位演員就能夠表演多個不同的角色,Act-One 能夠為每個角色創造出獨一無二的表現,為獨立電影和數位媒體領域的創作者提供了前所未有的便利。
三、工具創新拓展可能
AI 工具的不斷創新為各個領域帶來了前所未有的新機遇。
(一)語音客製的新紀元
ElevenLabs 推出的語音客製工具 Voice Design 開創了 AI 配音領域的新紀元。使用者只需透過簡單的文本描述,如 「溫暖友好的中年女性聲音,帶著輕微英國口音」,系統便能快速生成符合要求的個人化語音。Voice Design 支持調節多個語音參數,包括年齡、性別、口音、語調和音高等,確保生成的聲音精確匹配使用者需求。不僅如此,它還突破性地支持創作角色化語音,無論是精靈的空靈之音,還是機器人的金屬音效,都能準確捕捉並還原這些虛擬角色的聲音特征。使用者可以反復調整參數,探索無限的創作可能,為遊戲開發、有聲內容制作等領域提供了強大的創意工具。
(二)數據分析的新利器
Claude AI 上線了一款強大的新工具,可以分析、視覺化 CSV 檔中的數據。此工具類似於 ChatGPT 的程式碼直譯器,能夠編寫和執行 JavaScript 程式碼,實作處理數據、進行分析並生成即時洞察。使用者可以透過簡單的輸入提示與上傳檔,引導 Claude 逐步地清理、探索及分析數據,直至達到使用者期望的結果。它能夠給出精確且可重復的答案,並支持建立互動式的數據視覺化圖表。Anthropic 團隊指出,這款新工具在多個領域都能發揮重要作用,比如市場行銷人員可上傳客戶互動數據,Claude 將提供改善轉化率的建議;銷售團隊可以上傳全球銷售數據,Claude 將提供各國的績效分析;產品經理可透過上傳客戶參與數據,Claude 幫助指導開發優先級;工程師上傳效能日誌,Claude 將辨識資源利用的改進空間;財務團隊可上傳月度財務數據,Claude 將建立財務儀表板,展示關鍵趨勢。目前,這一強大的新功能在
Claude.ai
中處於功能預覽階段,使用者可以隨時啟用或禁用該功能。
四、AI 圈的未來展望
10 月 27 日的 AI 圈可謂熱鬧非凡,各大巨頭紛紛發力,技術不斷突破,工具持續創新。OpenAI 被曝推出新模型,谷歌積極參與競賽,Meta 開展新聞合作,這些事件不僅展示了當前 AI 領域的激烈競爭態勢,也為未來的發展奠定了基礎。
仿生機器人的出現,為醫療、制造等領域帶來了新的可能性。動作捕捉工具的革新,極大地簡化了動畫制作過程,為影視行業帶來了新的創作方式。語音客製工具和數據分析新利器的推出,為遊戲開發、市場行銷等領域提供了強大的創意和分析手段。
這些事件對 AI 發展的影響是深遠的。首先,它們推動了 AI 技術的不斷進步,促使各大公司加大研發投入,提高模型效能和功能。其次,這些創新將加速 AI 在各個行業的套用,提高生產效率,改善使用者體驗。最後,它們也引發了人們對 AI 倫理和治理的關註,促使社會各界共同探討如何確保 AI 的安全、可靠和永續發展。
展望未來,AI 領域的發展趨勢將呈現以下幾個特點:
(一)多模態融合
隨著技術的不斷發展,AI 將實作多模態融合,能夠處理文本、聲音、影像等多種輸入資訊,並將其融合起來進行綜合理解。這將為文藝作品創作、智慧家居、智慧城市等領域帶來全新的套用場景。
(二)與人類協同發展
AI 將不再僅僅是一種工具,而是人類的 「左膀右臂」。在醫療、教育、法律等領域,AI 將輔助人類進行決策和工作,提高生產力和生產水平。
(三)倫理和法規的完善
隨著 AI 在日常生活中的參與度不斷上升,倫理和法規問題將更加受到關註。未來,將制定更加嚴格的標準,確保 AI 技術的公平、透明和負責任發展。
(四)量子計算與 AI 的結合
量子計算將為 AI 插上翅膀,加速機器學習和最佳化演算法,實作更高效、更準確的 AI 套用。
總之,未來的 AI 領域充滿了機遇和挑戰。我們期待著 AI 技術的不斷進步,為人類帶來更多的福祉。