當前位置: 華文世界 > 科技

2024年2月14日 人工智慧領域(AI)資訊差

2024-02-14科技

「更多的agents = 更好的效能」 - 騰訊研究團隊

騰訊研究團隊釋出了一篇論文,聲稱透過增加代理的數量可以顯著提高語言模型的效能。研究人員使用了一種「抽樣和投票」的方法,將輸入任務多次輸入到具有多個語言模型代理的語言模型中,以產生結果。然後,對這些答案進行多數投票,確定最終答案。

研究人員透過對不同數據集和任務進行實驗來證明這種方法,結果顯示語言模型的效能隨著集合的規模增加而提高,即隨著代理數量的增加(下圖為結果)。他們還證明,透過擴大代理數量,即使是較小的語言模型也可以與較大的語言模型相匹配/超越。

使用多個代理來提升語言模型的效能是一種應對單一模型固有限制和偏見的新策略。這種方法消除了復雜的方法,如思維鏈提示的需求。雖然它不是萬能藥,但可以與現有的復雜方法相結合,激發語言模型的潛力並增強它們以實作進一步的效能改進。

谷歌DeepMind的MC-ViT能夠理解長篇視訊

來自谷歌DeepMind和康奈爾大學的研究人員合作開發了一種方法,使基於人工智慧的系統能夠更好地理解長篇視訊。目前,由於復雜性和計算能力的限制,大多數基於人工智慧的模型只能理解短時間的視訊。

這就是MC-ViT的作用所在,它可以儲存過去視訊片段的壓縮「記憶」,使模型能夠高效地參考過去的事件。這種方法結合了神經科學和心理學,受到了人類記憶鞏固理論的啟發。盡管使用的資源較少,MC-ViT方法提供了最先進的動作辨識和問題回答能力。

大多數基於transformers的視訊編碼器在處理長序列時都會遇到困難,因為它們的復雜性。解決這個問題的努力往往會增加復雜性並降低速度。MC-ViT提供了一種更簡單的處理長篇視訊的方法,而無需進行重大的架構更改。

ElevenLabs是一個讓你的聲音變成被動收入的平台。

ElevenLabs開發了一個AI語音複制模型,可以讓你的聲音變成被動收入。使用者需要註冊他們的「聲優收益」計劃。

建立帳戶後,上傳一個30分鐘的音訊,包含你的聲音。複制模型將使用AI建立一個與你原聲相似的專業聲音複制。然後你可以將其分享到聲音庫中,讓ElevenLabs的不斷增長的社群使用。

之後,每當有人使用你的專業聲音複制時,你將根據你的要求獲得現金或角色獎勵。你還可以選擇標準版權計劃或設定自訂費率來決定你的聲音使用費。

透過利用ElevenLabs的AI語音複制技術,使用者可以以多種方式將他們的聲音變現,例如為有聲書提供旁白,為虛擬助手配音,甚至將他們的聲音用於廣告活動。這種創新使聲優行業民主化,使其不僅僅局限於專業演員和配音藝術家,而是讓更廣泛的受眾可以參與其中。此外,這也反映了人工智慧在重塑傳統行業方面的日益影響力。

其他訊息

NVIDIA執行長黃仁勛倡導各國擁有自主的人工智慧

在杜拜世界政府峰會上發言時,NVIDIA執行長強烈倡導擁有自主的人工智慧。他說:「每個國家都需要擁有自己的智慧生產。」他進一步補充道:「這將使你的文化、社會的智慧、常識和歷史得到編碼 - 你擁有自己的數據。」

Google將在歐洲投資2500萬歐元以提升人工智慧技能

Google承諾投資2500萬歐元來幫助歐洲人民學習如何使用人工智慧。透過這筆資金,Google希望開發各種社會企業和非營利套用。這家科技巨頭還計劃開設「增長學院」,以支持使用人工智慧擴大規模的公司,並將其免費線上人工智慧培訓課程擴充套件到18種語言。

NVIDIA市值超過亞馬遜

NVIDIA公司在周一的市值中暫時超過了亞馬遜公司。NVIDIA股價上漲近0.2%,收盤市值約為1.78萬億美元。而亞馬遜股價下跌1.2%,收盤市值為1.79萬億美元。憑借這個市值,NVIDIA公司暫時成為美國上市公司中市值第四大的公司,僅次於Alphabet、微軟和蘋果。

微軟可能為Windows 11開發一項人工智慧升級功能

微軟可能會在Windows 11上為PC遊戲推出一項人工智慧升級功能,類似於NVIDIA的深度學習超采樣(DLSS)技術。最新測試版本的Windows 11中,一位使用者發現了名為「自動超分辨率」的功能,它使用人工智慧來提高支持的遊戲的幀率和影像細節。微軟尚未宣布這一訊息或硬體細節,如果有的話。

Fandom推出具有爭議的生成式人工智慧功能

Fandom為許多粉絲群體提供維基,並推出了許多生成式人工智慧功能。然而,一些功能,如「快速回答」,引發了爭議。快速回答會生成一個問答式下拉選單,將資訊濃縮成簡潔的句子。維基建立者抱怨它不準確地回答了粉絲的問題,從而損害了使用者的信任。

原文:https://theaiedge.substack.com/p/more-agents-better-llm-performance