當前位置: 華文世界 > 科技

火山引擎連發兩款視訊大模型,推動AI普及

2024-10-05科技

火山引擎連發兩款視訊大模型,推動AI普及

一日連發兩款視訊大模型,火山引擎要讓每個人都能用上AI

2023年9月24日,字節跳動旗下的火山引擎在深圳舉辦了AI創新巡展,首次推出了豆包視訊生成模型PixelDance和Seaweed。同時,火山引擎還宣布了多項AI大模型的升級,以全新的姿態迎接AI時代的來臨。

此次巡展吸引了眾多參觀者,現場設有四個不同的展示區,分別展示了AI奇遇、AI音樂、AI智慧助手和AIBot等四大套用,涵蓋了娛樂、創作、問答和個人化AI需求等領域。這些套用反映了AI技術在C端的廣泛套用和使用者需求。

其中,AIBot引起了廣泛關註。該平台利用AI大模型的理解能力,幫助使用者開發個人化的AI套用,使用者無需編程知識,只需明確需求,AI便可自動完成開發過程。這種便捷性使得普通使用者能夠輕松使用AI技術,推動了AI套用的普及。

用AI打破視訊創作邊界

在視訊創作領域,火山引擎無疑是行業的領先者。借助抖音引發的全球視訊創作熱潮,火山引擎致力於提升使用者在實際創作中的體驗,著重最佳化創作流程和效果。透過大量的技術最佳化,他們的豆包視訊生成模型旨在為使用者提供接近實際拍攝效果的畫面。

此外,火山引擎還在AI視訊創作中解決了多個痛點,例如多動作指令互動和人物中途插入的自然銜接。這種復雜場景的處理使得AI在創作中更加靈活和真實,為普通使用者提供了更高的創作自由度。

為了滿足多樣化的創作需求,火山引擎還引入了深度最佳化的Transformer結構,使豆包視訊生成模型能夠支持多種風格的生成,包括3D動畫、國畫等。這些升級將為各個領域的創作者提供更好的工具,鼓勵他們自由表達創意。

豆包AI模型Pro升級

除了豆包視訊生成模型,火山引擎還宣布了豆包通用模型和音樂模型等多個AI大模型的升級,旨在為使用者提供更豐富的套用體驗。在AI音樂方面,火山引擎展示了其快速生成音樂的能力,使用者只需提供簡單的要求,系統便能快速生成一首旋律動聽的曲子及其歌詞。這一過程的簡便性,實際上是火山引擎在音樂模型最佳化中取得的顯著成果。

火山引擎利用獨特的音樂生成架構和解碼模型,使得音樂生成的時間縮短至秒級,呈現出更為真實的演唱效果。現場許多嘉賓在聆聽後表示,若不告知是AI創作的,或許會誤認為是新晉歌手的作品。這表明火山引擎在AI創作領域已經克服了多項技術難關。

火山引擎在現場還展示了數位人生成套用,使用者可以在短時間內生成一個具有擬真表情和語氣的數位人。這種套用廣泛適用於直播、線上教學及智慧客服等場景,標誌著火山引擎在多領域AI套用方面的突破。

結合數位人和同聲傳譯模型,火山引擎為海外市場的主播提供了新的解決方案,滿足了日益增長的多語種直播需求。這一策略為火山引擎的市場擴充套件帶來了新的可能。

讓所有人都能用上AI

為了適應AI模型需求的迅速增長,火山引擎不斷提升大模型的承載能力。豆包大模型的預設並行流量標準已提升至800KTPM,遠超行業普遍標準。同時,火山引擎也降低了算力成本,其定價已低於行業99%。這一變化有效地降低了開發者的進入門檻,推動了更廣泛的AI套用生態形成。

火山引擎的CEO譚待指出,降低算力成本不僅是為了應對當前市場需求,更是為未來的AI發展打下堅實基礎。透過最佳化技術架構,他們能夠以更低的成本提供更高品質的服務,保持技術的領先優勢。

譚待對豆包視訊生成模型的未來充滿信心。他認為,豆包模型依托於多個技術成果,因此在技術挑戰上已經做好準備。同時,火山引擎將繼續最佳化視訊生成模型的效率,使其盡快面向市場,滿足日益增長的使用者需求。