「AIGC 日報」2024.10.6

2024-10-06科技

讓我們看看今天人工智慧領域和AI套用有什麽新的發展新聞呢？
配圖均為我采用AI繪畫生成的原創作品.

1.Claude AI 被曝正研發新功能，突破 20 萬 tokens 檔處理上限
報道稱 Anthropic 公司擴充套件了 Claude 功能，支持使用者處理上下文視窗超過 20 萬 tokens 的檔。
如果 Claude 能夠高效地查詢這些參考檔，可能會大大增強其在編碼和其他需要處理大量數據的套用中的實用性。
來源：testingcatalog
2.氛圍感拉滿：微軟新專利探索 Copilot AI 套用，匹配視訊等生成音樂
報道稱微軟公司獲得了一項新的專利，構想 Copilot 在未來能輔助使用者建立和視訊、文本、PowerPoint 等匹配的音樂或者背景音樂。
微軟該專利名為【Artificial intelligence model for composing audio scores】，主要探討了基於輸入內容，來建立音樂的方法。
該專利主要概述了以下步驟：
收集數據：收集大量的訓練數據，這些封包括許多包含視訊和音訊元件的視聽數據集。
分析提取：分析數據集並提取不同型別的特征。例如文本視訊中的顏色、形狀、運動和場景等等。
關聯：Copilot 會分析這些特征並尋找它們之間的相關性。例如，某些場景（如日落）通常伴隨著特定型別的音樂（如平靜、舒緩的旋律）。
Copilot 將透過這些特性進行訓練，並利用關聯系統，生成與新視訊的視覺和文本特征相匹配的適當音訊評分。
來源：Windows Report

3.數學教授和GPT o1 mini的「智力對決」 AI43秒完成人類數月難題
在賓夕法尼亞大學，有位數學教授 Robert Ghrist 正在與一款名為 GPT-o1-mini 的 AI 模型展開一場有趣的「智力對決」。
Ghrist 曾嘗試使用多個知名的 AI 模型，包括 GPT-4、Claude-3.5和 Gemini-1.5-Pro。這些模型雖然能做出一些假設並提供證據，但常常因一些微妙的錯誤而「翻車」，這讓 Ghrist 感到頗為挫敗。
最終，他與 OpenAI 的 GPT-o1-mini 模型攜手，取得了突破。這個模型不僅分析了一個有缺陷的證明，找出了錯誤，還在短短43秒內生成了一個「全新且巧妙的正確證明」，其優雅程度竟超過了人類的版本。
盡管獲得了成功，Ghrist 也坦承，使用 AI 的過程並不一定比全靠自己來得更快。
不過，事情並非總是一帆風順。就在論文發表後不久，另一位數學家 Sridhar Ramesh 在社交媒體上指出，其實這個證明可以透過 Birkhoff 的一個定理輕松完成，這讓 Ghrist 頗感意外。
他幽默地承認道:「人類獲勝了……」
來源：AIBASE

4.蘋果 Depth Pro AI 模型掀起 AR 變革：零樣本學習，單張 2D 圖片 0.3 秒內變高畫質 3D
報道稱蘋果 AI 科研團隊釋出了名為 Depth Pro 的全新 AI 模型，不需要傳統相機數據預測，能夠在幾分之一秒內從單張 2D 影像生成詳細的 3D 深度圖。
該論文標題為【Depth Pro: Sharp Monocular Metric Depth in Less Than a Second】，是單目深度估計（Monocular Depth Estimation）領域的一次重大突破，整個過程僅使用一幅影像來推斷深度資訊。
根據論文介紹，該模型由 Aleksei Bochkovskii 和 Vladlen Koltun 團隊領導，聲稱 Depth Pro 是同型別總生成速度最快、最準確的系統之一。
Depth Pro 在傳統 GPU 上可以在 0.3 秒內生成高分辨率深度圖，建立的圖片共有 225 萬像素，具有卓越的解析度，能夠捕捉到頭發和植物等其它方法常常忽略的細節。
Depth Pro 真正與眾不同之處在於它能夠估計相對深度和絕對深度，這一能力被稱為「度量深度」（Metric depth）。
Depth Pro 不需要在特定領域數據集上進行廣泛訓練即可做出準確預測，這一特性被稱為「零樣本學習」，這意味著該模型可以提供真實的測量數據，對增強現實（AR）等套用至關重要。
Depth Pro 目前已經在 Github 平台上開源，並鼓勵開發者在機器人技術、制造業和醫療保健等領域進一步探索 Depth Pro 的潛力。
來源：IT之家