你了解AI嗎？什麽是AI、ANI、AGI、ASI？如果你不清楚，就看這篇

2024-07-24科技

原文連結：https://mp.weixin.qq.com/s/4Mcs9aXuZthgIV5W2imOag

當你能對別人講清楚AI時，才是你真正理解了AI。

這篇講清楚關於人工智慧你需要知道的一切。

什麽是AI人工智慧

人工智慧（AI）是一個不斷發展的概念，它指代的是機器執行那些曾需人類智慧方能完成的任務的能力。自20世紀50年代起，人工智慧便已初現端倪，其定義隨著數十年的研究和技術進步而不斷演進。

如今，人工智慧廣泛套用於自動駕駛汽車、膝上型電腦、聊天機器人（如ChatGPT）以及影像生成器等眾多領域。那麽，它究竟是什麽？又是如何運作的呢？

「人工智慧」這一術語源自一個觀點：若智慧是生物有機體所固有的，那麽在其他領域中的存在則表明它是人造的。電腦科學家艾倫·圖靈是首批探索機器能否像人一樣利用資訊和邏輯進行決策的人之一。他提出了圖靈測試，透過比較機器與人類的能力，來檢驗人們是否能區分機器的智慧是否為人造（例如，令人信服的深度偽造就是人工智慧透過圖靈測試的一個例項）。

基本計算系統之所以能夠執行，得益於程式設計師對其進行的特定任務編碼。然而，人工智慧的實作則依賴於電腦能夠儲存資訊（包括過去的命令），這與人類大腦透過儲存技能和記憶來學習的方式類似。這種能力使人工智慧系統能夠適應新環境、學習新技能，從而完成那些它們並未明確編程要執行的任務。

一些專家將智慧定義為適應、解決問題、規劃、隨機應變以及學習新事物的能力。盡管這些系統尚不能完全取代人類智慧或社互動動，但當今的人工智慧系統已展現出人類智慧的某些特征，包括學習、解決問題、模式辨識、感知，甚至有限的創造力和社會意識。

當然，人類智慧的一個重要組成部份是人工智慧尚未能復制的——即語境理解。例如，谷歌的人工智慧系統缺乏現實世界的邏輯，難以辨識人類的微妙之處，如諷刺和幽默，這從它給出的諸如「在披薩醬中加入膠水以使起司粘住」或「使用汽油使義大利直麵變辣」的建議中可見一斑。雖然這些建議的風險較低，但在錯誤的情況下，缺乏語意理解的人工智慧系統可能會產生嚴重的後果。

如何使用人工智慧

人工智慧具有廣泛的潛在套用，這些套用已深深滲透到我們的日常生活中。在消費者領域，谷歌搜尋的新版本、可穿戴裝置，甚至是吸塵器，都展現了人工智慧的無限可能。壁爐架上那些內建Alexa或谷歌語音助手的智慧喇叭，便是人工智慧套用的生動例證。

ChatGPT、微軟的Copilot和Claude等熱門的AI聊天機器人，不僅能解答問題或執行任務，如解釋概念、撰寫電子信件或計畫大綱，甚至還能創作創意故事。然而，由於AI模型無法準確區分事實和虛構，這些聊天機器人有時會產生誤導性的資訊或編造故事。因此，在使用時，尤其是在參照品質不確定的情況下，務必透過獨立研究來驗證它們的陳述。

在消費產品中，人工智慧的一個核心功能是提供個人化服務，無論是精準投放的廣告還是基於生物辨識的安全系統。例如，當您使用Face ID解鎖手機時，手機之所以能區分您的臉和別人的臉，是因為它參考了數十億其他人的面部數據，並匹配了特定的數據點來辨識您的面部特征。

從更宏觀的角度看，行銷和內容團隊可以利用人工智慧簡化生產流程，而開發人員則能借助它編寫和執行程式碼。此外，人工智慧還極大地提高了醫學研究的速度和效率。

什麽是機器學習

機器學習（ML）是指透過大量數據來訓練演算法以辨識模式，進而輔助預測和決策制定的過程。這種模式的自動搜尋使系統能夠執行那些未明確編程的任務，這也是人工智慧（AI）與其他電腦科學領域的核心區別。盡管許多人將AI與這種能力相聯系，但機器學習實際上是AI的一個子集。

當數據被妥善結構化或組織時，系統能夠更輕松地檢測異常——比如，當信用卡交易來自不常見的地點時。

機器學習的套用例項不勝列舉，其中包括搜尋引擎、影像和語音辨識以及欺詐檢測。以Face ID為例，當使用者將照片上傳到Facebook時，社群網路的影像辨識技術會分析影像、辨識出人臉，並提出建議來標記辨識出的朋友。隨著時間的推移和更多影像數據的積累，該系統將不斷完善這項技能，並變得更加精確。

機器學習如何工作

機器學習通常分為兩大類：監督學習和無監督學習。

監督學習

這種常見的技術用於訓練AI系統，它依賴於註釋數據或人類已標記和分類的數據。機器學習系統隨後會輸入這些數據來學習其中的模式。

假設您希望訓練一個機器學習模型來辨識和區分圓形與正方形的影像。為此，您需要構建一個數據集，其中包含大量圓形影像（如行星、車輪等圓形物體的照片）和正方形影像（如桌子、白板等）。接下來，您需要為每個影像添加標簽，以指明其形狀。

之後，演算法將分析這組帶標簽的影像，學習如何區分不同的形狀及其特征：例如，圓形沒有角，而正方形則有四條等長的邊。一旦訓練完成，系統就能夠辨識出一張新影像中的形狀。

無監督學習

相比之下，無監督學習則允許演算法自行尋找未標記數據中的模式，透過辨識數據間的相似性來進行分類。

這些演算法並不預先設定特定的數據選擇標準；它們僅僅基於數據之間的相似性進行分組——例如，根據客戶的購物行為對他們進行細分，從而開展更具個人化的行銷活動。是不是像淘寶在給你推薦商品？

強化學習

在強化學習中，系統透過輸入數據進行訓練，旨在最大化獎勵，並經過反復試驗和調整，直至達到最佳效能。

以訓練一個系統玩電子遊戲為例，當得分較高時，系統會獲得正獎勵；而得分較低時，則會受到負獎勵的懲罰。系統透過不斷分析遊戲並調整行動策略，僅從收到的獎勵中學習和改進。最終，它能夠獨立地玩遊戲，並在無人幹預的情況下取得高分。

強化學習不僅在遊戲領域有所套用，還廣泛用於科學研究，特別是在教導自主機器人在現實環境中以最優方式行動方面。例如，機器人學習如何在未獲取數據的新環境中導航，比如繞過意外的障礙物，這是人工智慧領域中更高級機器學習技術的一個典型套用。

人工智慧型別

人工智慧可以分為三個子類別別：狹義人工智慧、通用人工智慧和超級人工智慧。

什麽是狹義人工智慧？

狹義人工智慧（ANI）指的是無需明確設計即可構建或訓練，以執行特定任務或解決特定問題的智慧系統。這種型別的人工智慧對於諸如 Siri、Alexa 和 Google Assistant 等語音助手而言至關重要。

ANI 有時被稱為弱人工智慧，因為它不具備全面的通用智慧能力。但這並不削弱其實際效能。除了語音助手，影像辨識系統、響應簡單客戶服務請求的自動化技術以及標記線上不當內容的工具，都是 ANI 的實際套用例子。

ChatGPT 同樣是 ANI 的一個典型套用，它經過編程以執行一項具體任務：基於提供的提示生成文本響應。

什麽是通用人工智慧？

通用人工智慧（AGI）或強人工智慧仍然是一個理論上的概念，因為它設想機器能夠理解和基於積累的經驗自主執行多種截然不同的任務。這種智慧型別更接近人類智力水平，因為AGI系統能夠像人類一樣進行推理和思考。

與人類相似，AGI能夠理解任何智力任務，進行抽象思考，從經驗中學習，並利用這些知識來解決新問題。我們談論的實際上是一個具備常識的系統或機器，這是目前任何現有的人工智慧技術都尚未實作的。

盡管開發具有意識的系統可能仍是一個遙遠的目標，但它卻是人工智慧研究的終極目標。OpenAI暗示即將推出的GPT-5將使我們距離AGI更近一步。

什麽是超級人工智慧？

超級人工智慧（ASI）是一種超越人類智慧，並在所有功能上均超越人類的機器智慧。這樣的系統不僅可能對人類社會產生深遠影響，甚至可能帶來淪陷性後果。盡管這一概念聽起來像是科幻小說中的情節，但確實有其科學依據。

一個能夠自我學習並持續自我完善的智慧系統目前仍是一個理論假設。然而，如果這種系統能夠以道德和負責任的方式得到套用，那麽它有望在醫學、技術等多個領域帶來前所未有的進步和成就。

人工智慧最新例子

人工智慧領域的顯著進步包括但不限於GPT 3.5、GPT-4以及栩栩如生的人工智慧頭像和深度偽造技術。然而，該領域的革命性成就遠不止這些。

以下是一些最引人註目的進展：

ChatGPT（以及GPT系列）

ChatGPT是一款能夠生成和轉譯自然語言、回答問題的AI聊天機器人。在ChatGPT之前，OpenAI透過GPT 1、2和3的釋出，已經引發了人工智慧領域的巨大變革。GPT，即生成式預訓練Transformer，GPT-3在2020年推出時，成為了當時最大的語言模型，擁有1750億個參數。隨後，GPT-3.5為ChatGPT的免費版本提供了支持。而最大的版本GPT-4則擁有一萬億個參數，可以透過ChatGPT、ChatGPT Plus和Microsoft Copilot的免費版本存取。

自動駕駛汽車

自動駕駛汽車的安全性是潛在使用者的主要關註點，但隨著人工智慧的突破，這項技術正在不斷進步。這些車輛利用機器學習演算法，結合來自傳感器和網路攝影機的數據，來感知周圍環境並確定最佳行動方案。特斯拉電動汽車的自動駕駛功能廣為人知，但谷歌母公司Alphabet旗下的Waymo也在加利福尼亞州舊金山和亞利桑那州鳳凰城提供自動駕駛服務，如無人駕駛出租車或Uber Eats外賣配送。Cruise是另一項機器人出租車服務，奧迪、通用和福特等汽車公司也在積極研發自動駕駛汽車技術。

機器人技術

波士頓動力公司在人工智慧和機器人領域的成就尤為突出。盡管我們距離創造終結者級別的人工智慧技術還有很長的路要走，但波士頓動力公司的液壓人形機器人能夠利用人工智慧導航並應對不同地形，已經令人印象深刻。

DeepMind

谷歌子公司DeepMind是AI領域的先驅，專註於通用人工智慧（AGI）的研究。盡管AGI尚未實作，但DeepMind在2016年因建立擊敗世界最佳圍棋選手的AI系統AlphaGo而備受矚目。此後，DeepMind又推出了AlphaFold，這是一個能夠預測蛋白質復雜3D形狀的系統。該公司還開發了可以像頂級醫生一樣有效診斷眼疾的程式。

什麽是大型語言模型

人工智慧的一個重要套用領域體現在大型語言模型（LLM）上。這些模型運用無監督機器學習技術，透過海量文本數據訓練，來深入理解人類語言的運作機制。為了降低成本，科技公司通常會從互聯網上免費抓取這些文本數據，其中包括文章、書籍、網站和論壇內容等。

在訓練過程中，LLM 會處理數十億個單詞和短語，以學習它們之間的模式和關系，從而使模型能夠基於使用者提示生成類似人類的回答。

然而，需要明確的是，這些模型主要是在復制常見的語法模式和詞匯配對，盡管這一過程在復雜的層面上進行——但它們的思維方式與人類截然不同，因為它們並不具備理解事實、邏輯或常識的能力。

OpenAI 近期釋出的GPT-4在Chatbot Arena排行榜上表現出色。該公司的GPT-4 Turbo被認為是目前最先進的LLM之一，而GPT-4作為最大的LLM，據稱擁有1.78萬億個參數。ChatGPT可以基於GPT-3.5和GPT-4執行。此外，谷歌開發的同名LLM——Gemini，盡管其參數數量尚未公開，但據估計可能高達175萬億個。

什麽是神經網路

機器學習的成功在很大程度上依賴於神經網路。這些數學模型的結構和功能受到人類大腦中神經元相互連線和訊號傳遞方式的啟發。

想象一下，一群機器人協同工作，共同解決一個復雜的難題。每個機器人都擁有特定的能力，如辨識拼圖碎片中的不同形狀或顏色。神經網路就如同這樣的一群機器人，它們將各自的能力結合起來，共同攻克難題。

神經網路具備調整內部參數以改變輸出的能力。在訓練過程中，神經網路會接觸到大量的數據，學習如何在給定特定輸入時產生預期的輸出。

這些網路由多個相互連線的演算法層組成，層與層之間傳遞數據。透過調整數據在層間傳遞時的權重，我們可以訓練神經網路執行特定的任務。在訓練過程中，這些權重會不斷更新，直至神經網路的輸出與所需結果高度吻合。

一旦神經網路達到這一狀態，它便「學會」了如何執行特定任務。這些任務的範圍廣泛，從辨識影像中的水果型別，到根據傳感器數據預測電梯的故障時間等。

什麽是深度學習

深度學習，作為機器學習的重要分支，專註於訓練具備三層或更多層次的人工神經網路，以執行多樣化的任務。這些神經網路被擴充套件為深邃龐大的網路結構，透過大量數據進行精細訓練。

深度學習模型通常包含至少三層，有時甚至高達數百層。在訓練過程中，它可以靈活采用監督學習、無監督學習或兩者的結合。

由於其卓越的能力，深度學習技術被廣泛套用於自然語言處理（NLP）、語音辨識和影像辨識等領域，用於捕捉數據中的復雜模式，進而推動人工智慧的進一步發展。

對話式人工智慧

對話式人工智慧是指經過編程，能夠與使用者進行自然對話的系統。該系統經過訓練後，能夠聆聽使用者的輸入（對話內容），並據此作出相應的響應（輸出）。這種智慧對話的實作，主要依賴於自然語言處理（NLP）技術，以確保系統能夠自然地理解和回應使用者的語言。

對話式人工智慧的例項廣泛，包括像Gemini這樣的聊天機器人、搭載語音助手的智慧喇叭如Amazon Alexa，以及iPhone的虛擬助手如Siri等。

有哪些 AI 服務可用

消費者和企業都能利用豐富的人工智慧服務，不僅加速任務處理，還為日常生活和工作帶來便利——您家中可能已擁有一些人工智慧裝置。

以下是公眾可使用的一些常見人工智慧範例，涵蓋免費和收費服務：

語音助手：

如Echo裝置上的Amazon Alexa、iPhone上的Apple Siri以及Pixel裝置上的Google Assistant，它們運用自然語言處理技術來理解和響應您的提問或指令。

聊天機器人：

ChatGPT、Copilot和Perplexity等人工智慧聊天機器人作為虛擬助手，能夠與人互動，進行類人對話，甚至在某些情境下展現出同情和關心。

語言轉譯：

Google Translate、Microsoft Translator、Amazon Translate和ChatGPT等服務透過機器學習技術，為使用者提供文本轉譯服務。

生產力工具：

Microsoft Copilot for Microsoft 365是一個顯著例子，其中LLM作為AI生產力工具嵌入Word、PowerPoint、Outlook、Excel、Teams等套用中，能夠自動執行任務。例如，只需輸入「請透過電子信件向團隊通報計畫的最新狀態」，Copilot便會自動收集相關資訊，生成符合您需求的信件文本。

影像和視訊辨識：

不同程式利用人工智慧辨識影像和視訊中的內容，如面部、文本和物件。Clarifai使用機器學習技術來組織非結構化數據，而亞馬遜的Rekognition AWS服務則允許使用者上傳影像以獲取相關資訊。

軟體開發：

ChatGPT等AI工具已幫助開發人員編寫和偵錯程式碼一年多時間。此外，OpenAI Codex的AI配對程式設計師GitHub Copilot也是一例，它透過即時自動完成註釋和程式碼，幫助程式設計師更快、更輕松地編寫程式碼。

企業AI工具：

許多公司如OpenAI和Amazon正致力於為企業建立AI工具，如OpenAI的GPT-4 API和Amazon Bedrock（一套面向開發人員的基於雲的AI工具）。

誰在引領人工智慧

隨著生成式人工智慧的崛起，多家公司紛紛在這一領域展開激烈競爭，其中既有老牌科技巨頭，也不乏新興初創企業。盡管各家公司的發展勢頭迅猛，難以確立固定的行業領導者，但以下是一些主要參與者。

OpenAI：

OpenAI 在免費提供其強大的生成式AI工具（如ChatGPT和AI影像生成器Dall-E 3）後，對AI領域產生了巨大影響。

Anthropic：

Anthropic打造了Claude，這一強大的AI系統被視為OpenAI的主要競爭對手。該公司專註於人工智慧研究中的安全與道德問題。

Alphabet（谷歌母公司）：

Alphabet透過旗下DeepMind、Waymo和谷歌等公司涉足不同領域的人工智慧系統。谷歌在AI聊天機器人領域起步雖艱難，但其工具Google Bard經過兩次技術叠代（從LaMDA到PaLM 2，再到Gemini），目前表現已大為改觀。同時，DeepMind繼續追求AGI（通用人工智慧），為Document AI開發了機器學習模型，最佳化了YouTube觀看體驗，並推出了AlphaFold等創新產品。盡管Alphabet在人工智慧方面的努力可能不常出現在新聞頭條，但其深度學習和AI領域的進展無疑將對人類未來產生深遠影響。

微軟：

除了推出Microsoft Copilot外，微軟還在Azure上為開發人員提供了一系列AI工具，包括機器學習、數據分析、對話式AI等平台，以及電腦視覺、語音和語言方面的客製API。此外，微軟對OpenAI進行了巨額投資，並在Copilot（原名Bing chat）和Dall-E 3的高級版本中運用了GPT-4技術，支持Microsoft Designer的影像生成功能。

蘋果：

蘋果最近也加入了這場競賽，推出了AI升級的iPad系列，並有望在WWDC上釋出更多新產品。

其他公司：

在人工智慧領域取得顯著進展的公司還包括百度、阿裏巴巴、Cruise、聯想、特斯拉等。

人工智慧改變世界

人工智慧的套用速度和規模將深刻影響我們的工作、購物、媒體消費方式，以及私密、健康等多個方面。與歷史上的許多變革一樣，人工智慧帶來的好處、挑戰和潛在風險都是錯綜復雜的。

技術的不斷進步正重塑著工作的本質。人工智慧透過自動化某些任務，正在改變各行各業的日常工作流程，創造新的職位，同時使一些傳統角色逐漸過時。例如，在創意領域，生成式人工智慧已經大幅降低了行銷和視訊內容的制作成本、時間和人力需求。

在醫療保健系統和醫學研究中，人工智慧的作用日益凸顯。它有助於提高醫療服務的可延伸性和可及性，使得醫生和放射科醫生能夠以更少的資源診斷癌癥，發現與疾病相關的基因序列，並辨識出能生產更有效藥物的分子，從而可能挽救無數生命。

然而，這項技術也帶來了新的挑戰，即如何保護我們數據的私密，甚至包括我們的想法。人工智慧使得面部辨識和監控變得普遍，這引發了許多專家對徹底禁止此類技術的呼籲。在加劇私密和安全擔憂的同時，人工智慧也推動了網路安全軟體領域的顯著進步。

隨著模型（及其背後的公司）實力的增強，使用者要求提高模型建立方式和成本的透明度。公司從互聯網上抓取影像和文本來訓練模型的做法，已經引發了一場關於創意材料授權的激烈法律討論，這場討論仍在進行中。

神經網路具有在未經授權的情況下逼真地復制某人的聲音或肖像的能力，這使得深度偽造和錯誤資訊成為當前人們關註的焦點，特別是在即將到來的選舉中。

由於人工智慧使得大規模自動化變得輕而易舉，研究人員和技術人員對其在武器制造和戰爭中的潛在套用表示擔憂。

人會失業嗎

人工智慧系統在不久的將來取代大量現代勞動力的可能性是可信的。

盡管人工智慧不會完全取代所有工作，但可以確定的是，它將深刻改變工作的性質。關鍵在於自動化將如何迅速且顯著地重塑職場環境。

然而，人工智慧無法獨立運作。雖然許多涉及常規、重復性數據的工作可能會實作自動化，但其他領域的工作者可以利用生成式人工智慧等工具來提高生產力和效率。

關於人工智慧系統將以多快的速度超越人類的能力，專家們的看法存在廣泛差異。