智東西(公眾號:zhidxcom)
作者 | 香草
編輯 | 李水青
智東西3月27日報道,今日,國內「AI+制造」解決方案供應商創新奇智宣布其「奇智孔明AInnoGC」工業大模型產品矩陣升級。
創新奇智CTO張發恩釋出了升級後的工業大模型AInno-75B,以及三款全新ChatX系列生成式AI套用:包括生成式企業私域視覺洞察套用ChatVision、生成式輔助工業設計套用ChatCAD、基於非侵入式腦機介面的工業機器人任務編排套用ChatRobot Pro。
▲奇智孔明工業大模型升級釋出
此次釋出是創新奇智工業大模型矩陣時隔半年以來的重要升級。
創新奇智於去年9月釋出了自研工業大模型AInno-15B,基於該模型的大模型服務引擎,以及三款生成式AI套用產品:ChatRobot、企業私域數據分析套用ChatBI、企業私域知識問答套用ChatDoc。本次釋出,大模型服務引擎和ChatX系列套用也基於750億參數的模型進行了升級。
現場,創新奇智副總裁郭江亮、創新奇智高級技術總監溫哲立、創新奇智高級研究員高達輝分別演示了ChatVision、ChatCAD和ChatRobot Pro,其中,腦機介面「意念取物」的演示令人印象深刻。
▲工作人員在現場透過外接式腦機介面「意念」操作機器人
一、750億參數、多模態輸入輸出,ChatX系列產品全線升級
張發恩首先釋出了750億參數的工業大模型AInno-75B,相比半年前釋出的Ainno-15B,參數提升至5倍,模型效能也相對升級。
AInno-75B還新增了多模態處理能力,支持輸入文本、影像、視訊、EEG(腦電波)以及工業場景中的特定模態,如CAD(電腦輔助設計)等。
輸出方面,AInno-75B支持輸出文本、影像、視訊、CAD,以及工業領域特色的Action(行為)模態。
▲工業大模型AInno-75B技術特色
在能力指標方面,AInnoGC工業大模型已獲得中國信通院可信AI工業評測的最高等級4+級,也是截至今天唯一透過該等級評測的工業大模型。
在去年12月麻省理工科技評論釋出的15個「中國AI大模型先進套用案例」中,AInnoGC榜上有名。SuperCLUE工業大模型第一名。
3月21日,中文語言理解測評基準SuperCLUEC釋出第一個中文原生的工業大模型測評基準SC-Industry,奇智孔明AInno-15B僅次於GPT-4 Turbo和GPT-4,在國內工業領域大模型中位列第一。
▲奇智孔明工業大模型獲得成就
基於AInno-75B,創新奇智ChatX系列產品也進行了重要升級。
生成式企業私域知識問答套用ChatDoc針對性最佳化了知識構建、問答、溯源和推薦能力,整體問答效果提升28.8%;生成式企業私域數據分析套用ChatBI新增支持Excel、CSV等數據格式,生成SQL語句和分析報告的準確率提升15%。
▲創新奇智工業大模型產品矩陣升級
大模型服務引擎Engine則新增支持互動式生成Agent套用,其RAG(檢索增強生成)能力引擎也增加內建針對性最佳化策略,模型服務新增內建大模型推理加速引擎。
二、三大ChatX新品釋出,針對視覺、CAD和「意念控制」
會上,張發恩還釋出了三款新的ChatX系列產品,分別是生成式企業私域視覺洞察套用ChatVision、生成式輔助工業設計套用ChatCAD,以及基於非侵入式腦機介面的工業機器人任務編排套用ChatRobot Pro。
1、生成式企業私域視覺洞察套用ChatVision
據介紹,ChatVision以自然語言互動形式,對視訊/圖片進行互動式智慧分析,並且基於Agent能力自主進行任務規劃和技能編排。
▲生成式企業私域視覺洞察套用ChatVision
創新奇智副總裁郭江亮現場演示了ChatVision的場景洞察能力,其能夠進行即時視訊流分析、理解使用者的復雜任務指令,也能離線進行視訊長檔分析。
▲ChatVision能力及工作流程
首先,兩位工作人員在現場扮演工人的角色,透過網路攝影機拍攝即時視訊流輸入ChatVision後,郭江亮透過語音輸入指令「觀察當前畫面,告訴我這可能是什麽地方」。隨後,ChatVision迅速給出答案,透過分析場景中的人物和穿著,判斷這可能是一個建築工地、車間或倉庫。
▲ChatVision判斷畫面是什麽場景
隨後郭江亮追問,讓ChatVision找出畫面中的電源插座和白色安全帽,它也很快就完成並進行了即時跟蹤。
▲ChatVision辨識出白色安全帽並即時跟蹤
郭江亮又提出分析畫面中有什麽潛在的危險行為並行送給管理員,ChatVision在畫面中標出了玩手機等3項違規操作,並截圖發送了警告信件。
▲ChatVision辨識危險行為
除了線上分析視訊流,ChatVision也能離線分析視訊長檔。郭江亮上傳了一個車間實拍視訊,並詢問ChatVision這是什麽場景,很快就得到了正確的回答。
▲ChatVision離線辨識視訊流
隨後郭江亮輸入指令「辨識是否有人吃飯」,ChatVision透過分析,指出在視訊0-15秒有工人在車間吃飯的行為,還詳細描述了「用筷子」「喝湯」等具體動作。
▲ChatVision辨識吃飯行為
最後,郭江亮輸入「結束」回到視訊流模式,並將網路攝影機轉向現場的觀眾,讓ChatVision辨識出正在微笑的人,ChatVision很快在畫面中畫出一個個紅框圈出目標。
▲ChatVision辨識現場微笑的人
2、生成式輔助工業設計套用ChatCAD
接觸過工業制造的讀者應該知道,CAD幾乎是整個工業的基礎。面向CAD設計場景,創新奇智結束ChatCAD,支持以語言互動的方式生成機械、電氣設計,變革了設計方式並提升設計效率。
▲生成式輔助工業設計套用ChatCAD
創新奇智高級技術總監溫哲立現場演示了ChatCAD,透過簡單的自然語言輸入就能得到復雜的工業設計模型,還能進一步提出提出修改要求,生成模型相容多種主流CAD格式。
▲ChatCAD功能和流程
ChatCAD界面基於AI原生原理打造,沒有復雜的選單,其左邊是設計區,右邊是對話區。
溫哲立首先讓ChatCAD生成一個工業滑輪,給出了具體的參數。不出一分鐘ChatCAD就生成了相應的模型。
▲ChatCAD生成工業滑輪
隨後溫哲立接連提出兩個要求,讓ChatCAD修改滑輪中心軸半徑、邊緣凸出部份長度,很快便得到了滿足要求的生成結果。
▲ChatCAD根據追加要求修改模型
溫哲立又讓ChatCAD設計了一個直流電機,並再次提出2個追加要求,ChatCAD均正確生成。
▲ChatCAD設計直流電機
第三個演示中,溫哲立提出了一個極為復雜的需求,要求ChatCAD生成一個渦輪機,對其扇葉數量、渦輪軸直徑、旋轉軸軸帽長度等多項參數都進行了具體數據要求。
▲ChatCAD生成渦輪機
在此基礎上溫哲立又要求ChatCAD將扇葉改為8個,修改引擎罩長度等。
▲ChatCAD將扇葉改為8個
最後溫哲立選擇STEP格式下載了該模型,它可以在相應CAD軟體中完美相容。
▲在CAD軟體中開啟生成的模型
3、工業機器人任務編排套用ChatRobot Pro
ChatRobot Pro在ChatRobot的基礎上,采用非侵入式腦電采集,對人腦電波進行解碼,實作透過意念控制機器人完成多樣化任務。
▲工業機器人任務編排套用ChatRobot Pro
創新奇智高級研究員高達輝演示了ChatRobot Pro,由一位現場工作人員連線外接腦機介面裝置,抓取目標商品並由機器人完成任務設定。
▲ChatRobot Pro功能和工作流程
在ChatRobot Pro工作界面中,左邊顯示腦電訊號即時狀態,右邊是互動頁面。
▲ChatRobot Pro互動界面
據介紹,該任務的主要難點在於非侵入式腦機介面反映的是整體腦電波,無法直接反映局部意念,大模型需要從中解碼使用者的具體意圖。
首先,工作人員透過大腦「意念」控制光標移動,選擇了一種飲料,系統將命令下發給機器人。
▲工作人員「意念」選擇飲料
得到指令後,ChatRobot Pro自動完成了任務解析和步驟編排,並驅動機器人前往貨架選擇飲料。
▲機器人拿取飲料
隨後,機器人在ChatRobot Pro的控制下,透過視覺解析找到目標位置,前往高達輝面前,將飲料交到他手裏。
▲機器人將飲料交給高達輝
完成任務後,高達輝向ChatRobot Pro輸入「讓機器人歸位」的指令,ChatRobot Pro便規劃了任務規劃並驅動機器人回到初始位置。
▲ChatRobot Pro規劃機器人行動
結語:響應「人工智慧+」行動,創新奇智推動AI解放制造業
就在昨天,工信部在國新辦新聞釋出會上提到,加快推動以大模型為代表的AI賦能制造業發展。今年將開展「人工智慧+」行動,促進AI與實體經濟深度融合,推動AI賦能新型工業化。
創新奇智堅持深耕「AI+制造」領域,著眼於AI解放制造業,其工業大模型產品矩陣的行業價值正在逐步展現,為企業實作數位化轉型提供了有力支撐。可以預見到,此次釋出的模型升級與三款新產品,將在工業領域產生更多創新場景,為制造行業提供豐富的生成式AI解決方案。