當前位置: 華文世界 > 科技

「意念」控制機器人!創新奇智新模型AInno-75B放大招,能看影片能畫CAD,還外接腦機介面

2024-03-27科技

智東西(公眾號:zhidxcom)
作者 | 香草
編輯 | 李水青

智東西3月27日報道,今日,國內「AI+制造」解決方案供應商創新奇智宣布其「奇智孔明AInnoGC」工業大模型產品矩陣升級。

創新奇智CTO張發恩釋出了升級後的工業大模型AInno-75B,以及三款全新ChatX系列生成式AI套用:包括生成式企業私域視覺洞察套用ChatVision、生成式輔助工業設計套用ChatCAD、基於非侵入式腦機介面的工業機器人任務編排套用ChatRobot Pro。

▲奇智孔明工業大模型升級釋出

此次釋出是創新奇智工業大模型矩陣時隔半年以來的重要升級。

創新奇智於去年9月釋出了自研工業大模型AInno-15B,基於該模型的大模型服務引擎,以及三款生成式AI套用產品:ChatRobot、企業私域數據分析套用ChatBI、企業私域知識問答套用ChatDoc。本次釋出,大模型服務引擎和ChatX系列套用也基於750億參數的模型進行了升級。

現場,創新奇智副總裁郭江亮、創新奇智高級技術總監溫哲立、創新奇智高級研究員高達輝分別演示了ChatVision、ChatCAD和ChatRobot Pro,其中,腦機介面「意念取物」的演示令人印象深刻。

▲工作人員在現場透過外接式腦機介面「意念」操作機器人

一、750億參數、多模態輸入輸出,ChatX系列產品全線升級

張發恩首先釋出了750億參數的工業大模型AInno-75B,相比半年前釋出的Ainno-15B,參數提升至5倍,模型效能也相對升級。

AInno-75B還新增了多模態處理能力,支持輸入文本、影像、影片、EEG(腦電波)以及工業場景中的特定模態,如CAD(電腦輔助設計)等。

輸出方面,AInno-75B支持輸出文本、影像、影片、CAD,以及工業領域特色的Action(行為)模態。

▲工業大模型AInno-75B技術特色

在能力指標方面,AInnoGC工業大模型已獲得中國信通院可信AI工業評測的最高等級4+級,也是截至今天唯一透過該等級評測的工業大模型。

在去年12月麻省理工科技評論釋出的15個「中國AI大模型先進套用案例」中,AInnoGC榜上有名。SuperCLUE工業大模型第一名。

3月21日,中文語言理解測評基準SuperCLUEC釋出首個中文原生的工業大模型測評基準SC-Industry,奇智孔明AInno-15B僅次於GPT-4 Turbo和GPT-4,在國內工業領域大模型中位列第一。

▲奇智孔明工業大模型獲得成就

基於AInno-75B,創新奇智ChatX系列產品也進行了重要升級。

生成式企業私域知識問答套用ChatDoc針對性最佳化了知識構建、問答、溯源和推薦能力,整體問答效果提升28.8%;生成式企業私域數據分析套用ChatBI新增支持Excel、CSV等數據格式,生成SQL語句和分析報告的準確率提升15%。

▲創新奇智工業大模型產品矩陣升級

大模型服務引擎Engine則新增支持互動式生成Agent套用,其RAG(檢索增強生成)能力引擎也增加內建針對性最佳化策略,模型服務新增內建大模型推理加速引擎。

二、三大ChatX新品釋出,針對視覺、CAD和「意念控制」

會上,張發恩還釋出了三款新的ChatX系列產品,分別是生成式企業私域視覺洞察套用ChatVision、生成式輔助工業設計套用ChatCAD,以及基於非侵入式腦機介面的工業機器人任務編排套用ChatRobot Pro。

1、生成式企業私域視覺洞察套用ChatVision

據介紹,ChatVision以自然語言互動形式,對影片/圖片進行互動式智能分析,並且基於Agent能力自主進行任務規劃和技能編排。

▲生成式企業私域視覺洞察套用ChatVision

創新奇智副總裁郭江亮現場演示了ChatVision的場景洞察能力,其能夠進行即時影片流分析、理解使用者的復雜任務指令,也能離線進行影片長檔分析。

▲ChatVision能力及工作流程

首先,兩位工作人員在現場扮演工人的角色,透過網絡攝影機拍攝即時影片流輸入ChatVision後,郭江亮透過語音輸入指令「觀察當前畫面,告訴我這可能是什麽地方」。隨後,ChatVision迅速給出答案,透過分析場景中的人物和穿著,判斷這可能是一個建築工地、車間或倉庫。

▲ChatVision判斷畫面是什麽場景

隨後郭江亮追問,讓ChatVision找出畫面中的電源插座和白色安全帽,它也很快就完成並進行了即時跟蹤。

▲ChatVision辨識出白色安全帽並即時跟蹤

郭江亮又提出分析畫面中有什麽潛在的危險行為並行送給管理員,ChatVision在畫面中標出了玩手機等3項違規操作,並截圖發送了警告郵件。

▲ChatVision辨識危險行為

除了線上分析影片流,ChatVision也能離線分析影片長檔。郭江亮上傳了一個車間實拍影片,並詢問ChatVision這是什麽場景,很快就得到了正確的回答。

▲ChatVision離線辨識影片流

隨後郭江亮輸入指令「辨識是否有人吃飯」,ChatVision透過分析,指出在影片0-15秒有工人在車間吃飯的行為,還詳細描述了「用筷子」「喝湯」等具體動作。

▲ChatVision辨識吃飯行為

最後,郭江亮輸入「結束」回到影片流模式,並將網絡攝影機轉向現場的觀眾,讓ChatVision辨識出正在微笑的人,ChatVision很快在畫面中畫出一個個紅框圈出目標。

▲ChatVision辨識現場微笑的人

2、生成式輔助工業設計套用ChatCAD

接觸過工業制造的讀者應該知道,CAD幾乎是整個工業的基礎。面向CAD設計場景,創新奇智結束ChatCAD,支持以語言互動的方式生成機械、電氣設計,變革了設計方式並提升設計效率。

▲生成式輔助工業設計套用ChatCAD

創新奇智高級技術總監溫哲立現場演示了ChatCAD,透過簡單的自然語言輸入就能得到復雜的工業設計模型,還能進一步提出提出修改要求,生成模型相容多種主流CAD格式。

▲ChatCAD功能和流程

ChatCAD界面基於AI原生原理打造,沒有復雜的選單,其左邊是設計區,右邊是對話區。

溫哲立首先讓ChatCAD生成一個工業滑輪,給出了具體的參數。不出一分鐘ChatCAD就生成了相應的模型。

▲ChatCAD生成工業滑輪

隨後溫哲立接連提出兩個要求,讓ChatCAD修改滑輪中心軸半徑、邊緣凸出部份長度,很快便得到了滿足要求的生成結果。

▲ChatCAD根據追加要求修改模型

溫哲立又讓ChatCAD設計了一個直流電機,並再次提出2個追加要求,ChatCAD均正確生成。

▲ChatCAD設計直流電機

第三個演示中,溫哲立提出了一個極為復雜的需求,要求ChatCAD生成一個渦輪機,對其扇葉數量、渦輪軸直徑、旋轉軸軸帽長度等多項參數都進行了具體數據要求。

▲ChatCAD生成渦輪機

在此基礎上溫哲立又要求ChatCAD將扇葉改為8個,修改引擎罩長度等。

▲ChatCAD將扇葉改為8個

最後溫哲立選擇STEP格式下載了該模型,它可以在相應CAD軟件中完美相容。

▲在CAD軟件中開啟生成的模型

3、工業機器人任務編排套用ChatRobot Pro

ChatRobot Pro在ChatRobot的基礎上,采用非侵入式腦電采集,對人腦電波進行解碼,實作透過意念控制機器人完成多樣化任務。

▲工業機器人任務編排套用ChatRobot Pro

創新奇智高級研究員高達輝演示了ChatRobot Pro,由一位現場工作人員連線外接腦機介面裝置,抓取目標商品並由機器人完成任務設定。

▲ChatRobot Pro功能和工作流程

在ChatRobot Pro工作界面中,左邊顯示腦電訊號即時狀態,右邊是互動頁面。

▲ChatRobot Pro互動界面

據介紹,該任務的主要難點在於非侵入式腦機介面反映的是整體腦電波,無法直接反映局部意念,大模型需要從中解碼使用者的具體意圖。

首先,工作人員透過大腦「意念」控制光標移動,選擇了一種飲料,系統將命令下發給機器人。

▲工作人員「意念」選擇飲料

得到指令後,ChatRobot Pro自動完成了任務解析和步驟編排,並驅動機器人前往貨架選擇飲料。

▲機器人拿取飲料

隨後,機器人在ChatRobot Pro的控制下,透過視覺解析找到目標位置,前往高達輝面前,將飲料交到他手裏。

▲機器人將飲料交給高達輝

完成任務後,高達輝向ChatRobot Pro輸入「讓機器人歸位」的指令,ChatRobot Pro便規劃了任務規劃並驅動機器人回到初始位置。

▲ChatRobot Pro規劃機器人行動

結語:響應「人工智能+」行動,創新奇智推動AI解放制造業

就在昨天,工信部在國新辦新聞釋出會上提到,加快推動以大模型為代表的AI賦能制造業發展。今年將開展「人工智能+」行動,促進AI與實體經濟深度融合,推動AI賦能新型工業化。

創新奇智堅持深耕「AI+制造」領域,著眼於AI解放制造業,其工業大模型產品矩陣的行業價值正在逐步展現,為企業實作數碼化轉型提供了有力支撐。可以預見到,此次釋出的模型升級與三款新產品,將在工業領域產生更多創新場景,為制造行業提供豐富的生成式AI解決方案。