大模型套用7項第一!10月24日,第七屆世界聲博會暨2024科大訊飛全球1024開發者節開幕式上,科大訊飛董事長劉慶峰公布訊飛星火大模型套用成績單,並釋出訊飛星火4.0 Turbo:七大核心能力全面超過GPT-4 Turbo,數學和程式碼能力超越GPT-4o,國內外中英文14項主流測試集中訊飛星火4.0 Turbo實作9項第一。與此同時,國產超大規模智算平台「飛星二號」正式啟動。
會上,科大訊飛正選10項基於訊飛星火底座能力的硬核產品與創新套用:定義多模AIUI標準,釋出超擬人數碼人;釋出星火多語言大模型、訊飛星火醫學影像大模型、汽車端側星火大模型;釋出首個基於「問題鏈」的高中數學智能教師系統、星火智慧黑板2.0、AI作業過濾器等;釋出星火智辦一體機、智能座艙人機互動效果評測機器人VIAS以及科大訊飛多語種 AI 轉譯透明屏。
訊飛星火4.0 Turbo:國際14項主流測試集9項超越,提效50%
訊飛星火大模型4.0 Turbo正式釋出,在數學能力、程式碼能力上超過了GPT-4o。由艾倫人工智能研究所、OpenAI等國內外權威單位釋出,涵蓋理解和推理、綜合考試、數學和科學、程式碼等不同任務類別的14項主流測試集中,訊飛星火4.0-Turbo在其中9項測試集中實作超越,效率相對提升50%。
劉慶峰特別提到「硬碰硬」的數學能力和程式碼能力。
根據實用數學任務構建測試集CAppliedMath-1.0,訊飛星火4.0 Turbo在計算、財務、金融、度量等多個維度的任務中均超過GPT-4o水平,已完成超長思維鏈、樹搜尋和自我反思評價等演算法驗證,預計今年底可實作類「o1」的高難度數學能力顯著提升。
根據程式碼生成HumanEval測試集上的效果對比,訊飛星火4.0 Turbo在Python、Java、JavaScript等任務上和GPT-4o的差距微弱,在C++能力上超過GPT-4o。在真實套用場景,基於認知智能全國重點實驗室構建的iFLYCode-Eval-2.0程式碼實用場景測試集,訊飛星火4.0 Turbo在程式碼生成、程式碼檢錯、單元測試等任務上都超過了GPT-4o。同時推出星火程式碼7B版本,滿足程式碼生成、程式碼補全等極速響應型任務,效果業界最優。
正選語音視覺虛擬人互動「三合一」
釋出會上,科大訊飛重新定義萬物智聯時代的多模AIUI互動標準,在原有的遠場高噪、全雙工、多語種多方言能力上,升級了多模態能力,新增了超擬人和個人化能力。
超擬人數碼人首次亮相,多模態的互動從超擬人的語音變成超擬人的數碼人,實作語音、影片、圖文的全部聯動的多模態互動。科大訊飛研究院院長劉聰現場和超擬人數碼人玩了個「角色扮演」遊戲,無論是扮演孫悟空還是小豬佩吉,數碼人反應都惟妙惟肖。
多模態視覺能力加持下的人機互動有多驚喜?劉聰現場給超擬人數碼人打了個「影片電話」,他不斷調整道具「孫悟空」「柯曼」「怪獸」的擺放位置,無需拍照,超擬人數碼人看圖說話,馬上回應:「柯曼和孫悟空停止了打鬥,正在聯合對抗怪獸 」,和劉聰暢聊不同角度的所見。
劉聰還演示了更實用的旅遊購物場景,當網絡攝影機轉向印有外文的化妝品及酒類產品時,超擬人數碼人能對畫面中產品的品牌、功能等資訊進行「秒回」,超擬人數碼人已成為「跨語言」購物的好幫手。
「目前,訊飛星火支持使用者建立自己的個人化數碼人,打造每個人的數碼分身。」劉聰現場演示了一個自己的「數碼分身」,只需在後台進行簡單的編輯、定義,就可快速生成自己的卡通形象,更能一句話復刻自己的聲音作為發音人,隨時隨地與自己對話。目前,已支持1300+種人設打造。
硬件產品端,內嵌了星火多模AIUI能力的訊飛AI學習機閱讀夥伴即將上線,孩子們「指哪讀哪」,書中的故事可以馬上「擬人化」啟發孩子思考和提問。
釋出會現場,超擬人數碼人能力正式開通內測,向現場來賓開通體驗許可權。
正選星火多語言大模型,為世界提供第二種選擇
在語音辨識領域,科大訊飛的遠場高噪場景語音辨識領先優勢進一步擴大。
在多語言能力上,首次實作全國地級市方言全覆蓋,含全國288個地市、202種方言,訊飛輸入法14.0即將支持202種方言免切換自由說。
在多語種能力上,首次釋出星火多語言大模型,除中英文外,可支持俄、日、阿、法等8個語種。根據實用任務場景構建測試集MMT-Eval-1.0,訊飛星火在汽車、家電、辦公、轉譯等行業的任務場景套用效果超過了GPT-4o。
「訊飛作為中國唯一的認知智能全國重點實驗室承建單位,我們有使命有責任要做多語言大模型」,劉慶峰表示,訊飛星火底座能力要不斷提升,對標全球最好水平,同時還要針對真實套用場景做到全球最好,不斷擴大多語種範圍,「我們一定要代表中國給世界第二種選擇。」
多模態多語言能力升級,將全面賦能汽車產業。科大訊飛還正選了汽車端側星火大模型,據悉,今年第四季度起,奇瑞、廣汽、長城等多款搭載端側大模型的車型將上市開售。
大模型賦能民生剛需:釋出教育、醫療、司法、政務等領域AI助手
「用人工智能技術解決社會剛需」,是科大訊飛一直以來的出發點之一。此次1024科大訊飛全球開發者節上,科大訊飛面向教育、醫療、司法、政務服務、企業辦公等多個行業場景釋出了最新的產品套用。
在教育行業,首次釋出基於「問題鏈」的高中數學智能教師系統。
今年1月份,中國教育科學研究院與科大訊飛、華為開展深度合作,在訊飛星火教育大模型的基礎上開展「基於生成式人工智能的中小學智能教師示範研究」。此次釋出的高中數學智能教師系統,是眾多高中數學學科優秀教師集體智慧和AI大模型的機器智能雙向賦能,實作「人機共育」。它可以智能生成教學問題鏈,以循序漸進的方式輔助教師啟發學生思考並逐步解決問題,同時基於精準學情定位學生薄弱點、融合最近發展區規劃路徑、鼓勵學生基於真實世界的主動提問、探究式學習,幫助學生實作知識、到能力、再到素養的綜合培養。該高中數學智能教師系統是中國教科院牽頭、北京、上海、重慶、深圳、合肥、成都、大連、廣州、哈爾濱等12個區域50多位數學教研員、400多位優秀教師與訊飛星火大模型人機共創的智慧成果。
搭載了高中數學智能教師系統的星火智慧黑板2.0也將於10月25日在第84屆教育裝備展上正式釋出,從AI均衡視聽更公平、AI教學工具更高效、AI教師助手更智慧、全國產化算力更安全等四個方面推動黑板從板書工具躍遷為教學AI助手。
此外,訊飛AI學習機中正選AI作業過濾器。學習機透過OCR能力辨識出紙質練習題,根據學生歷史學習情況和本地化考情,將題目分出「必做題」「選做題」「建議不做題」三個等級,實作「練得更少、學得更好」的目標。
在醫療行業,釋出訊飛星火醫療大模型2.0,醫療海量知識問答、醫療復雜語言理解、醫療專業文書生成、醫療診斷治療推薦、醫療多輪互動、醫療多模態互動等六大醫療核心場景能力重大升級並持續領先。
基於訊飛星火醫學影像大模型打造的智能醫學影像助手也正式釋出,在智能質控環節,可幫助影像技師快速評估影像質素,及時糾正檢查問題;在智能診斷環節,可幫助影像醫師快速生成診斷報告,解釋溯源並多期對比;在智能讀片環節,可接入醫學影像大模型,透過相關問答,幫助臨床醫師制定診療方案。
會上,訊飛醫療還聯合安徽省衛生健康委員會、認知智能全國重點實驗室,共同釋出全譜系全模態醫學影像大模型開放合作計劃,旨在匯聚全球最頂尖的影像AI科研團隊,共同推進醫學影像大模型的發展。
在司法領域,星火法律大模型賦能庭審筆錄制作、裁判文書編寫、法條類案檢索等司法場景,和星火通用大模型相比,效率提升從61.7%提升到87.9%。
在政務服務場景,政務大模型持續叠代,全面覆蓋4500多種標準化事項和60多種材料,老百姓和政務大模型「聊天」就能實作邊聊邊確認辦事意圖,稽核時間縮短80%,登記效率提升5倍。此外,釋出會上正選了搭載政務大模型的「星火智辦一體機」,方便群眾從「問著辦」到「領著辦」。
AI賦能企業:訊飛星火正成為央國企的第一選擇
「訊飛星火已成為央國企大模型的第一選擇。」劉慶峰曬出了大模型套用成績單:央國企中標第一、教育醫療市場第一、智能汽車市場第一、大模型開發者生態第一、智能硬件市場第一、賦能科研套用第一、賦能工業套用第一。
截至2024年10月,科大訊飛已與各頭部企業共建20多個行業大模型,覆蓋300+套用場景,所覆蓋行業和場景數都是第一。
為了幫助各行各業更好地落地大模型,科大訊飛構建了從「建算力、理數據、訓模型,到落場景、保安全、精營運」的全套解決方案。「科大訊飛有領先的工具鏈,可大幅提升‘理數據、訓模型’的效率;有覆蓋300+行業場景的實際套用案例,已形成相互借鑒和復用的規模化效應;還有全國產化的算力平台。」劉慶峰說。
值得一提的是,越來越多的企業依托訊飛智能體平台,孵化員工自己的AI助手。比如國能集團舉辦「國家能源杯」大賽,共126個隊伍參賽,最終創新孵化了54個場景智能體,打造員工自己的AI助手。會上,科大訊飛也正式邀請全國開發者們參與共創。
訊飛星火賦能科研行業NO.1,AI for Science成為科技發展新引擎
今年的諾貝爾物理學獎、化學獎、經濟學獎都頒發給了 AI 領域的科學家。劉慶峰表示,AI for Science帶來科研範式的根本變革,正在成為科技發展的新引擎。
訊飛星火持續為高校提供基礎科研提效服務。劉慶峰介紹,星火科研助手自去年底釋出以來,已在中科院下屬116個院所使用。北京郵電大學EZCoding雛雁/大創團隊基於訊飛星火大模型打造的編程教學套用平台「碼上」,目前已在全國332所院校開通使用,學生主動提問率增加1倍,教師輔導工作減少80%。
劉慶峰提到,人工智能賦能科研工作的三個台階:依托科研文獻助手和程式碼助手提升基礎工作效率,基於深度神經網絡對科學任務進行精準建模,以及借助認知大模型學習領域知識並輔助設計科研實驗方案。據悉,科大訊飛已在大模型+科研領域做了許多探索,如聯合中國科學技術大學劉海燕教授團隊,成功設計了48個自然界不存在的全新蛋白質;聯合中科院動物研究所李鑫團隊,研究單細胞基因表現課題;聯合中科院等離子體物理研究所李建剛院士團隊,研究托卡馬克等離子體控制。此外,科大訊飛還聯合中國科技大學研發「化學大模型」,聯合中科院大連化學物理研究所研發「化工大模型」。
「AI for Science決定了中國科技發展的速度,賦能科研是訊飛星火的重要使命」,劉慶峰說。
首個國產萬卡算力集群「飛星二號」平台上線,星火大模型持續引領全國產算力平台發展
2024科大訊飛AI開發者大賽共有來自14個國家、348座城市的35268支團隊參賽,其中9372支是大模型團隊。2024科大訊飛AI開發者大賽中,科大訊飛聯合30所科研院校、44家企業與機構頂尖共創賽題,最終評選出十佳團隊。
只有生態的繁榮,才有人工智能的大未來。根據IDC研究報告和市場公開數據顯示,科大訊飛在語音語意市占率中第一、大模型開發者規模第一,達78.1萬。釋出會上,記者獲悉,科大訊飛將開放全場景資源,從技術能力到套用落地,用最短路徑實作產品成功,線上線下渠道和資源共享,加速開發者邁向市場成功。據悉,科大訊飛將牽頭成立AI基金,用5億創業基金推動開發者創業,加速前沿技術產業化行程,並與地方政府聯合為AI創業團隊提供產業落地支撐。
釋出會上,科大訊飛、華為、合肥市大數據資產營運有限公司三方聯合打造的國產超大規模智算平台「飛星二號」正式啟動。去年10月24日,首個國產萬卡算力集群「飛星一號」平台上線,星火大模型持續引領全國產算力平台發展,劉慶峰介紹一年以來攻克了很多‘疑難雜癥’,解決了500多次以上的基礎軟硬件問題和模型適配問題。
「飛星二號」將帶來新模型新演算法的持續適配和智算集群規模的再次躍遷,持續探索無人區、引領國產大模型底座的發展、給世界提供第二選擇。「只有在真正自主可控的平台上,才有真正的中國人工智能大未來。」
科大訊飛正在引領大模型規模化套用時代,面向未來,劉慶峰認為人工智能產業發展的關鍵是五個關鍵詞:頂天立地、自主可控、通專結合、端雲聯動、軟硬一體。劉慶峰說:「堅持這五個關鍵點,我們的人工智能就有大未來,就能真正的解放生產力、釋放想象力,改變產業格局和競爭格局,帶來科研範式的變化,帶來各行各業的變化,最重要的是滿足老百姓對美好生活的期望!這就是我們未來的發展方向。」