​(都會風情)北京加速突破人工智能算力數據瓶頸 陳旭

 多個千億參數基座大模型發佈,AIGC技術快速演進,全模擬光電智能計算芯片……在2024中關村論壇年會開幕式上,十項重大科技成果揭開面紗,其中人工智能相關成果數量佔近一半。

 北京作為中國人工智能綜合實力最強的城市,人工智能相關企業2200餘家,約佔全國的四成;發佈大模型、備案上線大模型數量均佔全國近一半。當前,北京正加速深化人工智能大模型系統佈局,向算力、數據等國際普遍共識的人工智能發展瓶頸進行突破。

 本次中關村展示中心常設展的人工智能集群展上,與會嘉賓被充滿科技感的五層微型智算中心所吸引,這是位於北京市朝陽區酒仙橋的北京市級人工智能算力中心項目——北京數字經濟算力中心。

 「智算中心預計2024年底完成基礎設施建設,投產後將實現2000P智能算力供給。」北京電子數智科技有限責任公司戰略與市場負責人楊震說,智算中心將為企業打造智能應用提供一站式服務,大幅加速人工智能創新應用落地,降低人工智能使用的成本門檻。

 在中關村論壇《百項新技術新產品榜單》中,「先進計算迭代驗證平台」受到許多國產芯片廠商關注。該平台使用大量國產芯片,通過算法實現對混元芯片的加速,大規模提高適配算力規模,讓國產算力被使用起來,同時以真實場景的實踐發現芯片不足,推動芯片迭代升級,從可用到好用。

 數據作為人工智能的要素之一,是人工智能的「糧食」,已成現代社會第五大生產要素。

 「高質量的訓練數據是我國人工智能發展需要突破的瓶頸問題之一。」北京國際大數據交易所董事長範文仲說,北數所近期發佈了第一批人工智能大模型高質量訓練數據集,匯聚36家機構及企業提供的大模型語料訓練數據,讓數據供得出、流得通、用得好,為人工智能行業建立模型訓練「糧倉」。

 作為北京統一的數據要素資源交易平台,北京國際大數據交易所正加速推動跨領域、多模態數據集建設,首批發佈的數據集覆蓋科技創新、金融服務、自動駕駛、商業航天等20多個應用場景,共計176個語料數據,數據總量逾150PB(千萬億字節),涵蓋了互聯網輿情資訊、教學資源題庫、科研數據等多領域多模態的數據語料。◇