【導(dǎo)讀】華為AI模型量化相關(guān)專利公布,可減少AI模型占用內(nèi)存 華為布局AI(人工智能)領(lǐng)域迎來(lái)重要進(jìn)展。 天眼查顯示,近日,華為技術(shù)有限公司(以下統(tǒng)稱華為)申請(qǐng)的“人工智能模型的量化方法、處理系統(tǒng)和量化單元”專利公布,可以減少AI模型占用的內(nèi)存。 今年以來(lái),華為公開(kāi)的AI領(lǐng)域?qū)@堰_(dá)26項(xiàng)。2月5日,華為董事長(zhǎng)梁華在廣東省高質(zhì)量發(fā)展大會(huì)上發(fā)言稱,當(dāng)前,AI技術(shù)正處于加速發(fā)展階段,在千行百業(yè)的應(yīng)用也迎來(lái)關(guān)鍵時(shí)期,抓住新機(jī)遇的關(guān)鍵是創(chuàng)新。 記者注意到,華為近期加大與DeepSeek的合作力度,包含華為ModelEngine支持DeepSeek全系列本地部署,DeepSeek系列新模型正式上線昇騰社區(qū)等。 華為重要AI專利公布 專利摘要顯示,華為此次申請(qǐng)的專利涉及AI領(lǐng)域,尤其涉及一種AI模型的量化方法、AI模型的處理系統(tǒng)、量化單元和計(jì)算設(shè)備。 AI模型是利用數(shù)據(jù)和算法,對(duì)某一領(lǐng)域或任務(wù)中的問(wèn)題進(jìn)行建模和解決。目前,部分AI模型已經(jīng)應(yīng)用在機(jī)器翻譯、問(wèn)答系統(tǒng)、語(yǔ)音識(shí)別和文本生成等領(lǐng)域。 2月6日,華為中國(guó)發(fā)文稱,在全球AI技術(shù)飛速發(fā)展的背景下,模型的快速迭代與高效部署成為各大科技企業(yè)競(jìng)相追逐的焦點(diǎn)。 不過(guò),隨著AI技術(shù)發(fā)展,相關(guān)AI模型的規(guī)模越來(lái)越大,存在參數(shù)量較大、占用內(nèi)存較多等問(wèn)題,導(dǎo)致計(jì)算復(fù)雜度不斷提升。 為了解決上述問(wèn)題,華為此次申請(qǐng)的專利提供了一種AI模型的量化方法。 專利摘要顯示,量化單元可以基于運(yùn)行AI模型的計(jì)算設(shè)備中各個(gè)計(jì)算單元的處理粒度,將量化矩陣分割成多個(gè)適用于各個(gè)計(jì)算單元處理粒度的分塊量化矩陣。 量化單元可以對(duì)分塊量化矩陣進(jìn)行量化處理,從而得到量化后的分塊量化矩陣,并存儲(chǔ)在存儲(chǔ)器中以減少AI模型占用的內(nèi)存。 量化矩陣可以是權(quán)重矩陣,也可以是激活矩陣。量化單元在量化過(guò)程中,是基于運(yùn)行AI模型的計(jì)算設(shè)備中各個(gè)計(jì)算單元的處理粒度進(jìn)行量化,不需要基于張量級(jí)別進(jìn)行離群值的統(tǒng)計(jì),實(shí)現(xiàn)AI模型對(duì)權(quán)重矩陣和激活矩陣都可以進(jìn)行實(shí)時(shí)量化。 華為與DeepSeek合作不斷深入 2月6日,華為中國(guó)宣布,華為DCS AI全棧解決方案中的重要產(chǎn)品—ModelEngine,全面支持DeepSeek大模型R1&V3和蒸餾系列模型的本地部署與優(yōu)化,加速客戶AI應(yīng)用快速落地。 據(jù)悉,ModelEngine作為大模型訓(xùn)練、推理和應(yīng)用開(kāi)發(fā)的AI平臺(tái),提供從數(shù)據(jù)預(yù)處理到模型訓(xùn)練、優(yōu)化及部署的一站式服務(wù)。 華為中國(guó)介紹,用戶通過(guò)ModelEngine可以體驗(yàn)DeepSeek的高效推理能力;開(kāi)發(fā)者通過(guò)ModelEngine可實(shí)現(xiàn)對(duì)DeepSeek系列模型的“一鍵部署”,省去硬件選型、兼容性驗(yàn)證和環(huán)境配置等步驟,大幅降低企業(yè)AI應(yīng)用門(mén)檻。 目前,華為旗下多個(gè)業(yè)務(wù)相繼與DeepSeek開(kāi)展合作。 2月5日,基于原生鴻蒙操作系統(tǒng)的小藝助手App接入DeepSeek-R1 Beta(公測(cè))版。升級(jí)至原生鴻蒙的華為用戶,可以通過(guò)“小藝助手App-發(fā)現(xiàn)-智能體廣場(chǎng)”與DeepSeek對(duì)話。 2月4日,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上線昇騰社區(qū),支持一鍵獲取DeepSeek系列模型,支持昇騰硬件平臺(tái)上開(kāi)箱即用,推理快速部署,帶來(lái)更快、更高效、更便捷的AI開(kāi)發(fā)和應(yīng)用體驗(yàn)。 公開(kāi)資料顯示,DeepSeek最新發(fā)布的多模態(tài)大模型Janus-Pro,以及之前發(fā)布的大型語(yǔ)言模型DeepSeek-R1、DeepSeek-V3及DeepSeek-V2,在AI領(lǐng)域引起熱烈反響,多項(xiàng)技術(shù)提升了模型性能與效率。(記者 邱德坤) (來(lái)源:中國(guó)基金報(bào)) 更多精彩資訊請(qǐng)?jiān)趹?yīng)用市場(chǎng)下載“極目新聞”客戶端,未經(jīng)授權(quán)請(qǐng)勿轉(zhuǎn)載,歡迎提供新聞線索,一經(jīng)采納即付報(bào)酬。24小時(shí)報(bào)料熱線027-86777777。 |
19款電子扎帶
電路板識(shí)別電子標(biāo)簽