1. 華為AI模型量化相關(guān)專利公布,可減少模型占用的內(nèi)存

        2025-02-07 10:35

        近日,華為技術(shù)有限公司申請(qǐng)的“人工智能模型的量化方法、處理系統(tǒng)和量化單元”專利公布。專欄顯示,量化單元可以基于運(yùn)行AI模型的計(jì)算設(shè)備的各個(gè)計(jì)算單元的處理粒度,將量化矩陣分割成多個(gè)適用于各個(gè)計(jì)算單元的處理粒度的分塊量化矩陣。量化單元可以對(duì)分塊量化矩陣進(jìn)行量化處理,以得到量化后的分塊量化矩陣,并存儲(chǔ)在存儲(chǔ)器中,可以減少AI模型占用的內(nèi)存。
        瀏覽 15
        點(diǎn)贊
        評(píng)論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        評(píng)論
        圖片
        表情
        推薦
        點(diǎn)贊
        評(píng)論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
          
          

            1. 中文在线a 在线播放 | 女超人h版成c人版在线观看 | 亚洲国产精品成人综合色在线婷婷 | 想要xx网址 | 黑人狂躁翔田千里A片 |