AI人工智能初學(xué)者
2獲贊0關(guān)注1粉絲
清華提出 OneDet3D,基于點(diǎn)云的3D目標(biāo)檢測多域聯(lián)合訓(xùn)練,強(qiáng)大的通用能力展現(xiàn),模型幾乎覆蓋所有三維目標(biāo)檢測任務(wù) !
點(diǎn)擊下方卡片,關(guān)注「集智書童」公眾號(hào)點(diǎn)擊加入??「集智書童」交流群想要了解更多:前沿AI視覺感知全棧知識(shí)??「分類、檢測、分割、關(guān)鍵點(diǎn)、車道線檢測、3D視覺(分割、檢測)、多模態(tài)、目標(biāo)跟蹤、NerF」行業(yè)技術(shù)方案??「AI安防、AI醫(yī)療、AI自動(dòng)駕駛」AI模型部署落地實(shí)戰(zhàn)??「CUDA、TensorRT、N
AI人工智能初學(xué)者
0
字節(jié)團(tuán)隊(duì)提出 SuperClass 告別CLIP ,革新圖像文本預(yù)訓(xùn)練分類技術(shù) !
點(diǎn)擊下方卡片,關(guān)注「集智書童」公眾號(hào)點(diǎn)擊加入??「集智書童」交流群想要了解更多:前沿AI視覺感知全棧知識(shí)??「分類、檢測、分割、關(guān)鍵點(diǎn)、車道線檢測、3D視覺(分割、檢測)、多模態(tài)、目標(biāo)跟蹤、NerF」行業(yè)技術(shù)方案??「AI安防、AI醫(yī)療、AI自動(dòng)駕駛」AI模型部署落地實(shí)戰(zhàn)??「CUDA、TensorRT、N
AI人工智能初學(xué)者
0
浙大/南京信息科技/上海AILab/倫敦帝國/暨南大學(xué)聯(lián)合提出 HYPERDET: 通用生成圖像檢測框架,性能 SOTA !
文章來源于未來先知,作者小先知近年來,各種生成式視覺模型的發(fā)展使得合成視覺上逼真的圖像成為可能,這也突顯了從實(shí)際照片中有效檢測這些生成圖像的迫切需求。盡管在這個(gè)領(lǐng)域取得了進(jìn)步,但現(xiàn)有的檢測方法往往難以準(zhǔn)確識(shí)別由不同生成模型合成的圖像。在本文中,作者提出了一種新穎且通用的檢測框架HyperDet,它創(chuàng)
AI人工智能初學(xué)者
0
從CNN 到 ConVRNN: 時(shí)間序列異常檢測的可視化技術(shù) !
點(diǎn)擊下方卡片,關(guān)注「集智書童」公眾號(hào)點(diǎn)擊加入??「集智書童」交流群想要了解更多:前沿AI視覺感知全棧知識(shí)??「分類、檢測、分割、關(guān)鍵點(diǎn)、車道線檢測、3D視覺(分割、檢測)、多模態(tài)、目標(biāo)跟蹤、NerF」行業(yè)技術(shù)方案??「AI安防、AI醫(yī)療、AI自動(dòng)駕駛」AI模型部署落地實(shí)戰(zhàn)??「CUDA、TensorRT、N
AI人工智能初學(xué)者
0
輕量級神經(jīng)網(wǎng)絡(luò)模型,嵌入式微小設(shè)備也能實(shí)時(shí)檢測 !
點(diǎn)擊下方卡片,關(guān)注「集智書童」公眾號(hào)點(diǎn)擊加入??「集智書童」交流群想要了解更多:前沿AI視覺感知全棧知識(shí)??「分類、檢測、分割、關(guān)鍵點(diǎn)、車道線檢測、3D視覺(分割、檢測)、多模態(tài)、目標(biāo)跟蹤、NerF」行業(yè)技術(shù)方案??「AI安防、AI醫(yī)療、AI自動(dòng)駕駛」AI模型部署落地實(shí)戰(zhàn)??「CUDA、TensorRT、N
AI人工智能初學(xué)者
0
TrackMe:一種簡單有效的多目標(biāo)跟蹤標(biāo)注工具 !
點(diǎn)擊下方卡片,關(guān)注「集智書童」公眾號(hào)點(diǎn)擊加入??「集智書童」交流群想要了解更多:前沿AI視覺感知全棧知識(shí)??「分類、檢測、分割、關(guān)鍵點(diǎn)、車道線檢測、3D視覺(分割、檢測)、多模態(tài)、目標(biāo)跟蹤、NerF」行業(yè)技術(shù)方案??「AI安防、AI醫(yī)療、AI自動(dòng)駕駛」AI模型部署落地實(shí)戰(zhàn)??「CUDA、TensorRT、N
AI人工智能初學(xué)者
0
強(qiáng)推理模型書生InternThinker開放體驗(yàn):自主生成高智力密度數(shù)據(jù)、具備元?jiǎng)幼魉伎寄芰Γ▽H诤咸剿餍逻M(jìn)展
上海人工智能實(shí)驗(yàn)室(上海AI實(shí)驗(yàn)室)致力于通過“通專融合”路徑探索開放、可控、可信的通用人工智能(AGI),其關(guān)鍵技術(shù)之一在于同步提升深度推理與專業(yè)泛化能力。2024年11月25日,上海AI實(shí)驗(yàn)室展示了自主生成高智力密度數(shù)據(jù)、具備元?jiǎng)幼魉伎寄芰Φ摹澳P汀钡纫幌盗袆?chuàng)新進(jìn)展,并開放強(qiáng)推理模型書生Inte
AI人工智能初學(xué)者
0
OrientedFormer: 基于 Transformer的定向目標(biāo)檢測新框架 !
點(diǎn)擊下方卡片,關(guān)注「集智書童」公眾號(hào)點(diǎn)擊加入??「集智書童」交流群想要了解更多:前沿AI視覺感知全棧知識(shí)??「分類、檢測、分割、關(guān)鍵點(diǎn)、車道線檢測、3D視覺(分割、檢測)、多模態(tài)、目標(biāo)跟蹤、NerF」行業(yè)技術(shù)方案??「AI安防、AI醫(yī)療、AI自動(dòng)駕駛」AI模型部署落地實(shí)戰(zhàn)??「CUDA、TensorRT、N
AI人工智能初學(xué)者
0
DFMSD:面向目標(biāo)檢測的雙特征Mask異質(zhì)蒸餾框架 !
點(diǎn)擊下方卡片,關(guān)注「集智書童」公眾號(hào)點(diǎn)擊加入??「集智書童」交流群想要了解更多:前沿AI視覺感知全棧知識(shí)??「分類、檢測、分割、關(guān)鍵點(diǎn)、車道線檢測、3D視覺(分割、檢測)、多模態(tài)、目標(biāo)跟蹤、NerF」行業(yè)技術(shù)方案??「AI安防、AI醫(yī)療、AI自動(dòng)駕駛」AI模型部署落地實(shí)戰(zhàn)??「CUDA、TensorRT、N
AI人工智能初學(xué)者
0
60個(gè)最新開源Transformer壓縮方法,讓你的模型更高效!
大家在實(shí)際部署Transformer時(shí),都需要壓縮模型來減少內(nèi)存和計(jì)算成本。而Transformer模型結(jié)合了注意力和前饋網(wǎng)絡(luò),往往需要特定壓縮技術(shù)來提升性能。本文總結(jié)了不同情況下的60種Transformer模型壓縮方法與開源代碼。分為量化、剪枝、知識(shí)蒸餾三大類。這60種都是近3年內(nèi)非常新穎的創(chuàng)新
AI人工智能初學(xué)者
0
南開大學(xué)提出 ADFQ-ViT,解決 ViT 在低比特量化時(shí)顯著準(zhǔn)確性損失的問題 !
點(diǎn)擊下方卡片,關(guān)注「集智書童」公眾號(hào)點(diǎn)擊加入??「集智書童」交流群想要了解更多:前沿AI視覺感知全棧知識(shí)??「分類、檢測、分割、關(guān)鍵點(diǎn)、車道線檢測、3D視覺(分割、檢測)、多模態(tài)、目標(biāo)跟蹤、NerF」行業(yè)技術(shù)方案??「AI安防、AI醫(yī)療、AI自動(dòng)駕駛」AI模型部署落地實(shí)戰(zhàn)??「CUDA、TensorRT、N
AI人工智能初學(xué)者
0
中山大學(xué) & 華為諾亞實(shí)驗(yàn)室提出 HiRes-LLaVA 框架,解決切片的高分辨率LVLM引起的輸入碎片化問題 !
備注好友:方向-學(xué)校/公司-姓名/昵稱【AIGC 先鋒科技】交流群高分辨率輸入使大型視覺-語言模型(LVLMs)能夠辨別更精細(xì)的視覺細(xì)節(jié),增強(qiáng)了它們的理解能力。為了減少由高分辨率輸入引起的訓(xùn)練和計(jì)算成本,一個(gè)有前景的方向是使用滑動(dòng)窗口將輸入切成均勻的塊,每個(gè)塊與訓(xùn)練有素的視覺編碼器的輸入大小相匹配。
AI人工智能初學(xué)者
0
從理論到實(shí)踐,ViT-1.58b 在復(fù)雜 Transformer 架構(gòu)中的應(yīng)用 !
點(diǎn)擊下方卡片,關(guān)注「集智書童」公眾號(hào)點(diǎn)擊加入??「集智書童」交流群想要了解更多:前沿AI視覺感知全棧知識(shí)??「分類、檢測、分割、關(guān)鍵點(diǎn)、車道線檢測、3D視覺(分割、檢測)、多模態(tài)、目標(biāo)跟蹤、NerF」行業(yè)技術(shù)方案??「AI安防、AI醫(yī)療、AI自動(dòng)駕駛」AI模型部署落地實(shí)戰(zhàn)??「CUDA、TensorRT、N
AI人工智能初學(xué)者
0
自動(dòng)多步蒸餾(AMD) | 突破大規(guī)模視覺模型壓縮的效能界限 !
備注好友:方向-學(xué)校/公司-姓名/昵稱【AIGC 先鋒科技】交流群基于 Transformer 的架構(gòu)因其卓越的性能已成為各種視覺任務(wù)的默認(rèn)標(biāo)準(zhǔn)模型。隨著模型規(guī)模的不斷擴(kuò)大,模型蒸餾在各種實(shí)際應(yīng)用中變得尤為重要,尤其是在計(jì)算資源受限的設(shè)備上。然而,當(dāng)前流行的知識(shí)蒸餾方法在遇到教師模型和學(xué)生模型之間的
AI人工智能初學(xué)者
0
突破預(yù)訓(xùn)練與存儲(chǔ)瓶頸:利用視覺語言模型提升無監(jiān)督領(lǐng)域自適應(yīng) !
點(diǎn)擊下方卡片,關(guān)注「集智書童」公眾號(hào)點(diǎn)擊加入??「集智書童」交流群想要了解更多:前沿AI視覺感知全棧知識(shí)??「分類、檢測、分割、關(guān)鍵點(diǎn)、車道線檢測、3D視覺(分割、檢測)、多模態(tài)、目標(biāo)跟蹤、NerF」行業(yè)技術(shù)方案??「AI安防、AI醫(yī)療、AI自動(dòng)駕駛」AI模型部署落地實(shí)戰(zhàn)??「CUDA、TensorRT、N
AI人工智能初學(xué)者
0
破解LLM長上下文瓶頸:MoA混合注意力技術(shù)提升3.9倍上下文長度,性能飆升7倍!
Abstract稀疏注意力能有效緩解大型語言模型(LLM)在長上下文中的顯著內(nèi)存和吞吐量需求?,F(xiàn)有方法通常采用統(tǒng)一的稀疏注意力 Mask ,在不同注意力頭和輸入長度上應(yīng)用相同的稀疏模式。然而,這種統(tǒng)一的方法未能捕捉到LLM中固有的多樣化注意力模式,忽略了它們在準(zhǔn)確性和延遲之間的不同權(quán)衡。為了應(yīng)對這一
AI人工智能初學(xué)者
0
南京理工將 CNN 與 Transformer 結(jié)合,在變化檢測準(zhǔn)確度上顯著提升,超越現(xiàn)有技術(shù)水平 !
點(diǎn)擊下方卡片,關(guān)注「集智書童」公眾號(hào)點(diǎn)擊加入??「集智書童」交流群想要了解更多:前沿AI視覺感知全棧知識(shí)??「分類、檢測、分割、關(guān)鍵點(diǎn)、車道線檢測、3D視覺(分割、檢測)、多模態(tài)、目標(biāo)跟蹤、NerF」行業(yè)技術(shù)方案??「AI安防、AI醫(yī)療、AI自動(dòng)駕駛」AI模型部署落地實(shí)戰(zhàn)??「CUDA、TensorRT、N
AI人工智能初學(xué)者
0
南洋理工 & 新加坡大學(xué)提出 DM3D | 3D點(diǎn)云剪枝策略,在多個(gè)檢測模型上實(shí)現(xiàn)精度與計(jì)算效率雙贏 !
ADAS Laboratory點(diǎn)擊上方藍(lán)字關(guān)注 智駕實(shí)驗(yàn)室 加入【智駕實(shí)驗(yàn)室】交流群,獲取更多內(nèi)容和資料將深度神經(jīng)網(wǎng)絡(luò)應(yīng)用于三維點(diǎn)云處理,因其在增強(qiáng)現(xiàn)實(shí)/虛擬現(xiàn)實(shí)、自動(dòng)駕駛和機(jī)器人技術(shù)等多個(gè)領(lǐng)域的卓越性能而越來越受
AI人工智能初學(xué)者
0
YOLO & GhostNet | 實(shí)現(xiàn)了準(zhǔn)確定位和分類,同時(shí)實(shí)現(xiàn)在復(fù)雜環(huán)境中的模型準(zhǔn)確性和性能!
點(diǎn)擊下方卡片,關(guān)注「集智書童」公眾號(hào)點(diǎn)擊加入??「集智書童」交流群安全頭盔在建筑工地等潛在危險(xiǎn)普遍存在的環(huán)境中對保護(hù)工人 Head 受傷起著至關(guān)重要的作用。然而,目前尚無方法能同時(shí)實(shí)現(xiàn)在復(fù)雜環(huán)境中的模型準(zhǔn)確性和性能。在本研究中,作者利用基于YOLO的模型進(jìn)行安全頭盔檢測,在減少參數(shù)和浮點(diǎn)運(yùn)算數(shù)量超過2
AI人工智能初學(xué)者
0
