CVPR 2022數(shù)據(jù)集匯總|包含目標(biāo)檢測(cè)、多模態(tài)等方向

極市導(dǎo)讀
?本文收集匯總了目前CVPR 2022已放出的一些數(shù)據(jù)集資源。?>>加入極市CV技術(shù)交流群,走在計(jì)算機(jī)視覺的最前沿
M5Product Dataset
論文地址:https://arxiv.org/abs/2109.04275
數(shù)據(jù)集地址:https://xiaodongsuper.github.io/M5Product_dataset/index.html
M5Product 數(shù)據(jù)集是一個(gè)大規(guī)模的多模態(tài)預(yù)訓(xùn)練數(shù)據(jù)集,具有針對(duì)電子產(chǎn)品的粗粒度和細(xì)粒度注釋。
600 萬(wàn)個(gè)多模態(tài)樣本、5k個(gè)屬性和2400 萬(wàn)個(gè)值
5 種模式-圖像 文本 表 視頻 音頻
600 萬(wàn)個(gè)類別注釋,包含6k個(gè)類別
廣泛的數(shù)據(jù)源(100 萬(wàn)商戶提供)

Ego4D
論文地址:https://arxiv.org/abs/2110.07058
數(shù)據(jù)集地址:https://ego4d-data.org/
在全球 74 個(gè)地點(diǎn)和 9 個(gè)國(guó)家/地區(qū)收集的大規(guī)模、以自我為中心的數(shù)據(jù)集和基準(zhǔn)套件,包含超過 3,670 小時(shí)的日常生活活動(dòng)視頻。使用七種不同的現(xiàn)成頭戴式攝像機(jī)捕獲數(shù)據(jù):GoPro、Vuzix Blade、Pupil Labs、ZShades、OR-DRO EP6、iVue Rincon 1080 和 Weeview。除了視頻,部分 Ego4D 還提供其他數(shù)據(jù)模式:3D 掃描、音頻、凝視、立體、多個(gè)同步的可穿戴相機(jī)和文本敘述。

Daily Multi-Spectral Satellite Dataset
論文鏈接:https://arxiv.org/pdf/2203.12560.pdf
數(shù)據(jù)集地址:https://mediatum.ub.tum.de/1650201
DynamicEarthNet 數(shù)據(jù)集包含每日 Planet Fusion 圖像,以及兩年內(nèi)全球 75 個(gè)地區(qū)的每月土地覆蓋類別。七個(gè)土地覆蓋類別以時(shí)間一致的方式手動(dòng)注釋。還提供了 Sentinel 2 圖像。該數(shù)據(jù)集是第一個(gè)大規(guī)模的多類和多時(shí)態(tài)變化檢測(cè)基準(zhǔn),我們希望它能促進(jìn)地球觀測(cè)和計(jì)算機(jī)視覺領(lǐng)域的多時(shí)態(tài)研究新浪潮。

VCSL (Video Copy Segment Localization) dataset
論文地址:https://arxiv.org/abs/2203.02654
數(shù)據(jù)集地址:https://github.com/alipay/VCSL/tree/main/data
與現(xiàn)有的受視頻級(jí)標(biāo)注或小規(guī)模限制的復(fù)制檢測(cè)數(shù)據(jù)集相比,VCSL 不僅具有兩個(gè)數(shù)量級(jí)的片段級(jí)標(biāo)記數(shù)據(jù),16 萬(wàn)個(gè)真實(shí)視頻副本對(duì)包含超過 28 萬(wàn)個(gè)本地復(fù)制片段對(duì),而且涵蓋各種視頻類別和廣泛的視頻時(shí)長(zhǎng)。每個(gè)收集的視頻對(duì)中的所有復(fù)制片段都是手動(dòng)提取的,并附有精確注釋的開始和結(jié)束時(shí)間戳。

Rope3D
論文地址:https://arxiv.org/abs/2203.13608
數(shù)據(jù)集地址:https://thudair.baai.ac.cn/rope
Rope3D目標(biāo)檢測(cè)數(shù)據(jù)集是首個(gè)同時(shí)具有圖像和點(diǎn)云3D聯(lián)合標(biāo)注的大規(guī)模、多視角的路側(cè)數(shù)據(jù)集,共50009幀圖像數(shù)據(jù)以及對(duì)應(yīng)的2D&3D標(biāo)注結(jié)果?;谠摂?shù)據(jù)集,可以進(jìn)行路端單目3D檢測(cè)任務(wù)的研究。

EDS 數(shù)據(jù)集
數(shù)據(jù)集地址:https://github.com/DIG-Beihang/PSN
EDS 數(shù)據(jù)集針對(duì)由機(jī)器硬件參數(shù)引起的難以察覺的域間偏移問題研究,包含了來(lái)自 3 臺(tái)不同 X 光機(jī)器的 14219 張圖片, 其中 10 類物品, 共計(jì) 31655 個(gè)目標(biāo)實(shí)例,均由專業(yè)標(biāo)注人員進(jìn)行標(biāo)注。
FineDiving
論文地址:https://arxiv.org/pdf/2204.03646.pdf
數(shù)據(jù)集地址:https://github.com/xujinglin/FineDiving
本數(shù)據(jù)集收集了奧運(yùn)會(huì)、世界杯、世錦賽以及歐錦賽的跳水項(xiàng)目比賽視頻。每個(gè)比賽視頻都提供了豐富的內(nèi)容,包括所有運(yùn)動(dòng)員的跳水記錄、不同視角的慢速回放等。
我們構(gòu)建了一個(gè)由語(yǔ)義和時(shí)間結(jié)構(gòu)組織的細(xì)粒度視頻數(shù)據(jù)集,其中每個(gè)結(jié)構(gòu)都包含兩級(jí)注釋。
對(duì)于語(yǔ)義結(jié)構(gòu),動(dòng)作級(jí)標(biāo)簽描述了運(yùn)動(dòng)員的動(dòng)作類型,步驟級(jí)標(biāo)簽描述了過程中連續(xù)步驟的子動(dòng)作類型,其中每個(gè)動(dòng)作過程中的相鄰步驟屬于不同的子動(dòng)作類型。子動(dòng)作類型的組合產(chǎn)生動(dòng)作類型。在時(shí)間結(jié)構(gòu)中,動(dòng)作級(jí)標(biāo)簽定位運(yùn)動(dòng)員執(zhí)行的完整動(dòng)作實(shí)例的時(shí)間邊界。在此注釋過程中,我們丟棄所有不完整的動(dòng)作實(shí)例并過濾掉慢速播放。步驟級(jí)標(biāo)簽是動(dòng)作過程中連續(xù)步驟的起始幀。

PIAA 數(shù)據(jù)庫(kù)
論文地址:https://arxiv.org/abs/2203.16754
數(shù)據(jù)集地址:https://cv-datasets.institutecv.com/#/data-sets
個(gè)性化圖像美學(xué)評(píng)估 (PIAA) 由于其高度主觀性而具有挑戰(zhàn)性。人們的審美取決于多種因素,包括形象特征和主體性格?,F(xiàn)有的 PIAA 數(shù)據(jù)庫(kù)在注釋多樣性方面,特別是在學(xué)科方面受到限制,已不能滿足日益增長(zhǎng)的 PIAA 研究需求。為了解決這一難題,我們對(duì)個(gè)性化圖像美學(xué)進(jìn)行了迄今為止最全面的主觀研究,并引入了一個(gè)新的具有豐富屬性的個(gè)性化圖像美學(xué)數(shù)據(jù)庫(kù)(PARA),該數(shù)據(jù)庫(kù)由 438 個(gè)主題的 31,220 張帶有注釋的圖像組成。PARA 具有豐富的標(biāo)注,包括 9 個(gè)面向圖像的客觀屬性和 4 個(gè)面向人的主觀屬性。

公眾號(hào)后臺(tái)回復(fù)“數(shù)據(jù)集”獲取90+深度學(xué)習(xí)數(shù)據(jù)集下載~


#?CV技術(shù)社群邀請(qǐng)函?#

備注:姓名-學(xué)校/公司-研究方向-城市(如:小極-北大-目標(biāo)檢測(cè)-深圳)
即可申請(qǐng)加入極市目標(biāo)檢測(cè)/圖像分割/工業(yè)檢測(cè)/人臉/醫(yī)學(xué)影像/3D/SLAM/自動(dòng)駕駛/超分辨率/姿態(tài)估計(jì)/ReID/GAN/圖像增強(qiáng)/OCR/視頻理解等技術(shù)交流群
每月大咖直播分享、真實(shí)項(xiàng)目需求對(duì)接、求職內(nèi)推、算法競(jìng)賽、干貨資訊匯總、與?10000+來(lái)自港科大、北大、清華、中科院、CMU、騰訊、百度等名校名企視覺開發(fā)者互動(dòng)交流~

