M5Product Dataset

論文地址：https://arxiv.org/abs/2109.04275

數(shù)據(jù)集地址：https://xiaodongsuper.github.io/M5Product_dataset/index.html

M5Product 數(shù)據(jù)集是一個(gè)大規(guī)模的多模態(tài)預(yù)訓(xùn)練數(shù)據(jù)集，具有針對(duì)電子產(chǎn)品的粗粒度和細(xì)粒度注釋。

600 萬(wàn)個(gè)多模態(tài)樣本、5k個(gè)屬性和2400 萬(wàn)個(gè)值
5 種模式-圖像文本表視頻音頻
600 萬(wàn)個(gè)類別注釋，包含6k個(gè)類別
廣泛的數(shù)據(jù)源（100 萬(wàn)商戶提供）

Ego4D

論文地址：https://arxiv.org/abs/2110.07058

數(shù)據(jù)集地址：https://ego4d-data.org/

在全球 74 個(gè)地點(diǎn)和 9 個(gè)國(guó)家/地區(qū)收集的大規(guī)模、以自我為中心的數(shù)據(jù)集和基準(zhǔn)套件，包含超過 3,670 小時(shí)的日常生活活動(dòng)視頻。使用七種不同的現(xiàn)成頭戴式攝像機(jī)捕獲數(shù)據(jù)：GoPro、Vuzix Blade、Pupil Labs、ZShades、OR-DRO EP6、iVue Rincon 1080 和 Weeview。除了視頻，部分 Ego4D 還提供其他數(shù)據(jù)模式：3D 掃描、音頻、凝視、立體、多個(gè)同步的可穿戴相機(jī)和文本敘述。

Daily Multi-Spectral Satellite Dataset

論文鏈接：https://arxiv.org/pdf/2203.12560.pdf

數(shù)據(jù)集地址：https://mediatum.ub.tum.de/1650201

DynamicEarthNet 數(shù)據(jù)集包含每日 Planet Fusion 圖像，以及兩年內(nèi)全球 75 個(gè)地區(qū)的每月土地覆蓋類別。七個(gè)土地覆蓋類別以時(shí)間一致的方式手動(dòng)注釋。還提供了 Sentinel 2 圖像。該數(shù)據(jù)集是第一個(gè)大規(guī)模的多類和多時(shí)態(tài)變化檢測(cè)基準(zhǔn)，我們希望它能促進(jìn)地球觀測(cè)和計(jì)算機(jī)視覺領(lǐng)域的多時(shí)態(tài)研究新浪潮。

VCSL (Video Copy Segment Localization) dataset

論文地址：https://arxiv.org/abs/2203.02654

數(shù)據(jù)集地址：https://github.com/alipay/VCSL/tree/main/data

與現(xiàn)有的受視頻級(jí)標(biāo)注或小規(guī)模限制的復(fù)制檢測(cè)數(shù)據(jù)集相比，VCSL 不僅具有兩個(gè)數(shù)量級(jí)的片段級(jí)標(biāo)記數(shù)據(jù)，16 萬(wàn)個(gè)真實(shí)視頻副本對(duì)包含超過 28 萬(wàn)個(gè)本地復(fù)制片段對(duì)，而且涵蓋各種視頻類別和廣泛的視頻時(shí)長(zhǎng)。每個(gè)收集的視頻對(duì)中的所有復(fù)制片段都是手動(dòng)提取的，并附有精確注釋的開始和結(jié)束時(shí)間戳。

Rope3D

論文地址：https://arxiv.org/abs/2203.13608

數(shù)據(jù)集地址：https://thudair.baai.ac.cn/rope

Rope3D目標(biāo)檢測(cè)數(shù)據(jù)集是首個(gè)同時(shí)具有圖像和點(diǎn)云3D聯(lián)合標(biāo)注的大規(guī)模、多視角的路側(cè)數(shù)據(jù)集，共50009幀圖像數(shù)據(jù)以及對(duì)應(yīng)的2D&3D標(biāo)注結(jié)果?；谠摂?shù)據(jù)集，可以進(jìn)行路端單目3D檢測(cè)任務(wù)的研究。

EDS 數(shù)據(jù)集

數(shù)據(jù)集地址：https://github.com/DIG-Beihang/PSN

EDS 數(shù)據(jù)集針對(duì)由機(jī)器硬件參數(shù)引起的難以察覺的域間偏移問題研究，包含了來(lái)自 3 臺(tái)不同 X 光機(jī)器的 14219 張圖片, 其中 10 類物品, 共計(jì) 31655 個(gè)目標(biāo)實(shí)例，均由專業(yè)標(biāo)注人員進(jìn)行標(biāo)注。

FineDiving

論文地址：https://arxiv.org/pdf/2204.03646.pdf

數(shù)據(jù)集地址：https://github.com/xujinglin/FineDiving

本數(shù)據(jù)集收集了奧運(yùn)會(huì)、世界杯、世錦賽以及歐錦賽的跳水項(xiàng)目比賽視頻。每個(gè)比賽視頻都提供了豐富的內(nèi)容，包括所有運(yùn)動(dòng)員的跳水記錄、不同視角的慢速回放等。

我們構(gòu)建了一個(gè)由語(yǔ)義和時(shí)間結(jié)構(gòu)組織的細(xì)粒度視頻數(shù)據(jù)集，其中每個(gè)結(jié)構(gòu)都包含兩級(jí)注釋。

對(duì)于語(yǔ)義結(jié)構(gòu)，動(dòng)作級(jí)標(biāo)簽描述了運(yùn)動(dòng)員的動(dòng)作類型，步驟級(jí)標(biāo)簽描述了過程中連續(xù)步驟的子動(dòng)作類型，其中每個(gè)動(dòng)作過程中的相鄰步驟屬于不同的子動(dòng)作類型。子動(dòng)作類型的組合產(chǎn)生動(dòng)作類型。在時(shí)間結(jié)構(gòu)中，動(dòng)作級(jí)標(biāo)簽定位運(yùn)動(dòng)員執(zhí)行的完整動(dòng)作實(shí)例的時(shí)間邊界。在此注釋過程中，我們丟棄所有不完整的動(dòng)作實(shí)例并過濾掉慢速播放。步驟級(jí)標(biāo)簽是動(dòng)作過程中連續(xù)步驟的起始幀。

PIAA 數(shù)據(jù)庫(kù)

論文地址：https://arxiv.org/abs/2203.16754

數(shù)據(jù)集地址：https://cv-datasets.institutecv.com/#/data-sets

個(gè)性化圖像美學(xué)評(píng)估 (PIAA) 由于其高度主觀性而具有挑戰(zhàn)性。人們的審美取決于多種因素，包括形象特征和主體性格?，F(xiàn)有的 PIAA 數(shù)據(jù)庫(kù)在注釋多樣性方面，特別是在學(xué)科方面受到限制，已不能滿足日益增長(zhǎng)的 PIAA 研究需求。為了解決這一難題，我們對(duì)個(gè)性化圖像美學(xué)進(jìn)行了迄今為止最全面的主觀研究，并引入了一個(gè)新的具有豐富屬性的個(gè)性化圖像美學(xué)數(shù)據(jù)庫(kù)（PARA），該數(shù)據(jù)庫(kù)由 438 個(gè)主題的 31,220 張帶有注釋的圖像組成。PARA 具有豐富的標(biāo)注，包括 9 個(gè)面向圖像的客觀屬性和 4 個(gè)面向人的主觀屬性。