3D目標檢測/點云/遙感數(shù)據(jù)集匯總
點擊下方卡片,關注“新機器視覺”公眾號
視覺/圖像重磅干貨,第一時間送達
導讀
本文匯總了一些帶框標注的三維點云建筑物數(shù)據(jù)集。
這是我在找尋帶框標注的三維點云建筑物數(shù)據(jù)集過程中發(fā)現(xiàn)的一些數(shù)據(jù)集,我是奔著找建筑物去的,還有很多關于室內(nèi)場景和自動駕駛車前場景的數(shù)據(jù)集在此就不列出了。
歡迎補充和交流!??!
數(shù)據(jù)集:
1. 點云分類(羅蒙諾索夫莫斯科國立大學) 2. Semantic3D 3. Robotic 3D Scan Repository 4. KITTI 5. Beyond PASCAL: A Benchmark for 3D Object Detection in the Wild 6. Oakland 3-D Point Cloud Dataset(奧克蘭 ) 8.武大遙感數(shù)據(jù) 9 . DOTA數(shù)據(jù)集(images) 10. DIOR 11.LEVIR 12. NWPU VHR-10 13. INRIA aerial image dataset 14. 悉尼城市建筑 15. isprs點云數(shù)據(jù) 16. 中科院自動化所數(shù)據(jù)集 17. ILSVRC 18. ImageNet 19. SUN database 20. SUN-RGBD數(shù)據(jù)集 21. ModelNet 22. NYU Depth V2 dataset 23. DTU dataset 24. 普林斯度視覺和機器人實驗室數(shù)據(jù)集
1. 點云分類(羅蒙諾索夫莫斯科國立大學)
Legend: red — ground, black — building, navy — car, green — tree, cyan — low-vegetation.
鏈接:點云分類:https://graphics.cs.msu.ru/en/node/922
2. Semantic3D
大規(guī)模點云分類基準,它提供了一個帶有大標簽的自然場景的3D點云數(shù)據(jù)集,總計超過40億個點,8個類別標簽。并且還涵蓋了多種多樣的城市場景。
該數(shù)據(jù)集是一個大型戶外數(shù)據(jù)集,使用地面激光掃描儀獲得,總共包含 40億個點。數(shù)據(jù)集包含了各種城市和鄉(xiāng)村場景,如農(nóng)場,市政廳,運動場,城堡和廣場。該數(shù)據(jù)集包含 15 個訓練數(shù)據(jù)集和 15 個測試數(shù)據(jù)集,另外還包括 4 個縮減了的測試數(shù)據(jù)集。數(shù)據(jù)集中的點都含有 RGB 和強度信息,并被標記為 8 個語義類別。


8個類別標簽的分類基準,即 1:人造地形;2:自然地形;3:高植被;4:低植被;5:建筑物;6:硬景觀;7:掃描人工制品,8:汽車 。附加標簽 0:未標記點,標記沒有地面真值的點
鏈接:Semantic3D:http://www.semantic3d.net/
3. Robotic 3D Scan Repository
包含大量的Riegl和Velodyne雷達數(shù)據(jù),可能更適合slam研究
Authors Johannes Schauer, Andreas Nüchter from the University of Würzburg, Germany
Date 2016-10-27
Location Würzburg marketplace (geo:49.79445,9.92928)
Scanner Riegl VZ-400
#scans 6
#points 86585411
Datatype X,Y,Z (lefthanded) and reflectance in uosr format
Download wue_city.tar.xz
MD5 9b38cad10038ee4f3abbdd7b8431fa27
Filesize 1187 MiB (5117 MiB unpacked)
README README.wue_city


Robotic 3D Scan Repository:http://kos.informatik.uni-osnabrueck.de/3Dscans/
4. KITTI
這個數(shù)據(jù)集來自德國卡爾斯魯厄理工學院的一個項目,其中包含了利用KIT的無人車平臺采集的大量城市環(huán)境的點云數(shù)據(jù)集(KITTI),這個數(shù)據(jù)集不僅有雷達、圖像、GPS、INS的數(shù)據(jù),而且有經(jīng)過人工標記的分割跟蹤結(jié)果,可以用來客觀的評價大范圍三維建模和精細分類的效果和性能。
3D對象檢測基準由7481個訓練圖像和7518個測試圖像以及相應的點云組成,包括總共80256個帶標簽的對象,單聲道和立體相機數(shù)據(jù),包括校準、測程法等等。

鏈接:http://www.cvlibs.net/datasets/kitti/eval_object.php?obj_benchmark=3d
5. Beyond PASCAL: A Benchmark for 3D Object Detection in the Wild
PASCAL3D +數(shù)據(jù)集,它是用于3D對象檢測和姿態(tài)估計的新穎且具有挑戰(zhàn)性的數(shù)據(jù)集。PASCAL3D +通過3D注釋增強了PASCAL VOC 2012 [12]的12個剛性類別。此外,從ImageNet 為每個類別添加了更多圖像。與現(xiàn)有的3D數(shù)據(jù)集相比,PASCAL3D +圖像具有更大的可變性,并且每個類別平均有3,000多個對象實例。該數(shù)據(jù)集將為研究3D檢測和姿態(tài)估計提供豐富的測試平臺,并將有助于顯著推動這一領域的研究。在新的數(shù)據(jù)集上提供了DPM 的變化結(jié)果,用于在不同情況下進行對象檢測和視點估計。
物體檢測和姿態(tài)估計的基準(10個類別,每個類別有10個對象實例)
鏈接:https://cvgl.stanford.edu/projects/pascal3d.html
6. Oakland 3-D Point Cloud Dataset(奧克蘭 )
這個數(shù)據(jù)庫的采集地點是在美國卡耐基梅隆大學周圍,數(shù)據(jù)采集使用Navlab11,配備側(cè)視SICK LMS激光掃描儀,用于推掃。其中包含了完整數(shù)據(jù)集、測試集、訓練集和驗證集。
鏈接:http://www.cs.cmu.edu/~vmr/datasets/oakland_3d/cvpr09/doc/


7. Generic 3D Representation via Pose Estimation and Matching
該數(shù)據(jù)集涵蓋紐約,芝加哥,華盛頓,拉斯維加斯,佛羅倫薩,阿姆斯特丹,舊金山和巴黎的市中心和周邊地區(qū)。包含這些城市的3D模型以及街景圖像和元數(shù)據(jù),這些模型已進行地理注冊并手動生成。
鏈接:http://3drepresentation.stanford.edu/

8.武大遙感數(shù)據(jù)
WHU-RS19 Dataset 是一個遙感影像數(shù)據(jù)集,其包含 19 個類別的場景影像共計 1005 張,其中每個類別有 50 張。WHU-RS19是從谷歌衛(wèi)星影像上獲取19類遙感影像,可用于場景分類和檢索。
該數(shù)據(jù)集由武漢大學于 2011 年發(fā)布,相關論文有《Satellite Image Classification via Two-layer Sparse Coding with Biased Image Representation》。
建議的基準數(shù)據(jù)集包括 115 次掃描,共收集了 17.4 億多個 3D 點,這些點來自 11 個不同的環(huán)境(即地鐵站、高速鐵路站臺、山區(qū)、森林、公園、校園、住宅、河岸、文物建筑、地下挖掘和隧道),這里僅取文物與住宅點云。

鏈接:https://download.csdn.net/download/cp_oldy/10666758(我沒下載,不知可用否)
暫無有效鏈接,需要可向武大申請使用
9 . DOTA數(shù)據(jù)集(images)
數(shù)據(jù)集是遙感圖像,DOTA1.5是在DOTA基礎上擴增的數(shù)據(jù)集
DOTA數(shù)據(jù)集包含2806張航空圖像,尺寸大約為4kx4k,包含15個類別共計188282個實例。其標注方式為四點確定的任意形狀和方向的四邊形(區(qū)別于傳統(tǒng)的對邊平行bbox)

標注格式:
在數(shù)據(jù)集中,每個實例的位置由四邊形邊界框注釋,可以表示為“x 1,y 1,x 2,y 2,x 3,y 3,x 4,y 4”,其中(xi,yi)表示圖像中定向邊界框頂點的位置。頂點按順時針順序排列。以下是采用的注釋方法的可視化。黃點代表起點。它指的是:(a)飛機的左上角,(b)大型車輛鉆石的左上角,(c)扇形棒球的中心。

鏈接:https://download.csdn.net/download/qq_40238334/12240956?utm_medium=distribute.pc_relevant.none-task-download-BlogCommendFromMachineLearnPai2-2.pc_relevant_is_cache&depth_1-utm_source=distribute.pc_relevant.none-task-download-BlogCommendFromMachineLearnPai2-2.pc_relevant_is_cache
10. DIOR
“DIOR”是一個用于光學遙感圖像目標檢測的大規(guī)模基準數(shù)據(jù)集。數(shù)據(jù)集包含23463個圖像和192472個實例,涵蓋20個對象類。這20個對象類是飛機、機場、棒球場、籃球場、橋梁、煙囪、水壩、高速公路服務區(qū)、高速公路收費站、港口、高爾夫球場、地面田徑場、天橋、船舶、體育場、儲罐、網(wǎng)球場、火車站、車輛和風磨。
鏈接:http://www.escience.cn/people/gongcheng/DIOR.html
11.LEVIR
LEVIR數(shù)據(jù)集由大量 800 × 600 像素和0.2m?1.0m /像素的高分辨率Google Earth圖像和超過22k的圖像組成。LEVIR數(shù)據(jù)集涵蓋了人類居住環(huán)境的大多數(shù)類型地面特征,例如城市,鄉(xiāng)村,山區(qū)和海洋。數(shù)據(jù)集中未考慮冰川,沙漠和戈壁等極端陸地環(huán)境。數(shù)據(jù)集中有3種目標類型:飛機,輪船(包括近海輪船和向海輪船)和油罐。所有圖像總共標記了11k個獨立邊界框,包括4,724架飛機,3,025艘船和3,279個油罐。每個圖像的平均目標數(shù)量為0.5。
鏈接:http://levir.buaa.edu.cn/Code.htm
12. NWPU VHR-10
西北工業(yè)大學標注的航天遙感目標檢測數(shù)據(jù)集,共有800張圖像,其中包含目標的650張,背景圖像150張,目標包括:飛機、艦船、油罐、棒球場、網(wǎng)球場、籃球場、田徑場、港口、橋梁、車輛10個類別。開放下載,大概73M.
鏈接:https://pan.baidu.com/s/1hqwzXeG#list/path=/
13. INRIA aerial image dataset
Inria是法國國家信息與自動化研究所簡稱,該機構(gòu)擁有大量數(shù)據(jù)庫,其中此數(shù)據(jù)庫是一個城市建筑物檢測的數(shù)據(jù)庫,標記只有building, not building兩種,且是像素級別,用于語義分割。訓練集和數(shù)據(jù)集采集自不同的城市遙感圖像。
鏈接:https://project.inria.fr/aerialimagelabeling/
14. 悉尼城市建筑
這個數(shù)據(jù)集包含用Velodyne HDL-64E LIDAR掃描的各種常見城市道路對象,收集于澳大利亞悉尼CBD。含有631個單獨的掃描物體,包括車輛、行人、廣告標志和樹木等。可以用來測試匹配和分類算法。
Sydney Urban Objects Dataset 下面是數(shù)據(jù)格式:

鏈接:http://www.acfr.usyd.edu.au/papers/SydneyUrbanObjectsDataset.shtml
15. isprs點云數(shù)據(jù)
ISPRS官方提供了航空、無人機、傾斜影像數(shù)據(jù)進行密集匹配和三維重建,以下給出相應的數(shù)據(jù)獲取地址。

航空數(shù)據(jù)
一共提供了兩組航空實驗數(shù)據(jù),一組是高樓林立的加拿大Toronto地區(qū),另一組是半農(nóng)村地區(qū)的德國Vaihingen地區(qū)。兩組數(shù)據(jù)的航向重疊度為60%,旁向重疊度為30%。
鏈接:https://www2.isprs.org/commissions/comm2/wg4/benchmark/detection-and-reconstruction/
無人機數(shù)據(jù)
鏈接:https://www2.isprs.org/commissions/comm1/icwg-1-2/benchmark_main/
傾斜數(shù)據(jù)
鏈接:https://www2.isprs.org/commissions/comm1/icwg-1-2/benchmark_main/
16. 中科院自動化所數(shù)據(jù)集
國內(nèi)的中科院自動化研究所提供了多組近景三維重建的數(shù)據(jù)集。


鏈接:http://vision.ia.ac.cn/zh/data/index.html
17. ILSVRC
ImageNet Large Scale Visual Recognition Challenge
鏈接:https://image-net.org/challenges/LSVRC/2014/
18. ImageNet
ImageNet相關信息如下:
1)Total number of non-empty synsets: 21841
2)Total number of images: 14,197,122
3)Number of images with bounding box annotations: 1,034,908
4)Number of synsets with SIFT features: 1000
5)Number of images with SIFT features: 1.2 million

鏈接:https://image-net.org/download
19. SUN database
131067 Images 908 Scene categories 313884 Segmented objects 4479 Object categories
有10,000張RGB-D圖片,有58,657個3D包圍框和146,617 個2d包圍框,是NYU Depth V2 dataset的超集,多了3D bounding boxes和room layouts的標注。

鏈接:http://sun.cs.princeton.edu/
20. SUN-RGBD數(shù)據(jù)集

SUN-RGBD數(shù)據(jù)集由四種不同的傳感器獲取,分別為kinect1,kinect2,xction,
SUNRGBD V1包含10335張RGBD圖片,19個類的對象。這些圖片來自數(shù)據(jù)集NYU depth v2(既NYUDv2),B3DO,SUN3D,使用SUNRGBD此數(shù)據(jù)集的時候不要忘了引用其包含的數(shù)據(jù)集的相關論文文獻。
鏈接:http://rgbd.cs.princeton.edu/
21. ModelNet
ModelNet總共有662中目標分類,127915個CAD,以及十類標記過方向朝向的數(shù)據(jù)。
其中包含了三個子集:
ModelNet10為十個標記朝向的子集數(shù)據(jù); ModelNet40為40個類別的三維模型; Aligned40:40類標記的三維模型;
數(shù)據(jù)格式:.OFF
數(shù)據(jù)特點:結(jié)構(gòu)簡單,不適合做點云數(shù)據(jù)集,模型結(jié)構(gòu)更多通過邊來體現(xiàn)
鏈接:http://modelnet.cs.princeton.edu/
22. NYU Depth V2 dataset
關于RGBD 圖像場景理解的數(shù)據(jù)庫
提供1449張深度圖片和他們的密集2d點類標注
鏈接:https://cs.nyu.edu/~silberman/datasets/nyu_depth_v2.html
23. DTU dataset
關于3D場景的數(shù)據(jù)集,有124個場景,每場景有49/64個位置的RGB圖像和結(jié)構(gòu)光標注
鏈接:http://roboimagedata.compute.dtu.dk/?page_id=36
24. 普林斯度視覺和機器人實驗室數(shù)據(jù)集

這一實驗室提供17個三維視覺的數(shù)據(jù)集,除了上面提到的ShapeNet和SUN3D外,還有:
SUN RGB-D數(shù)據(jù)集,包含了室內(nèi)場景分類、語義分割、房間布置和物體朝向等標注,其中有 10,000 張RGB-D 圖像, 標注包含 146,617 2D 個多邊形和 58,657 3D 個框。

SUN GC數(shù)據(jù)集包含了45k個手工創(chuàng)造的三維室內(nèi)場景,包含了深度信息和每個物體的語義標簽。

此外還有Matterport3D室內(nèi)rgbd數(shù)據(jù)集
這是一個大型RGB-D數(shù)據(jù)集,包含來自90個建筑規(guī)模場景的194,400個RGB-D圖像的10,800個全景。批注提供了表面重建,相機姿勢以及2D和3D語義分割。整個建筑物的精確全局對齊和全面,多樣的全景視圖集可實現(xiàn)各種有監(jiān)督和自我監(jiān)督的計算機視覺任務,包括關鍵點匹配,視圖重疊預測,根據(jù)顏色進行的正常預測,語義分割和場景分類。
鏈接:https://niessner.github.io/Matterport/
鏈接:http://3dvision.princeton.edu/datasets.html
—版權(quán)聲明—
僅用于學術分享,版權(quán)屬于原作者。
若有侵權(quán),請聯(lián)系微信號:yiyang-sy 刪除或修改!
