2017 Top10 CV: 目前最好的object detection模型 Mask R-CNN

Topic: Mask R-CNN

1

Editor: George Wu

Resources:  paper   中文post    Github   video

Label:   Object detection, RCNN, 

大意:

在目標檢測方面, RCNN (2014), Fast R-CNN (2015), Faster R-CNN(2016)系列是效果非常好也廣被使用的方法. 這篇論文的Mask R-CNN是這一系列的新方法, 簡單的說就是在Faster-RCNN的架構上加上Mask回歸以輸出語意分割的結果(segmentation mask). 這篇論文不但在ICCV 2017拿到最佳論文, Mask R-CNN 也在COCO 挑戰賽的三個項目都取得最佳成績包括目標檢測(object-detection), 目標分割(instance segmentation)以及人體關鍵點檢測(key point detection). 另外一點值得提的是ResNet, Faster-RCNN也都是作者Kaiming He 開發的.

Continue reading “2017 Top10 CV: 目前最好的object detection模型 Mask R-CNN”

Advertisements

打破GAN神話, 基於端對端網路的高質量圖像生成

Topic: Photographic Image Synthesis with Cascaded Refinement Networks

Dosudo deep learning newsletter #4

figure2.png

Editor:  George Wu

Resources:    原始post   中文post    Paper    Github    video

Label: Image synthesis, GAN, End-to-end, Semantic segmentation

近年來在圖像或影片生成上大部分都是利用生成對抗網路GANs, 譬如有圖像生成圖像的 iGAN [1], pix2pix[2] , 或語意生成圖像的StackGAN [3][4]等等. 但在今年的ICCV 2017 出現一篇備受矚目的直接用端對端的方式生成高質量圖像的方法. 它的原理等於是圖像的語意分割(Semantic image segmentation)的逆向操作, 從圖像的語意分割直接生成照片級圖像.

Continue reading “打破GAN神話, 基於端對端網路的高質量圖像生成”