《2019年人工智能在戶型圖自動生成算法中的應用.pdf》由會員分享,可在線閱讀,更多相關《2019年人工智能在戶型圖自動生成算法中的應用.pdf(41頁珍藏版)》請在三個皮匠報告上搜索。
1、2019 KE.COM ALL COPYRIGHTS RESERVED1FloorNet&GAN基于點云的戶型圖重建方法2019 KE.COM ALL COPYRIGHTS RESERVED3目的 輸入為點云,輸出為戶型圖(的一部分)目前的目標為幫助攝影師畫出一部分墻面,不包括門窗與功能間 要求:錯誤的墻面盡量少,寧缺毋濫 誤差:不超過10cm 評價指標:召回率預測正確的墻面數量/真實的墻面數量錯誤率預測錯誤的墻面數量/預測的墻面數量距離分類僅針對正確的墻面精確匹配預測墻面與真實墻面的距離小于5cm不精確匹配預測墻面與真實墻面的距離在5cm-10cm之間過遠匹配預測墻面與真實墻面的距離大于10
2、cm2019 KE.COM ALL COPYRIGHTS RESERVED42019 KE.COM ALL COPYRIGHTS RESERVED4FloorNet 算法簡介2019 KE.COM ALL COPYRIGHTS RESERVED5網絡結構2019 KE.COM ALL COPYRIGHTS RESERVED6網絡結構 三個分支:PointNet,FCN,Image PointNet:輸入為點云(9*50000),直接在上面進行卷積等操作 FCN:輸入為俯視的點云密度圖,有skip connection Image:Dilated residual network&stacked
3、 hourglass CNN 每個分支的每一層之間共享特征2019 KE.COM ALL COPYRIGHTS RESERVED7訓練數據 輸入:點云9*50000(經過降采樣)、圖像特征(現在沒有)輸出:角點的熱力圖(21種)、功能間的熱力圖、物品的熱力圖(現在沒有)角點:墻13種(I、L、T、X)、門窗4種、物品4種2019 KE.COM ALL COPYRIGHTS RESERVED8網絡輸出2019 KE.COM ALL COPYRIGHTS RESERVED9問題 數據缺失:沒有圖像特征數據、沒有物品數據2019 KE.COM ALL COPYRIGHTS RESERVED10改進
4、將點數從50000增加至200000,邊長從256增至512 對網絡進行簡化,只保留FCN部分2000005122019 KE.COM ALL COPYRIGHTS RESERVED11結果:還不錯 模型縮小,訓練速度加快 性能并沒有降低太多(論文里其實已經給出對比結果了)召回率:88.68%錯誤率:7.54%精確匹配:71.61%不精確匹配:21.04%過遠匹配:7.34%2019 KE.COM ALL COPYRIGHTS RESERVED12結果:正確2019 KE.COM ALL COPYRIGHTS RESERVED13結果:正確2019 KE.COM ALL COPYRIGHTS
5、RESERVED14結果:正確2019 KE.COM ALL COPYRIGHTS RESERVED15結果:有缺少&錯誤的墻面2019 KE.COM ALL COPYRIGHTS RESERVED16結果:有缺少&錯誤的墻面2019 KE.COM ALL COPYRIGHTS RESERVED17結果:無法正確預測不封閉的墻面2019 KE.COM ALL COPYRIGHTS RESERVED18結果:無法正確預測不封閉的墻面2019 KE.COM ALL COPYRIGHTS RESERVED19結果:無法正確預測不封閉的墻面2019 KE.COM ALL COPYRIGHTS RESE
6、RVED20問題 網絡輸出結果通過一系列復雜規則轉化為矢量的戶型圖(利用Gurobi建模)代碼冗長,維護不便;且規則嚴苛,經常出現重建失敗的情況 所有房間必須封閉、無法重建斜向墻面等2019 KE.COM ALL COPYRIGHTS RESERVED212019 KE.COM ALL COPYRIGHTS RESERVED21基于GAN的戶型圖重建算法2019 KE.COM ALL COPYRIGHTS RESERVED22對抗生成網絡簡介 GAN的基本原理非常簡單,這里以生成圖片為例進行說明。假設我們有兩個網絡G和D:G是一個生成圖片的網絡,它通過一個隨機噪聲噪聲生成圖片。D是一個判別網絡
7、,判別一張圖片是不是“真實的”。在訓練過程中,生成網絡G的目標就是盡量生成真實的圖片去欺騙判別網絡D。而D的目標就是盡量把G生成的圖片和真實的圖片分別開來。這樣,G和D構成了一個動態的“博弈過程”。最后博弈的結果是什么?在最理想的狀態下,G可以生成足以“以假亂真”的圖片。對于D來說,它難以判定G生成的圖片究竟是不是真實的。這樣我們就得到了一個生成式的模型G,它可以用來生成圖片。2019 KE.COM ALL COPYRIGHTS RESERVED23GAN的一種實現:pix2pix 像素與像素對應的圖片風格轉換2019 KE.COM ALL COPYRIGHTS RESERVED24GAN的一
8、種實現:pix2pix 像素與像素對應的圖片風格轉換 恰好用于生成戶型圖?2019 KE.COM ALL COPYRIGHTS RESERVED25數據準備 考慮到俯視的點云密度圖中會喪失點的高度信息,因此將點云按照高度(00.3、0.30.7、0.71)劃分為3份,分別填入RGB圖像的三個通道中(因為圖像數據只有3個通道)去掉小于50的像素以抑制噪聲 點云密度圖的分辨率為512*512像素,因為pix2pix網絡的原始輸入為256像素,雖然輸入大小不受限制,但是如果繼續擴大則會因為網絡容量的限制而導致性能下降 墻面使用白色,寬度為4像素,如果再細,則輸入與輸出差距不明顯,難以訓練 墻面直接繪
9、制在點云密度圖上,直接繪制在空白圖像中效果不佳,考慮是點云引入了一定的參考信息2019 KE.COM ALL COPYRIGHTS RESERVED26訓練結果 點云輸入 預測值 真實值2019 KE.COM ALL COPYRIGHTS RESERVED27矢量化?2019 KE.COM ALL COPYRIGHTS RESERVED28墻面提取結果2019 KE.COM ALL COPYRIGHTS RESERVED29端點調整結果2019 KE.COM ALL COPYRIGHTS RESERVED30結束了嗎?還可進一步優化2019 KE.COM ALL COPYRIGHTS RESE
10、RVED316.刪除重疊的墻 兩個距離過近的有重疊部分的墻面會被刪除其中一個2019 KE.COM ALL COPYRIGHTS RESERVED32刪除單獨的墻 不與任何墻面有連接的墻面會被刪除2019 KE.COM ALL COPYRIGHTS RESERVED33增加墻面 將孤立的墻面端點與離它最近的墻面相連2019 KE.COM ALL COPYRIGHTS RESERVED34結果:不如FloorNet 因為可以調節各個算法的閾值,所以最終結果是可以改變的。而召回率與錯誤率是相伴相隨的,即召回率升高時錯誤率也會隨之上升,反之亦然。2019 KE.COM ALL COPYRIGHTS
11、RESERVED35結果2019 KE.COM ALL COPYRIGHTS RESERVED36結果2019 KE.COM ALL COPYRIGHTS RESERVED37結果2019 KE.COM ALL COPYRIGHTS RESERVED38結果2019 KE.COM ALL COPYRIGHTS RESERVED39結果2019 KE.COM ALL COPYRIGHTS RESERVED40算法對比 FloorNet的輸入為9*200000的點云,而GAN的輸入為512*512*3的圖片,因此GAN的準確率低在情理之中 FloorNet可能會出現重建失敗的情況,而GAN無論如何
12、都會輸出一些結果 FloorNet比GAN的速度慢 都無法重建非水平豎直的墻面影響準確率的原因 強光下的點云信息缺失 臥室的柜子覆蓋了整面墻,使得原始墻面的位置沒有點云 戶型圖標注標準不統一(是否標注墻角的柱子等)戶型圖精度不足(訓練集的精度就無法達到5厘米)2019 KE.COM ALL COPYRIGHTS RESERVED41改進方向 FloorNet:(1)去掉功能間和門窗的loss(2)不使用已有的矢量化代碼,自己從網絡的輸出提取結果以提高重建成功率(3)后續嘗試在網絡中補全物品位置和圖像特征的信息 GAN:(1)增加點云密度切分的層數以增加數據量,或將輸入從點云密度圖改為模型俯視圖(2)將閾值由像素改為真實距離(3)不斷優化對網絡輸出矢量化的各種策略2019 KE.COM ALL COPYRIGHTS RESERVED43