?

      基于正則化回歸和機(jī)器學(xué)習(xí)方法的房價(jià)預(yù)測模型.docx

      資料分類:科學(xué)與工程 上傳會員:南宋才女 更新時(shí)間:2020-09-23
      需要金幣2000 個(gè)金幣 資料包括:完整論文 下載論文
      轉(zhuǎn)換比率:金額 X 10=金幣數(shù)量, 例100元=1000金幣 論文字?jǐn)?shù):18683
      折扣與優(yōu)惠:團(tuán)購最低可5折優(yōu)惠 - 了解詳情 論文格式:Word格式(*.doc)

      摘要:房屋價(jià)格預(yù)測一直以來都是受到社會關(guān)注的熱點(diǎn)問題。由于單幢房價(jià)受多種復(fù)雜因素影響的原因,本文無法采用傳統(tǒng)的以線性回歸為基礎(chǔ)的模型。正則化方法以及機(jī)器學(xué)習(xí)中的集成方法和神經(jīng)網(wǎng)絡(luò)模型則可以很好地預(yù)測這類非線性、不確定因素較多的復(fù)雜預(yù)測問題。

      本文以美國愛荷華州埃姆斯市的房價(jià)數(shù)據(jù)為例,通過評估不同方法和模型進(jìn)行房價(jià)預(yù)測的準(zhǔn)確性,最終選擇了集成方法中的Stacking方法,形成了綜合Lasso(Least absolute shrinkage and selection operator)回歸、GBRT(Gradient Boosting Regression Tree)、BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)等三種方法的集成模型,并取得了較好的預(yù)測效果。本文主要完成了以下工作:

      1. 通過查閱多種資料了解正則化方法和機(jī)器學(xué)習(xí)方法的原理和應(yīng)用,以及如何建立各種所需方法的模型。

      2. 分析了房價(jià)和其多種影響因素之間的相關(guān)性,研究各種影響因素的重要性并分析其與房價(jià)間的顯示意義。

      3. 根據(jù)不同的預(yù)測方法,采用Python語言建立模型、訓(xùn)練數(shù)據(jù)并得出了各個(gè)模型的預(yù)測準(zhǔn)確度。通過比較各種方法,最終形成了綜合Lasso回歸、GBRT、BP神經(jīng)網(wǎng)絡(luò)三種方法的集成方法。該方法相比于其他方法有較大的性能提升,在測試集上取得了0.1186的對數(shù)均方誤差根。

      關(guān)鍵詞:正則化;Lasso回歸;集成方法;BP神經(jīng)網(wǎng)絡(luò);房價(jià)預(yù)測

       

      目錄

      摘要

      Abstract

      前  言-1

      第一章-緒  論-2

      1.1-選題背景與研究意義-2

      1.2 相關(guān)研究工作-2

      1.2.1 正則化方法-2

      1.2.2 機(jī)器學(xué)習(xí)方法-3

      1.2.3 房價(jià)預(yù)測-4

      1.3 本文研究的主要內(nèi)容。-4

      1.4 本文研究的主要方法。-5

      第二章 正則化方法和機(jī)器學(xué)習(xí)方法原理概述-6

      2.1 線性回歸和正則化方法-6

      2.1.1 最小二乘線性回歸-6

      2.1.2 嶺回歸-7

      2.1.3 Lasso回歸-7

      2.2 機(jī)器學(xué)習(xí)方法-8

      2.2.1 集成方法-9

      2.2.2 神經(jīng)網(wǎng)絡(luò)-12

      2.3 本章小結(jié)-14

      第三章 影響房屋價(jià)格的因素分析-15

      3.1 影響單幢房屋價(jià)格的因素-15

      3.1.1 房屋的自身因素-15

      3.1.2 房屋的自然環(huán)境因素-15

      3.1.3 房屋的社會環(huán)境因素-16

      3.1.4 房屋的行政因素-16

      3.2 影響房屋價(jià)格的因素與房價(jià)的相關(guān)性分析-16

      3.2.1 房屋價(jià)格數(shù)據(jù)的統(tǒng)計(jì)情況-17

      3.2.2 數(shù)值型變量的相關(guān)性分析-19

      3.2.3 分類型變量的相關(guān)性分析-20

      3.3 本章小結(jié)-22

      第四章 基于正則化方法和機(jī)器學(xué)習(xí)的房價(jià)預(yù)測-23

      4.1 實(shí)驗(yàn)方法及實(shí)驗(yàn)準(zhǔn)備-23

      4.1.1 數(shù)據(jù)預(yù)處理-23

      4.1.2 數(shù)據(jù)集劃分-23

      4.1.3 實(shí)驗(yàn)方法-24

      4.1.4 性能評估指標(biāo)-24

      4.2 各個(gè)模型的實(shí)驗(yàn)過程及測試結(jié)果-24

      4.1.1 回歸及正則化方法-24

      4.1.2 Adaboost方法-25

      4.1.3 GBRT方法-26

      4.1.4 BP神經(jīng)網(wǎng)絡(luò)-28

      4.3 基于stacking集成方法的房價(jià)預(yù)測模型-30

      4.4 本章小結(jié)-31

      第五章 結(jié)  論-32

      5.1結(jié)論-32

      5.2存在的問題及展望-32

      參考文獻(xiàn)-33

      致謝-35

      相關(guān)論文資料:
      最新評論
      上傳會員 南宋才女 對本文的描述:接著在正則化方法和機(jī)器學(xué)習(xí)方法中選擇線性回歸、Lasso回歸、嶺回歸、Adaboost方法、GBRT方法和BP神經(jīng)網(wǎng)絡(luò)方法,分別建立模型并在房價(jià)數(shù)據(jù)的基礎(chǔ)上訓(xùn)練模型,通過比較各個(gè)模型的性能......
      發(fā)表評論 (我們特別支持正能量傳遞,您的參與就是我們最好的動(dòng)力)
      注冊會員后發(fā)表精彩評論獎(jiǎng)勵(lì)積分,積分可以換金幣,用于下載需要金幣的原創(chuàng)資料。
      您的昵稱: 驗(yàn)證碼:
      ?