?

      基于大數據的學生成績關聯因素分析.docx

      資料分類:設計作品 上傳會員:小山神 更新時間:2018-07-24
      需要金幣1000 個金幣 資料包括:完整論文 下載論文
      轉換比率:金額 X 10=金幣數量, 例100元=1000金幣 論文字數:14958
      折扣與優惠:團購最低可5折優惠 - 了解詳情 論文格式:Word格式(*.doc)

      摘要:隨著國家不斷調整教育結構,各高校不斷擴招,學生和教師的數量大幅增長。給教學和管理工作帶來了嚴峻的考驗,由于缺乏必要的技術和手段,管理人員只能通過傳統方法進行統計分析,未能發現數據背后重要的有效信息。

      本文研究了基于校園卡數據的預測方法,利用校園卡數據,提取了圖書館借閱、校園卡消費、宿舍門禁、圖書館門禁、學生成績等數據的數據特征。對這些數據進行數據預處理,從地點維度、時間維度、消費方式維度進行特征提取。利用機器學習XGBoost算法的方法來預測影響學生成績的關聯因素,得到圖書館學習天數,學習次數等重要影響因素,從而幫助同學改變學習方法,幫助老師改變教學方式。

       

      關鍵詞:機器學習;Python;XGBoost算法;關聯規則

       

      目錄

      摘要

      Abstract

      1 緒論-1

      1.1研究背景及意義-1

      1.2 國內外現狀及發展趨勢-1

      1.2.1 國內現狀及發展趨勢-1

      1.2.2 國外現狀及發展趨勢-1

      1.3本文主要內容及結構安排-2

      2.數據挖掘及機器學習綜述-3

      2.1數據挖掘-3

      2.1.1 數據挖掘概念-3

      2.1.2 數據挖掘過程-3

      2.2 機器學習-4

      2.2.1 機器學習概念-4

      2.2.2 機器學習主要任務-4

      2.2.3開發機器學習應用程序的步驟-5

      2.2.4 Python語言-5

      2.3 數據挖掘相關技術-6

      2.3.1 關聯規則算法-6

      2.3.2 決策樹算法-6

      2.3.3聚類分析-6

      2.4 本章小結-6

      3 關聯規則數據挖掘算法分析-7

      3.1 關聯規則-7

      3.2關聯規則經典算法Apriori算法-7

      3.2.1 Apriori定義-7

      3.2.2 Apriori算法的一般過程-7

      3.3使用Apriori算法來發現頻繁集-8

      3.3.1 生成候選項集-8

      3.3.2 組織完整的Apriori算法-8

      3.4從頻繁項集中挖掘關聯規則-8

      3.5本章小結-9

      4 學生成績數據關聯因素分析的設計與實現-10

      4.1 問題簡述-10

      4.2 數據準備-10

      4.3 特征工程-10

      4.3.1特征構造-10

      4.3.2 特征處理-11

      4.3.3特征選擇-12

      4.4 模型選擇-12

      4.4.1 Random Forest(隨機森林)算法-12

      4.4.2 GBDT算法-12

      4.4.3 XGBoost算法-13

      4.5模型融合及參數調優-13

      4.5.1模型融合和模型選擇的區別-13

      4.5.2 模型融合方法-13

      4.5.3 參數調優-14

      4.6實驗數據說明和處理-14

      4.7實驗評估指標-15

      4.8實驗結果-15

      4.9 本章小結-15

      結    論-16

      參 考 文 獻-17

      附錄A 程序-18

      附錄B 結果-20

      致    謝-38

      相關論文資料:
      最新評論
      上傳會員 小山神 對本文的描述:本文主要分為4個章節,詳細介紹了本文的研究背景以及意義。通過此項研究可以改善教學方式和學生的學習方法,提升成績。并在每一章節詳細敘述實現研究目的的方法和算法,并詳細......
      發表評論 (我們特別支持正能量傳遞,您的參與就是我們最好的動力)
      注冊會員后發表精彩評論獎勵積分,積分可以換金幣,用于下載需要金幣的原創資料。
      您的昵稱: 驗證碼:
      ?