需要金幣:1000 個金幣 | 資料包括:完整論文 | ||
轉換比率:金額 X 10=金幣數量, 例100元=1000金幣 | 論文字數:14958 | ||
折扣與優惠:團購最低可5折優惠 - 了解詳情 | 論文格式:Word格式(*.doc) |
摘要:隨著國家不斷調整教育結構,各高校不斷擴招,學生和教師的數量大幅增長。給教學和管理工作帶來了嚴峻的考驗,由于缺乏必要的技術和手段,管理人員只能通過傳統方法進行統計分析,未能發現數據背后重要的有效信息。 本文研究了基于校園卡數據的預測方法,利用校園卡數據,提取了圖書館借閱、校園卡消費、宿舍門禁、圖書館門禁、學生成績等數據的數據特征。對這些數據進行數據預處理,從地點維度、時間維度、消費方式維度進行特征提取。利用機器學習XGBoost算法的方法來預測影響學生成績的關聯因素,得到圖書館學習天數,學習次數等重要影響因素,從而幫助同學改變學習方法,幫助老師改變教學方式。
關鍵詞:機器學習;Python;XGBoost算法;關聯規則
目錄 摘要 Abstract 1 緒論-1 1.1研究背景及意義-1 1.2 國內外現狀及發展趨勢-1 1.2.1 國內現狀及發展趨勢-1 1.2.2 國外現狀及發展趨勢-1 1.3本文主要內容及結構安排-2 2.數據挖掘及機器學習綜述-3 2.1數據挖掘-3 2.1.1 數據挖掘概念-3 2.1.2 數據挖掘過程-3 2.2 機器學習-4 2.2.1 機器學習概念-4 2.2.2 機器學習主要任務-4 2.2.3開發機器學習應用程序的步驟-5 2.2.4 Python語言-5 2.3 數據挖掘相關技術-6 2.3.1 關聯規則算法-6 2.3.2 決策樹算法-6 2.3.3聚類分析-6 2.4 本章小結-6 3 關聯規則數據挖掘算法分析-7 3.1 關聯規則-7 3.2關聯規則經典算法Apriori算法-7 3.2.1 Apriori定義-7 3.2.2 Apriori算法的一般過程-7 3.3使用Apriori算法來發現頻繁集-8 3.3.1 生成候選項集-8 3.3.2 組織完整的Apriori算法-8 3.4從頻繁項集中挖掘關聯規則-8 3.5本章小結-9 4 學生成績數據關聯因素分析的設計與實現-10 4.1 問題簡述-10 4.2 數據準備-10 4.3 特征工程-10 4.3.1特征構造-10 4.3.2 特征處理-11 4.3.3特征選擇-12 4.4 模型選擇-12 4.4.1 Random Forest(隨機森林)算法-12 4.4.2 GBDT算法-12 4.4.3 XGBoost算法-13 4.5模型融合及參數調優-13 4.5.1模型融合和模型選擇的區別-13 4.5.2 模型融合方法-13 4.5.3 參數調優-14 4.6實驗數據說明和處理-14 4.7實驗評估指標-15 4.8實驗結果-15 4.9 本章小結-15 結 論-16 參 考 文 獻-17 附錄A 程序-18 附錄B 結果-20 致 謝-38 |