試卷質(zhì)量統(tǒng)計(jì)分析與數(shù)據(jù)挖掘原理、設(shè)計(jì)與實(shí)現(xiàn)
簡(jiǎn)介
本書特色
前言
章節(jié)列表
精彩閱讀
下載資源
相關(guān)圖書
試卷分析是了解學(xué)生對(duì)知識(shí)點(diǎn)掌握程度、教師出題情況的第一手材料,針對(duì)于試卷的數(shù)據(jù)挖掘可得出試卷的潛在信息規(guī)則,便于決策者調(diào)整教學(xué)計(jì)劃、教學(xué)方法和手段,提高教學(xué)質(zhì)量。基于以上原因,在大量研究和長(zhǎng)時(shí)間應(yīng)用的基礎(chǔ)上編著了此書。
本書共五章,包括兩部分:第一部分包括三章,第1章論述試卷質(zhì)量分析的意義及現(xiàn)狀;第2章介紹基本統(tǒng)計(jì)學(xué)原理;第3章介紹試卷質(zhì)量分析系統(tǒng)設(shè)計(jì)。第二部分包括兩章,第4章介紹相關(guān)數(shù)據(jù)挖掘算法;第5章介紹數(shù)據(jù)挖掘的實(shí)現(xiàn)。
本書可作為本科生學(xué)習(xí)教育統(tǒng)計(jì)學(xué)應(yīng)用、數(shù)據(jù)庫(kù)技術(shù)、數(shù)據(jù)挖掘理論及應(yīng)用、程序設(shè)計(jì)等領(lǐng)域知識(shí)的參考書,也可為研究生和教育研究及決策者在進(jìn)行試卷分析和數(shù)據(jù)挖掘理論研究、軟件設(shè)計(jì)方面提供幫助。
為迎接2006年的本科教育水平評(píng)估,內(nèi)蒙古民族大學(xué)決定設(shè)計(jì)一套學(xué)生試卷分析軟件供全校使用,同時(shí)進(jìn)行了兩次立項(xiàng),首先是2003年的《學(xué)生試卷分析系統(tǒng)》,當(dāng)時(shí)查詢了很多資料,很多學(xué)校也編寫了這樣的系統(tǒng),大部分是圍繞著整個(gè)試卷的總分進(jìn)行一般性的統(tǒng)計(jì)學(xué)分析,沒(méi)有進(jìn)行更深層次的研究。所以,本書從學(xué)生試卷的小分出發(fā),把分析工作定位到每個(gè)小題,除進(jìn)行一般性統(tǒng)計(jì)分析外,又在教師漏題方面進(jìn)行了分析,在班級(jí)的縱向和橫向方面做了一些比較工作,進(jìn)而也在分析結(jié)果可視化方面做出貢獻(xiàn)。
2007年申請(qǐng)內(nèi)蒙古自治區(qū)教育廳立項(xiàng)為《基于多策略的學(xué)生成績(jī)數(shù)據(jù)挖掘及分類培養(yǎng)決策支持》,目的是想進(jìn)一步在數(shù)據(jù)挖掘和決策支持方面進(jìn)行研究。本書在此課題的基礎(chǔ)上,從加快掃描速度、低頻規(guī)則的發(fā)現(xiàn)方面對(duì)Apriori算法做了比較深入的研究,提出應(yīng)用縱橫距離法進(jìn)行異常成績(jī)檢測(cè)和應(yīng)用三次參數(shù)樣條函數(shù)方法進(jìn)行丟失數(shù)據(jù)的修補(bǔ)。在模糊聚類分析(FCM)方面、決策樹(shù)方面也進(jìn)行了比較深入的研究,同時(shí)取得了一些相應(yīng)的研究成果。
經(jīng)過(guò)查閱很多資料,發(fā)現(xiàn)國(guó)內(nèi)在學(xué)生成績(jī)分析與數(shù)據(jù)挖掘方面的成果難登大雅之堂,使得這方面的有價(jià)值的資料很少,但個(gè)人認(rèn)為自己的研究比較系統(tǒng),在試卷質(zhì)量分析和數(shù)據(jù)挖掘方面有獨(dú)到的見(jiàn)解,并取得了一定的成果,所以產(chǎn)生了寫一部專著的想法。
1.試卷分析方面
針對(duì)試卷質(zhì)量分析和學(xué)生考試成績(jī)分析的要求,首先進(jìn)行了有關(guān)試卷分析的統(tǒng)計(jì)學(xué)指標(biāo)介紹,包括最高分、最低分、平均分、分?jǐn)?shù)段分布,同時(shí)也對(duì)難度、易度、區(qū)分度、方差、標(biāo)準(zhǔn)差等進(jìn)行了介紹,著重介紹這些指標(biāo)對(duì)試卷質(zhì)量評(píng)價(jià)的影響。
同時(shí)給出了正態(tài)分布和峰值的判斷原理,并通過(guò)峰值等判斷實(shí)現(xiàn)對(duì)試卷質(zhì)量的自動(dòng)評(píng)語(yǔ)。
依據(jù)統(tǒng)計(jì)分析的基本理論以及學(xué)校的具體要求,進(jìn)行了需求分析、數(shù)據(jù)庫(kù)邏輯設(shè)計(jì)以及程序的總體設(shè)計(jì),實(shí)現(xiàn)了各模塊的基本功能,尤其是自動(dòng)評(píng)語(yǔ)的產(chǎn)生。
2.可視化方面
本書進(jìn)行了試卷質(zhì)量分析報(bào)表設(shè)計(jì),同時(shí)通過(guò)可視化的形式,顯示統(tǒng)計(jì)結(jié)果。并且公布具體的算法和程序設(shè)計(jì)方法以及全部的源代碼,對(duì)想在此方面進(jìn)行研究的人員提供有價(jià)值的資料,同時(shí)也可以作為學(xué)生學(xué)習(xí)編程的案例教程。
3.?dāng)?shù)據(jù)挖掘方面
基于數(shù)據(jù)挖掘理論,提出應(yīng)用三次參數(shù)樣條函數(shù)法對(duì)部分缺失數(shù)據(jù)進(jìn)行修補(bǔ);提出應(yīng)用縱橫距離檢測(cè)算法實(shí)現(xiàn)異常成績(jī)挖掘;為加快挖掘速度,提出基于數(shù)據(jù)庫(kù)一次掃描的Aprior算法;針對(duì)Aprior算法基于高頻的缺點(diǎn),提出基于群體局部特征分段支持度的Aprior算法,實(shí)現(xiàn)對(duì)經(jīng)典Aprior算法的擴(kuò)充,對(duì)低頻規(guī)則進(jìn)行挖掘;提出應(yīng)用決策樹(shù)算法實(shí)現(xiàn)對(duì)學(xué)生成績(jī)的挖掘。
本書給出全部的算法和部分源代碼,方便讀者將其應(yīng)用到其他的知識(shí)領(lǐng)域。
在完成基礎(chǔ)研究和這部專著過(guò)程中,引用了別人的成果,將在本書的參考文獻(xiàn)中列出,在此表示誠(chéng)摯的感謝,同時(shí)感謝在此項(xiàng)工作中給予支持的所有同仁。書中所列的觀點(diǎn)是一家之言,僅代表個(gè)人觀點(diǎn),由于個(gè)人的水平和所涉獵的知識(shí)有限,不足和錯(cuò)誤之處在所難免,希望各位同仁批評(píng)指正。
張春生
2011年11月
第1章 緒論 1
1.1 試卷質(zhì)量分析的意義及現(xiàn)狀 1
1.2 本書的主要工作 5
第2章 基本統(tǒng)計(jì)學(xué)原理 6
2.1 一般統(tǒng)計(jì)指標(biāo) 6
2.2 難度、易度 7
2.3 區(qū)分度 8
2.4 試卷信度 9
2.5 試卷效度 10
2.6 正態(tài)分布的判斷 11
2.7 自動(dòng)評(píng)語(yǔ)的產(chǎn)生 12
第3章 試卷質(zhì)量分析系統(tǒng)設(shè)計(jì) 14
3.1 數(shù)據(jù)庫(kù)設(shè)計(jì) 14
3.2 程序總體結(jié)構(gòu) 19
3.3 主要功能模塊實(shí)現(xiàn) 21
3.3.1 主程序設(shè)計(jì) 21
3.3.2 基本數(shù)據(jù)輸入程序設(shè)計(jì) 28
3.3.3 試卷分析 32
3.3.4 信息維護(hù) 38
3.3.5 系統(tǒng)維護(hù) 39
3.4 報(bào)表設(shè)計(jì) 42
3.5 教師分析 47
3.6 多維數(shù)據(jù)顯示 59
第4章 相關(guān)數(shù)據(jù)挖掘算法 68
4.1 異常成績(jī)發(fā)現(xiàn) 72
4.2 缺失成績(jī)的修補(bǔ) 76
4.3 關(guān)聯(lián)規(guī)則 80
4.4 關(guān)聯(lián)規(guī)則算法的優(yōu)化 84
4.4.1 改進(jìn)Apriori算法描述 85
4.4.2 算法描述 86
4.5 局部特征的知識(shí)發(fā)現(xiàn) 88
4.5.1 基于分段支持度的Apriori算法基本原理 89
4.5.2 基于分段支持度的Apriori算法描述 91
4.6 決策樹(shù)算法 91
4.6.1 決策樹(shù)方法概述 92
4.6.2 數(shù)據(jù)挖掘中決策樹(shù)算法的主要進(jìn)展 93
4.6.3 面臨的挑戰(zhàn)與發(fā)展趨勢(shì) 99
4.7 模糊聚類算法(FCM) 100
4.7.1 模糊集基本知識(shí) 100
4.7.2 K均值聚類算法(HCM)介紹 100
4.7.3 模糊C均值聚類 102
4.7.4 FCM算法的應(yīng)用 104
第5章 數(shù)據(jù)挖掘的實(shí)現(xiàn) 105
5.1 數(shù)據(jù)庫(kù)一次掃描Apriori算法 105
5.2 部分缺失數(shù)據(jù)的三次參數(shù)樣條函數(shù)修補(bǔ)方法 115
5.3 基于縱橫距離的異常點(diǎn)檢測(cè)算法及應(yīng)用 116
5.4 基于分段支持度Apriori算法 123
5.5 決策樹(shù)分析方法 133
5.6 模糊聚類算法實(shí)現(xiàn) 140
參考文獻(xiàn) 153

