<dfn id="a4kkq"></dfn>
<ul id="a4kkq"></ul>
    • 數(shù)據(jù)挖掘技術(shù)探討論文大全11篇

      時(shí)間:2023-03-25 10:46:30

      緒論:寫作既是個(gè)人情感的抒發(fā),也是對(duì)學(xué)術(shù)真理的探索,歡迎閱讀由發(fā)表云整理的11篇數(shù)據(jù)挖掘技術(shù)探討論文范文,希望它們能為您的寫作提供參考和啟發(fā)。

      數(shù)據(jù)挖掘技術(shù)探討論文

      篇(1)

      專業(yè)

      計(jì)算機(jī)科學(xué)與技術(shù)

      學(xué)生姓名

      楊宇瀟

      學(xué)號(hào)

      181719251864

      一、 選題的背景、研究現(xiàn)狀與意義

      為什么大數(shù)據(jù)分析很重要?大數(shù)據(jù)分析可幫助組織利用其數(shù)據(jù)并使用它來(lái)識(shí)別新的機(jī)會(huì)。反過(guò)來(lái),這將導(dǎo)致更明智的業(yè)務(wù)移動(dòng),更有效的運(yùn)營(yíng),更高的利潤(rùn)和更快樂(lè)的客戶。

      在許多早期的互聯(lián)網(wǎng)和技術(shù)公司的支持下,大數(shù)據(jù)在2000年代初的數(shù)據(jù)熱潮期間出現(xiàn)。有史以來(lái)第一次,軟件和硬件功能是消費(fèi)者產(chǎn)生的大量非結(jié)構(gòu)化信息。搜索引擎,移動(dòng)設(shè)備和工業(yè)機(jī)械等新技術(shù)可提供公司可以處理并持續(xù)增長(zhǎng)的數(shù)據(jù)。隨著可以收集的天文數(shù)據(jù)數(shù)量的增長(zhǎng),很明顯,傳統(tǒng)數(shù)據(jù)技術(shù)(例如數(shù)據(jù)倉(cāng)庫(kù)和關(guān)系數(shù)據(jù)庫(kù))不適合與大量非結(jié)構(gòu)化數(shù)據(jù)一起使用。 Apache軟件基金會(huì)啟動(dòng)了第一個(gè)大數(shù)據(jù)創(chuàng)新項(xiàng)目。最重要的貢獻(xiàn)來(lái)自Google,Yahoo,F(xiàn)acebook,IBM,Academia等。最常用的引擎是:ApacheHive / Hadoop是復(fù)雜數(shù)據(jù)準(zhǔn)備和ETL的旗艦,可以為許多數(shù)據(jù)存儲(chǔ)或分析環(huán)境提供信息以進(jìn)行深入分析。 Apache Spark(由加州大學(xué)伯克利分校開發(fā))通常用于大容量計(jì)算任務(wù)。這些任務(wù)通常是批處理ETL和ML工作負(fù)載,但與Apache Kafka等技術(shù)結(jié)合使用。

      隨著數(shù)據(jù)呈指數(shù)級(jí)增長(zhǎng),企業(yè)必須不斷擴(kuò)展其基礎(chǔ)架構(gòu)以最大化其數(shù)據(jù)的經(jīng)濟(jì)價(jià)值。在大數(shù)據(jù)的早期(大約2008年),Hadoop被大公司首次認(rèn)可時(shí),維護(hù)有用的生產(chǎn)系統(tǒng)非常昂貴且效率低下。要使用大數(shù)據(jù),您還需要適當(dāng)?shù)娜藛T和軟件技能,以及用于處理數(shù)據(jù)和查詢速度的硬件。協(xié)調(diào)所有內(nèi)容同時(shí)運(yùn)行是一項(xiàng)艱巨的任務(wù),許多大數(shù)據(jù)項(xiàng)目都將失敗。如今,云計(jì)算已成為市場(chǎng)瞬息萬(wàn)變的趨勢(shì)。因?yàn)楦鞣N規(guī)模的公司都可以通過(guò)單擊幾下立即訪問(wèn)復(fù)雜的基礎(chǔ)架構(gòu)和技術(shù)。在這里,云提供了強(qiáng)大的基礎(chǔ)架構(gòu),使企業(yè)能夠勝過(guò)現(xiàn)有系統(tǒng)。

      二、 擬研究的主要內(nèi)容(提綱)和預(yù)期目標(biāo)

      隨著行業(yè)中數(shù)據(jù)量的爆炸性增長(zhǎng),大數(shù)據(jù)的概念越來(lái)越受到關(guān)注。 由于大數(shù)據(jù)的大,復(fù)雜和快速變化的性質(zhì),許多用于小數(shù)據(jù)的傳統(tǒng)機(jī)器學(xué)習(xí)算法不再適用于大數(shù)據(jù)環(huán)境中的應(yīng)用程序問(wèn)題。 因此,在大數(shù)據(jù)環(huán)境下研究機(jī)器學(xué)習(xí)算法已成為學(xué)術(shù)界和業(yè)界的普遍關(guān)注。 本文主要討論和總結(jié)用于處理大數(shù)據(jù)的機(jī)器學(xué)習(xí)算法的研究現(xiàn)狀。 另外,由于并行處理是處理大數(shù)據(jù)的主要方法,因此我們介紹了一些并行算法,介紹了大數(shù)據(jù)環(huán)境中機(jī)器學(xué)習(xí)研究所面臨的問(wèn)題,最后介紹了機(jī)器學(xué)習(xí)的研究趨勢(shì),我們的目標(biāo)就是研究數(shù)據(jù)量大的情況下算法和模型的關(guān)系,同時(shí)也會(huì)探討大部分細(xì)分行業(yè)數(shù)據(jù)量不大不小的情況下算法的關(guān)系。

      三、 擬采用的研究方法(思路、技術(shù)路線、可行性分析論證等)

       1.視覺(jué)分析。大數(shù)據(jù)分析用戶包括大數(shù)據(jù)分析專業(yè)人士和一般用戶,但是大數(shù)據(jù)分析的最基本要求是視覺(jué)分析。視覺(jué)分析直觀地介紹了大數(shù)據(jù)的特征,并像閱讀照片的讀者一樣容易接受。 2.數(shù)據(jù)挖掘算法。大數(shù)據(jù)分析的理論中心是數(shù)據(jù)挖掘算法。不同的數(shù)據(jù)挖掘算法依賴于不同的數(shù)據(jù)類型和格式來(lái)更科學(xué)地表征數(shù)據(jù)本身。由于它們被全世界的統(tǒng)計(jì)學(xué)家所公認(rèn),因此各種統(tǒng)計(jì)方法(稱為真值)可以深入到數(shù)據(jù)中并挖掘公認(rèn)的值。另一方面是這些數(shù)據(jù)挖掘算法可以更快地處理大數(shù)據(jù)。如果該算法需要花費(fèi)幾年時(shí)間才能得出結(jié)論,那么大數(shù)據(jù)的價(jià)值是未知的。 3.預(yù)測(cè)分析。大數(shù)據(jù)分析的最后一個(gè)應(yīng)用領(lǐng)域是預(yù)測(cè)分析,發(fā)現(xiàn)大數(shù)據(jù)功能,科學(xué)地建立模型以及通過(guò)模型吸收新數(shù)據(jù)以預(yù)測(cè)未來(lái)數(shù)據(jù)。 4.語(yǔ)義引擎。非結(jié)構(gòu)化數(shù)據(jù)的多樣化為數(shù)據(jù)分析提出了新的挑戰(zhàn)。您需要一套工具來(lái)分析和調(diào)整數(shù)據(jù)。語(yǔ)義引擎必須設(shè)計(jì)有足夠的人工智能,以主動(dòng)從數(shù)據(jù)中提取信息。 5.數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理。大數(shù)據(jù)分析是數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理的組成部分。高質(zhì)量的數(shù)據(jù)和有效的數(shù)據(jù)管理確保了分析結(jié)果在學(xué)術(shù)研究和商業(yè)應(yīng)用中的可靠性和價(jià)值。大數(shù)據(jù)分析的基礎(chǔ)是前五個(gè)方面。當(dāng)然,如果您更深入地研究大數(shù)據(jù)分析,則還有更多特征,更深入,更專業(yè)的大數(shù)據(jù)分析方法。

      四、 論文(設(shè)計(jì))的工作進(jìn)度安排

      2020.03.18-2020.03.20 明確論文內(nèi)容,進(jìn)行相關(guān)論文資料的查找與翻譯。2020.04.04-2020.04.27:撰寫開題報(bào)告 。

      2020.04.28-2020.04.30 :設(shè)計(jì)實(shí)驗(yàn)。

      2020.05.01-2020.05.07 :開展實(shí)驗(yàn)。

      2020.05.08-2020.05.15 :準(zhǔn)備中期檢查。

      2020.05.16-2020.05.23:根據(jù)中期檢查的問(wèn)題,進(jìn)一步完善實(shí)驗(yàn)2020.05.24-2020.05.28 :完成論文初稿。

      2020.05.29-2020.06.26 :論文修改完善。

       

      五、 參考文獻(xiàn)(不少于5篇)

      1 . 王偉,王珊,杜小勇,覃雄派,王會(huì)舉.大數(shù)據(jù)分析——rdbms與mapreduce的競(jìng)爭(zhēng)與共生 .計(jì)算機(jī)光盤軟件與應(yīng)用,2012.被引量:273.

      2 . 喻國(guó)明. 大數(shù)據(jù)分析下的中國(guó)社會(huì)輿情:總體態(tài)勢(shì)與結(jié)構(gòu)性特征——基于百度熱搜詞(2009—2 012)的輿情模型構(gòu)建.中國(guó)人民大學(xué)學(xué)報(bào),2013.被引量:9. 3 . 李廣建,化柏林.大數(shù)據(jù)分析與情報(bào)分析關(guān)系辨析.中國(guó)圖書館學(xué)報(bào),2014.被引量:16.

      4 . 王智,于戈,郭朝鵬,張一川,宋杰.大數(shù)據(jù)分析的分布式molap技術(shù) .軟件學(xué)報(bào),2014.被引量:6.

      5 . 王德文,孫志偉.電力用戶側(cè)大數(shù)據(jù)分析與并行負(fù)荷預(yù)測(cè) .中國(guó)電機(jī)工程學(xué)報(bào),2015.被引量:19.

      6 . 江秀臣,杜修明,嚴(yán)英杰,盛戈皞,陳玉峰 ,郭志紅.基于大數(shù)據(jù)分析的輸變電設(shè)備狀態(tài)數(shù)據(jù)異常檢測(cè)方法 .中國(guó)電機(jī)工程學(xué)報(bào),2015.被引量:8.

      7 . 喻國(guó)明. 呼喚“社會(huì)最大公約數(shù)”:2012年社會(huì)輿情運(yùn)行態(tài)勢(shì)研究——基于百度熱搜詞的大 數(shù)據(jù)分析.編輯之友,2013.被引量:4.

      六、指導(dǎo)教師意見

       

       

       

       

       

       

       

       

      簽字:                  年     月    日

      七、學(xué)院院長(zhǎng)意見及簽字

       

       

       

       

       

       

      篇(2)

      【中圖分類號(hào)】G420 【文獻(xiàn)標(biāo)識(shí)碼】A 【論文編號(hào)】1009―8097(2009)06―0104―03

      數(shù)據(jù)挖掘技術(shù)可以從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中人們事先不知道的,但又是潛在有用的信息和知識(shí)的過(guò)程。通過(guò)這種技術(shù)把獲取的信息和知識(shí)提供給決策支持系統(tǒng)。這種技術(shù)已廣泛地用于各種應(yīng)用,包括商務(wù)管理、生產(chǎn)控制、市場(chǎng)分析、工程設(shè)計(jì)和科學(xué)探索等[1,2,3] ,隨著信息技術(shù)的發(fā)展,數(shù)據(jù)挖掘在網(wǎng)絡(luò)教學(xué)中的應(yīng)用研究也逐漸深入[4,5,6] 。網(wǎng)絡(luò)教學(xué)成為一種新型教學(xué)手段,理論上學(xué)習(xí)者可以在任何時(shí)間、任何地點(diǎn)以任何形式、從任何章節(jié)開始學(xué)習(xí)任何內(nèi)容,實(shí)現(xiàn)個(gè)性化學(xué)習(xí)。但在網(wǎng)絡(luò)教學(xué)實(shí)施過(guò)程中,教學(xué)內(nèi)容和組織活動(dòng)卻不能隨著學(xué)生的學(xué)習(xí)狀況發(fā)生動(dòng)態(tài)變化,導(dǎo)致了教與學(xué)脫離的現(xiàn)象,教學(xué)效果達(dá)不到預(yù)期效果。因此可以利用該技術(shù)對(duì)收集到的與學(xué)生學(xué)習(xí)相關(guān)的歷史數(shù)據(jù)進(jìn)行分析,從而可以為教師深入理解學(xué)生的實(shí)際學(xué)習(xí)情況,制定相關(guān)的教學(xué)目標(biāo)供 其學(xué)習(xí)提供有力的決策支持,是提升教學(xué)效果的有力手段。

      一 擬解決的關(guān)鍵問(wèn)題

      本文探討 在現(xiàn)有的網(wǎng)絡(luò)教學(xué)平臺(tái)基礎(chǔ)上,以在教學(xué)信息數(shù)據(jù)庫(kù)中采集到的學(xué)生學(xué)習(xí)記錄為樣本,應(yīng)用數(shù)據(jù)挖掘技術(shù),挖掘有用的規(guī)則,探討學(xué)生的學(xué)習(xí)習(xí)慣, 學(xué)習(xí)興趣和學(xué)習(xí)成績(jī)間的關(guān)系,從而及時(shí)了解學(xué)生對(duì)每一章節(jié)知識(shí)的掌握程度并根據(jù)每個(gè)學(xué)生的情況制定下一章節(jié)的教學(xué)目標(biāo),為其提供不同的教學(xué)內(nèi)容,從而使教學(xué)更適合學(xué)生

      個(gè)性的發(fā)展,實(shí)現(xiàn)網(wǎng)絡(luò)分層教學(xué),最終實(shí)現(xiàn)教學(xué)過(guò)程的動(dòng)態(tài)調(diào)節(jié)。

      二 數(shù)據(jù)預(yù)處理

      由于人為的原因、設(shè)備的故障及數(shù)據(jù)傳輸中的錯(cuò)誤,導(dǎo)致現(xiàn)實(shí)世界的數(shù)據(jù)含有臟的、不完整的和不一致的數(shù)據(jù)。數(shù)據(jù)預(yù)處理技術(shù)可以檢測(cè)數(shù)據(jù)異常,調(diào)整數(shù)據(jù)并歸約待分析的數(shù)據(jù),從而改進(jìn)數(shù)據(jù)的質(zhì)量,提高其后挖掘過(guò)程的精度和性能。

      本文數(shù)據(jù)源于《數(shù)據(jù)結(jié)構(gòu)》網(wǎng)絡(luò)教學(xué)課程,48節(jié)理論課,24節(jié)實(shí)驗(yàn),4.5個(gè)學(xué)分。學(xué)生111人,其中06級(jí)信息與計(jì)算科學(xué)專業(yè)班合計(jì)64人,07級(jí)地理信息系統(tǒng)專業(yè)一個(gè)班計(jì)47人。針對(duì)1節(jié)提出的問(wèn)題,本文通過(guò)對(duì)網(wǎng)絡(luò)教學(xué)平臺(tái)教學(xué)信息數(shù)據(jù)庫(kù)中的學(xué)生信息表、學(xué)生學(xué)習(xí)進(jìn)度表、測(cè)試信息表等進(jìn)行數(shù)據(jù)挖掘,說(shuō)明其在網(wǎng)絡(luò)教學(xué)中的應(yīng)用。各表結(jié)構(gòu)如表1至表3所示(本文中學(xué)生信息經(jīng)過(guò)掩飾處理)。

      其中內(nèi)容是指客觀性考題,如單項(xiàng)選擇題等。主觀性考題,如算法設(shè)計(jì)之類考題可以以教師組織的BBS討論為依據(jù)評(píng)分,在此以有效討論次數(shù)(有實(shí)質(zhì)性的討論內(nèi)容)計(jì)算。

      首先去除數(shù)據(jù)表中的冗余信息,如學(xué)生信息表中除學(xué)號(hào)信息以外的各分項(xiàng)信息,每一章節(jié)學(xué)習(xí)進(jìn)度表中的節(jié)、日期信息,每章測(cè)試信息表中的題號(hào)、內(nèi)容、答案等信息;對(duì)某些匯總數(shù)據(jù)項(xiàng)進(jìn)行離散化處理,如將測(cè)試信息表中得分匯總后分為(0,59),(60,85),(85,100)等 3個(gè)組并概化為不及格,合格和優(yōu)秀三個(gè)層次;學(xué)習(xí)時(shí)間匯總后分為(0,2),(2,4),(4,6),(6,)等 四個(gè)組,單位:小時(shí);學(xué)習(xí)次數(shù)匯總后分為(0,3),(3,6),(6,)等 三個(gè)組,BBS討論匯總后分為(0,3),(3,6),(6,)并 概化為積極,參與和不積極三個(gè)層次[7];同時(shí)下一章節(jié)的教學(xué)目標(biāo)制定為三個(gè)層次,內(nèi)容呈現(xiàn)分別表示為A類、B類、C類三個(gè)層次的內(nèi)容,提供給學(xué)生學(xué)習(xí)。然后檢查數(shù)據(jù)的完整性及數(shù)據(jù)的一致性,對(duì)其中的噪音數(shù)據(jù)進(jìn)行處理。經(jīng)過(guò)數(shù)據(jù)預(yù)處理工作,得到一張描述學(xué)生學(xué)習(xí)過(guò)程信息的數(shù)據(jù)表格,表4是我們整理出的某一章節(jié)的學(xué)生學(xué)習(xí)情況數(shù)據(jù)。

      三 數(shù)據(jù)挖掘過(guò)程

      主要是利用關(guān)聯(lián)分析、序列模式分析、分類分析和聚類分析等分析方法對(duì)數(shù)據(jù)庫(kù)中的潛在規(guī)則進(jìn)行挖掘。針對(duì)1節(jié)中提出的問(wèn)題,根據(jù)國(guó)內(nèi)外對(duì)各類模式挖掘算法的研究[8,9],本文采用FP-Tree關(guān)聯(lián)規(guī)則挖掘算法進(jìn)行關(guān)聯(lián)規(guī)則挖掘和用于 分類模型判定樹歸納算法進(jìn)行數(shù)據(jù)挖掘。

      1 關(guān)聯(lián)規(guī)則挖掘

      關(guān)聯(lián)規(guī)則挖掘可以發(fā)現(xiàn)大量數(shù)據(jù)中項(xiàng)集之間有趣的關(guān)聯(lián)或相關(guān)聯(lián)系,通過(guò)這種挖掘技術(shù)對(duì)表4進(jìn)行挖掘,可以發(fā)現(xiàn)學(xué)生的學(xué)習(xí)時(shí)間、學(xué)習(xí)次數(shù)及網(wǎng)絡(luò)課堂討論和學(xué)習(xí)效果之間的關(guān)系,使教師了解學(xué)生的網(wǎng)上學(xué)習(xí)行為和目標(biāo)掌握程度,幫助教師調(diào)整教學(xué)計(jì)劃,如設(shè)計(jì)有意義的討論課題提升學(xué)生的學(xué)習(xí)興趣,從而間接增加學(xué)生的學(xué)習(xí)時(shí)間和學(xué)習(xí)次數(shù)。

      首先給出關(guān)聯(lián)規(guī)則的形式化描述:設(shè) 是m個(gè)項(xiàng)的集合,D是數(shù)據(jù)庫(kù)事務(wù)的集合,每個(gè)事務(wù)有一個(gè)標(biāo)識(shí)符。關(guān)聯(lián)規(guī)則就是形如 的蘊(yùn)含式,其中 ,并且 。規(guī)則的支持度記為 ,是事務(wù)D中包含的 事務(wù)數(shù)與所有事務(wù)數(shù)之比,置信度記為 ,是指包含的 事務(wù)數(shù)與包含的 事務(wù)數(shù)之比。

      給定事務(wù)數(shù)據(jù)庫(kù)D挖掘關(guān)聯(lián)規(guī)則問(wèn)題就是產(chǎn)生支持度、置信度分別大于用戶給定的最小支持度和最小置信度的關(guān)聯(lián)規(guī)則。

      表5是使用FP-Tree算法對(duì)學(xué)生學(xué)習(xí)情況表進(jìn)行挖掘得到的一系列關(guān)聯(lián)規(guī)則(因篇幅限制,本文僅列出部分內(nèi)容)。

      從上表可以看出,學(xué)習(xí)時(shí)間在6小時(shí)以上并且成績(jī)?yōu)閮?yōu)秀的同學(xué)占全班的20.51%,學(xué)習(xí)時(shí)間6小時(shí)以上的同學(xué)中有34.78%的學(xué)生成績(jī)?yōu)閮?yōu)秀。學(xué)習(xí)時(shí)間在2小時(shí)以下的并且成績(jī)不及格的同學(xué)占全班的7.69%,學(xué)習(xí)時(shí)間2小時(shí)以下的同學(xué)中有75%的學(xué)生成績(jī)不及格。學(xué)習(xí)時(shí)間在6小時(shí)以上,學(xué)習(xí)次數(shù)多于6次且成績(jī)?yōu)閮?yōu)秀的學(xué)生占全班的7.69%,這部分同學(xué)中有75%也積極參與BBS討論,而學(xué)習(xí)時(shí)間少于2小時(shí),次數(shù)少于3次,基本不參與討論的同學(xué),不及格率為100%,這部分同學(xué)占全班的7.69%。比例明顯偏高,需要調(diào)整教學(xué)的內(nèi)容和設(shè)計(jì)討論問(wèn)題以提高學(xué)生的興趣。從表中還可以看出,學(xué)習(xí)次數(shù)多于6次的學(xué)生中有92.31%的學(xué)生其學(xué)習(xí)時(shí)間一般也會(huì)超過(guò)6小時(shí),這部分學(xué)生占全班的61.54%,通過(guò)關(guān)聯(lián)規(guī)則的挖掘,可以掌握學(xué)生網(wǎng)上學(xué)習(xí)行為,從而為教師的教學(xué)策略調(diào)整提供依據(jù),可以更好地進(jìn)行學(xué)生的培養(yǎng)。

      2 分類模型挖掘

      著名的心理學(xué)家、教育學(xué)家布盧姆提出的掌握學(xué)習(xí)理論認(rèn)為:“只要在提供恰當(dāng)?shù)牟牧虾瓦M(jìn)行教學(xué)的同時(shí)給每個(gè)學(xué)生提供適度的幫助和充分的時(shí)間,幾乎所有的學(xué)生都能完成學(xué)習(xí)任務(wù)或達(dá)到規(guī)定的學(xué)習(xí)目標(biāo)”。

      通過(guò)構(gòu)造判定樹可以建立學(xué)生分層教學(xué)模型,并依據(jù)判定樹為學(xué)生提供不同層次的教學(xué)內(nèi)容而 實(shí)現(xiàn)對(duì)學(xué)生的網(wǎng)絡(luò)分層教學(xué)。分類模型判定樹歸納算法主要表述為計(jì)算每個(gè)屬性的信息增益,將具有最高信息增益的屬性選作 給定樣本集合的測(cè)試屬性,創(chuàng)建樹的結(jié)點(diǎn),并以該屬性標(biāo)記,對(duì)屬性的每個(gè)值創(chuàng)建分支,并據(jù)此劃分樣本。由于樣本數(shù)據(jù)中存在噪聲或孤立點(diǎn),通過(guò)樹剪枝去除不合理的分支,以提高在未知數(shù)據(jù)上分類的準(zhǔn)確性。據(jù)此算法構(gòu)造的判定樹如圖1所示。

      判定樹的第一層條件為每一章節(jié)的單元測(cè)試成績(jī),分別表示為優(yōu)秀、合格和不及格。不及格的同學(xué)下一章節(jié)進(jìn)入C類教學(xué)目標(biāo)學(xué)習(xí),優(yōu)秀的同學(xué)則進(jìn)入A類教學(xué)目標(biāo)學(xué)習(xí),合格的同學(xué)則根據(jù)學(xué)習(xí)的次數(shù)決定下一章節(jié)的教學(xué)目標(biāo)。學(xué)習(xí)次數(shù)為0~2次的同學(xué)進(jìn)入B類教學(xué)目標(biāo)學(xué)習(xí),3~5次的同學(xué)則需要根據(jù)學(xué)習(xí)時(shí)間判定,根據(jù)判定樹可知,所有同學(xué)進(jìn)入B類教學(xué)目標(biāo)學(xué)習(xí),這和我們?nèi)粘5呐袛噙壿嬒喾驗(yàn)閷W(xué)習(xí)次數(shù)較多,學(xué)習(xí)時(shí)間較長(zhǎng),但成績(jī)卻是合格的同學(xué)很有可能是因?yàn)榉椒ú划?dāng)?shù)仍驅(qū)е陆邮苤R(shí)能力較差,進(jìn)入A類目標(biāo)學(xué)習(xí)顯然是不合理的。當(dāng)學(xué)習(xí)次數(shù)大于6次時(shí),可以根據(jù)學(xué)生參與BBS討論的次數(shù)決定學(xué)生的下一章節(jié)的學(xué)習(xí)目標(biāo),討論次數(shù)0~2次的同學(xué)其學(xué)習(xí)目標(biāo)定為B類,3次以上的同學(xué)其學(xué)習(xí)目標(biāo)則定為A類,這類學(xué)生表現(xiàn)出對(duì)知識(shí)的渴求,興趣較濃,理解知識(shí)的能力相對(duì)較強(qiáng)。

      本文為全文原貌 未安裝PDF瀏覽器用戶請(qǐng)先下載安裝 原版全文

      根據(jù)判定樹,可以根據(jù)學(xué)生學(xué)習(xí)本章節(jié)的實(shí)際情況對(duì)學(xué)生學(xué)習(xí)下一章節(jié)內(nèi)容的效果進(jìn)行預(yù)測(cè),據(jù)此對(duì)學(xué)生進(jìn)行分類,提供不同的教學(xué)內(nèi)容供其學(xué)習(xí),以提高整體教學(xué)質(zhì)量。

      參考文獻(xiàn)

      [1] 湯小文,蔡慶生. 數(shù)據(jù)挖掘在電信業(yè)中的應(yīng)用[J].計(jì)算機(jī)工程,2004,30(6):36-37,41.

      [2] 楊引霞,謝康林,朱揚(yáng)勇等.電子商務(wù)網(wǎng)站推薦系統(tǒng)中關(guān)聯(lián)規(guī)則推薦模型的實(shí)現(xiàn)[J].計(jì)算機(jī)工程, 2004, 30(19):57-59.

      [3] 印鑒,陳憶群,張鋼.基于數(shù)據(jù)倉(cāng)庫(kù)的聯(lián)機(jī)分析挖掘系統(tǒng)[J].計(jì)算機(jī)工程,2004,30(19):49-51.

      [4] 楊清蓮,周慶敏,常志玲.Web挖掘技術(shù)及其在網(wǎng)絡(luò)教學(xué)評(píng)價(jià)中的應(yīng)用[J].南京工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2005, 27(5):100-103.

      [5] 劉革平,黃智興,邱玉輝.基于數(shù)據(jù)挖掘的遠(yuǎn)程學(xué)習(xí)過(guò)程評(píng)價(jià)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].電化教育研究,2005,(7):67-69.

      [6] 孫瑩,程華,萬(wàn)浩.基于數(shù)據(jù)挖掘的遠(yuǎn)程學(xué)習(xí)者網(wǎng)上學(xué)習(xí)行為研究[J].中國(guó)遠(yuǎn)程教育,2008,(5):44-47.

      [7] 龔志武.關(guān)于成人學(xué)生網(wǎng)上學(xué)習(xí)行為影響因素的實(shí)證研究[J].中國(guó)電化教育,2004,(8):32-34.

      [8] Sarwar B, Karypis G, Konstan J,et al. Analysis of Recommendation Algorithms for E-commerce [Z]. ACM Conference on Electronic Commerce, 2000.

      [9] Tung A K H, Lu Hongjun, Gan Jiawei,et al. Efficient Mining of Interransaction Association Rules [Z]. IEEE Transactions onKnowledge and Data Engineering, 2003, 15(1).

      Application of Data Mining in Network Teaching

      SUN Yu-rong1LUO Li-yu2HUANG Hui-hua1

      (1.College of Science, Central South University of Forestry and Technology, Changsha ,Hunan, 410004, China;2.The Journal Editorial Department, Hunan University of Technology,Zhuzhou, Hunan, 412007,China)

      篇(3)

      一、數(shù)據(jù)挖掘的定義

      數(shù)據(jù)挖掘是一個(gè)涉及多學(xué)科交叉的研究領(lǐng)域,綜合了人工智能、機(jī)器學(xué)習(xí)、數(shù)理統(tǒng)計(jì)等學(xué)科,它把對(duì)數(shù)據(jù)的應(yīng)用從較低層次的簡(jiǎn)單的查詢提升到從數(shù)據(jù)中挖掘知識(shí)。簡(jiǎn)單的說(shuō),數(shù)據(jù)挖掘就是從數(shù)據(jù)中獲取知識(shí)。從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道、但又是潛在有用的信息和知識(shí)的過(guò)程。數(shù)據(jù)挖掘應(yīng)該更正確地命名為“從數(shù)據(jù)中挖掘知識(shí)”。

      二、數(shù)據(jù)挖掘的過(guò)程

      數(shù)據(jù)挖掘過(guò)程大概可以概括為三部分:數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘、結(jié)果的表達(dá)和解釋。如圖1-1。

      三、數(shù)據(jù)挖掘的特點(diǎn)

      數(shù)據(jù)挖掘是在沒(méi)有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識(shí),所得到的信息具有事先未知、有效、實(shí)用三個(gè)特征;用戶不必提出明確的要求,系統(tǒng)能夠根據(jù)數(shù)據(jù)本身的規(guī)律性,自動(dòng)地挖掘數(shù)據(jù)潛在的模式,或通過(guò)分析建立新的業(yè)務(wù)模型,幫助決策者調(diào)整市場(chǎng)策略,這有利于發(fā)現(xiàn)未知的事物。因此,它是由數(shù)據(jù)驅(qū)動(dòng)的一種真正的知識(shí)發(fā)現(xiàn)方法。

      四、學(xué)生成績(jī)管理的現(xiàn)狀

      隨著高校招生規(guī)模的擴(kuò)大使成績(jī)管理處理的數(shù)據(jù)量急劇增加,存放在數(shù)據(jù)庫(kù)中的大量的成績(jī)數(shù)據(jù),對(duì)于一般的查詢過(guò)程是有效的,管理人員能夠通過(guò)簡(jiǎn)單的統(tǒng)計(jì)或排序等功能獲得一些表面的信息,但隨著數(shù)據(jù)庫(kù)中存儲(chǔ)的數(shù)據(jù)量的增大,傳統(tǒng)的數(shù)據(jù)庫(kù)管理系統(tǒng)的數(shù)據(jù)管理和處理功能就不能滿足現(xiàn)實(shí)的需要,因?yàn)闊o(wú)論是查詢、排序還是方差,其處理方式都是對(duì)指定的數(shù)據(jù)進(jìn)行簡(jiǎn)單的數(shù)字處理,對(duì)于學(xué)生成績(jī)管理方面,往往只能做一些簡(jiǎn)單的功能,由于大量數(shù)據(jù)以不同的形式存儲(chǔ)在不同的計(jì)算機(jī)上,從而使隱藏在其中的大量有用信息無(wú)法得到有效的利用,無(wú)法發(fā)現(xiàn)數(shù)據(jù)中存在的關(guān)聯(lián)和規(guī)則,無(wú)法根據(jù)現(xiàn)有的數(shù)據(jù)預(yù)測(cè)未來(lái)的發(fā)展趨勢(shì)。上述問(wèn)題直接導(dǎo)致教學(xué)管理部門無(wú)法進(jìn)行有效的評(píng)估,任課教師無(wú)法進(jìn)行有效的教學(xué)方法改進(jìn)。而如何將這些數(shù)據(jù)信息轉(zhuǎn)化為知識(shí)表示,為學(xué)校管理者提供決策依據(jù),科學(xué)指導(dǎo)教學(xué),提高教學(xué)管理水平,將是高校需要迫切解決的問(wèn)題。

      五、將數(shù)據(jù)挖掘技術(shù)在成績(jī)管理中的應(yīng)用

      1、學(xué)生成績(jī)分析方面

      學(xué)生的學(xué)習(xí)成績(jī)是評(píng)估學(xué)生表現(xiàn)好壞的重要依據(jù),也是學(xué)生是否掌握好所學(xué)知識(shí)的重要標(biāo)志,目前高校使用的成績(jī)管理系統(tǒng)大部分只能做一些簡(jiǎn)單的數(shù)據(jù)管理和處理,例如:學(xué)生的平時(shí)成績(jī)輸入、考試成績(jī)輸入、畢業(yè)設(shè)計(jì)成績(jī)登記,進(jìn)行各類統(tǒng)計(jì)報(bào)表和信息查詢、分析某一個(gè)班學(xué)生學(xué)習(xí)成績(jī)分布的情況等。目前大量的成績(jī)數(shù)據(jù)只是簡(jiǎn)單地存儲(chǔ)在數(shù)據(jù)庫(kù)中,隱藏在這些數(shù)據(jù)中的潛在信息被閑置,沒(méi)能被充分利用。在數(shù)據(jù)庫(kù)中學(xué)生成績(jī)分析從定性的角度考慮不是很精確,而數(shù)據(jù)挖掘是從定量的角度精確地分析學(xué)生成績(jī)分析的各個(gè)方面數(shù)據(jù)。

      2、在考試方面

      考試是對(duì)教師教學(xué)效果和學(xué)生學(xué)習(xí)效果的一個(gè)檢驗(yàn),是教學(xué)中必不可少的環(huán)節(jié),雖然按考試成績(jī)可以總體評(píng)價(jià)在一定時(shí)期內(nèi)學(xué)生取得的成績(jī),但這并不能有效地說(shuō)明成績(jī)的高低與哪些因素有關(guān),無(wú)法知道教師教學(xué)環(huán)節(jié)中的成功與不足之處,對(duì)教師教學(xué)方法的改進(jìn)和學(xué)生學(xué)習(xí)成績(jī)的提高都沒(méi)有實(shí)際意義上的幫助,而且,學(xué)生考試成績(jī)的高低也與試題的質(zhì)量有著很大的關(guān)系,因此探索有效的方法來(lái)評(píng)價(jià)試題的質(zhì)量如試題難易度,知識(shí)點(diǎn)全面度等在實(shí)際的教學(xué)過(guò)程中同樣具有重要的意義。將數(shù)據(jù)挖掘技術(shù)應(yīng)用于試卷分析數(shù)據(jù)庫(kù)中,然后根據(jù)學(xué)生得分情況分析出每道題的難易度、區(qū)分度、相關(guān)度等指標(biāo),那么據(jù)此,教師可以對(duì)試題的質(zhì)量作出比較準(zhǔn)確的評(píng)價(jià),進(jìn)而可以用來(lái)檢查自己的教學(xué)情況及學(xué)生的掌握情況,并為今后的教學(xué)提供指導(dǎo)。

      2、在教學(xué)評(píng)價(jià)方面

      教學(xué)評(píng)價(jià)是教學(xué)中的一個(gè)重要環(huán)節(jié),是引導(dǎo)教育、培養(yǎng)高素質(zhì)人才,幫助社會(huì)充分利用教育成果和促進(jìn)教育健康發(fā)展的保證。傳統(tǒng)的教學(xué)評(píng)價(jià)大多是參考相關(guān)評(píng)價(jià)指標(biāo)體系和調(diào)查問(wèn)卷等方式實(shí)施的,而且更是注重評(píng)價(jià)的結(jié)果,以作為教師晉升、學(xué)生評(píng)優(yōu)等的依據(jù).高校每學(xué)期都要搞課堂教學(xué)評(píng)價(jià)調(diào)查,積累了大量的教學(xué)信息數(shù)據(jù),利用數(shù)據(jù)挖掘技術(shù),從教學(xué)評(píng)價(jià)數(shù)據(jù)中進(jìn)行數(shù)據(jù)挖掘,探討教學(xué)效果的好壞與教師的年齡、職稱之間有無(wú)必然的聯(lián)系,課堂教學(xué)效果與教師整體素質(zhì)關(guān)系如何,合理配備班級(jí)的上課教師,使學(xué)生能夠較好的保持良好的學(xué)習(xí)態(tài)度,從而為教學(xué)部門提供了決策支持信息,促使更好地開展教學(xué)工作,提高教學(xué)質(zhì)量。

      3、選擇教師的教學(xué)方法方面

      在教學(xué)過(guò)程中,教師可以采用多種方法來(lái)完成自己的教學(xué)任務(wù),比如講授法、多媒體演示、分組討論法、課程實(shí)習(xí)法等,在通常情況下,一般可以采取一種或幾種方法進(jìn)行.據(jù)此可用數(shù)據(jù)挖掘的方法來(lái)挖掘數(shù)據(jù)庫(kù)中的數(shù)據(jù),判定下一步應(yīng)采取什么樣的教學(xué)方法,以滿足教學(xué)的需要,更有利于學(xué)生對(duì)知識(shí)的吸收。

      4、課程的合理設(shè)置方面

      在學(xué)校,學(xué)生的課堂學(xué)習(xí)是循序漸進(jìn)的,而且課程之間有一定的關(guān)聯(lián)與前后順序關(guān)系,在學(xué)一門較高級(jí)課程之前必須先修一些先行課程,如果先行課程沒(méi)有學(xué)好,勢(shì)必會(huì)影響后續(xù)課程的學(xué)習(xí),此外,每一學(xué)期安排課程的多少,也會(huì)影響學(xué)生的學(xué)習(xí)效果。利用學(xué)校教務(wù)管理系統(tǒng)中存放的歷屆學(xué)生各門學(xué)科的考試成績(jī),結(jié)合數(shù)據(jù)挖掘技術(shù)的相關(guān)功能,得出一些有價(jià)值的規(guī)則和信息,最終找到影響學(xué)生成績(jī)的原因,在些基礎(chǔ)上,對(duì)課程設(shè)置做出合理安排。

      六、結(jié)束語(yǔ)

      隨著我國(guó)各高校管理信息化的不斷推進(jìn),各類學(xué)校的數(shù)據(jù)庫(kù)建設(shè)不斷完善,在學(xué)校平時(shí)的教育教學(xué)管理中累積了大量的數(shù)據(jù)。在這些海量的數(shù)據(jù)中,隱藏著大量有用的知識(shí),如果利用好這些知識(shí),將能夠?qū)W(xué)校的教育教學(xué)工作起到積極的指導(dǎo)作用。數(shù)據(jù)挖掘技術(shù)正是為了解決如何從海量數(shù)據(jù)中挖掘出有用的知識(shí),因此,將數(shù)據(jù)挖掘技術(shù)應(yīng)用到高校的教育教學(xué)中去是非常有必要的。

      參考文獻(xiàn):

      【1】吉根林,帥克,孫志揮.數(shù)據(jù)挖掘技術(shù)及其應(yīng)用.南京師大學(xué)報(bào)(自然科學(xué)版),2000,23(2):25-27

      篇(4)

      【中圖分類號(hào)】 C81 【文獻(xiàn)標(biāo)識(shí)碼】 A 【文章編號(hào)】 1004-5937(2016)22-0024-02

      第八屆國(guó)際數(shù)據(jù)挖掘與應(yīng)用統(tǒng)計(jì)研究會(huì)年會(huì)于2016年7月23―26日在油城大慶隆重召開。本屆會(huì)議由國(guó)際數(shù)據(jù)挖掘與應(yīng)用統(tǒng)計(jì)研究會(huì)主辦,東北石油大學(xué)、廈門大學(xué)數(shù)據(jù)挖掘研究中心、臺(tái)北醫(yī)學(xué)大學(xué)大數(shù)據(jù)研究中心、重慶允升科技大數(shù)據(jù)研究中心和重慶譽(yù)鋒宸數(shù)據(jù)信息技術(shù)有限公司聯(lián)合承辦。會(huì)議主題為“卓越數(shù)據(jù)共享統(tǒng)計(jì)的理論及應(yīng)用研究”。來(lái)自國(guó)內(nèi)外近百所高校、政府和企事業(yè)單位的200多位專家學(xué)者參會(huì)。

      會(huì)議開幕式由東北石油大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院院長(zhǎng)王玉學(xué)教授主持。東北石油大學(xué)副校長(zhǎng)呂延防教授介紹了大慶市貌、學(xué)校環(huán)境和鐵人精神等,對(duì)本次會(huì)議的作用和意義進(jìn)行了高度評(píng)價(jià)。教育部統(tǒng)計(jì)學(xué)類專業(yè)教學(xué)指導(dǎo)委員會(huì)主任、廈門大學(xué)曾五一教授從統(tǒng)計(jì)學(xué)科如何適應(yīng)大數(shù)據(jù)時(shí)代的發(fā)展角度,對(duì)會(huì)議的召開提出了進(jìn)一步的期望。臺(tái)北醫(yī)學(xué)大學(xué)謝邦昌教授結(jié)合大慶石油,暢談了大數(shù)據(jù)的應(yīng)用前景。廈門大學(xué)朱建平教授從學(xué)會(huì)的起源到現(xiàn)狀,對(duì)學(xué)會(huì)未來(lái)的發(fā)展前景作了展望。

      本屆大會(huì)除特邀報(bào)告外,入選論文52篇。按照論文所涉及的理論領(lǐng)域和方法應(yīng)用,將入選論文分為數(shù)據(jù)挖掘與大數(shù)據(jù)應(yīng)用、統(tǒng)計(jì)理論、統(tǒng)計(jì)方法應(yīng)用及實(shí)證分析等專題進(jìn)行了分組交流討論。主要學(xué)術(shù)觀點(diǎn)綜述如下:

      一、數(shù)據(jù)挖掘與大數(shù)據(jù)研究現(xiàn)狀及未來(lái)趨勢(shì)研究

      謝邦昌教授在《大數(shù)據(jù)發(fā)展現(xiàn)況與未來(lái)發(fā)展趨勢(shì)》中首先闡述了何謂BIG DATA。當(dāng)你連上臉書按贊打卡、上傳照片到網(wǎng)絡(luò)相簿與朋友分享、上班收發(fā)e-mail、用悠游卡買杯咖啡、通過(guò)ATM領(lǐng)錢、走進(jìn)大賣場(chǎng)刷卡購(gòu)物甚至是進(jìn)家門開燈,都正在源源不斷地創(chuàng)造“海量數(shù)據(jù)”。這正是云端時(shí)代的新金脈。其次是BIG DATA的理論及其應(yīng)用。最重要的是如何對(duì)大數(shù)據(jù)進(jìn)行分析,其基本方面如下:(1)數(shù)據(jù)可視化分析。決策者需要的不是數(shù)據(jù)本身及分析后的數(shù)值,而是龐大數(shù)據(jù)經(jīng)分析之后的結(jié)果、趨勢(shì)或現(xiàn)象,利用可視化效果易于被接受。(2)Data Mining算法。這是大數(shù)據(jù)分析的理論核心,而深入挖掘和快速處理是兩大重要課題。(3)預(yù)測(cè)性分析。如何找出特性、科學(xué)建模、預(yù)測(cè)未來(lái)。(4)語(yǔ)義引擎。非結(jié)構(gòu)化數(shù)據(jù)的多元化給數(shù)據(jù)分析帶來(lái)新的挑戰(zhàn),要提高語(yǔ)義引擎設(shè)計(jì)的智能化水平。(5)數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理。高質(zhì)量的數(shù)據(jù)和有效的數(shù)據(jù)管理可保證分析結(jié)果的真實(shí)和有價(jià)值。最后,真正制約或者成為大數(shù)據(jù)發(fā)展和應(yīng)用的三個(gè)瓶頸:數(shù)據(jù)收集的合法性、產(chǎn)業(yè)鏈各個(gè)環(huán)節(jié)企業(yè)的均衡、大數(shù)據(jù)有效解讀。

      國(guó)家統(tǒng)計(jì)局潘[博士在《我看當(dāng)前對(duì)大數(shù)據(jù)的一些非議――兼議大數(shù)據(jù)應(yīng)用面臨的問(wèn)題》中指出近幾年中國(guó)的大數(shù)據(jù)應(yīng)用取得了一定的進(jìn)展,但面臨的諸多障礙依然存在,且不斷出現(xiàn)一些對(duì)大數(shù)據(jù)的非議之聲。這些非議有的有一定道理,有的則失之偏頗。潘[博士針對(duì)這些非議指出大數(shù)據(jù)是科學(xué)技術(shù)及社會(huì)生產(chǎn)力發(fā)展到特定階段的必然。盡管其發(fā)展進(jìn)程中確實(shí)出現(xiàn)了失密、造假等嚴(yán)重問(wèn)題,但這正說(shuō)明必須正視大數(shù)據(jù)的撲面而來(lái),并盡快制定各種應(yīng)對(duì)措施,抓住機(jī)遇,保存價(jià)值,著力解決出現(xiàn)的各種問(wèn)題。最后,提出完善法律法規(guī)、明確牽頭單位、統(tǒng)籌各部門和規(guī)范標(biāo)準(zhǔn)等措施。

      重慶工商大學(xué)李勇在《網(wǎng)絡(luò)輿情數(shù)據(jù)挖掘方法及其在意識(shí)形態(tài)傳播新特點(diǎn)中的應(yīng)用研究》中系統(tǒng)研究了當(dāng)前網(wǎng)絡(luò)輿情數(shù)據(jù)挖掘的主要方法,并將這些方法應(yīng)用于網(wǎng)上意識(shí)形態(tài)傳播新特點(diǎn)的研究中。對(duì)互聯(lián)網(wǎng)出現(xiàn)前后意識(shí)形態(tài)傳播呈現(xiàn)的不同特點(diǎn)進(jìn)行了對(duì)比分析,提煉出意識(shí)形態(tài)傳播在當(dāng)前DT時(shí)代的本質(zhì)特征,結(jié)合主流意識(shí)形態(tài)提出相應(yīng)的有效傳播方式和防范措施。

      東北石油大學(xué)辛華博士在《基于密度分布的聚類算法研究》中通過(guò)密度聚類方法DBSCAN二次聚類提高了聚類精度。湖北經(jīng)濟(jì)學(xué)院陳戰(zhàn)波、陶前功、黃小舟和王磊的《基于阿里云音樂(lè)平臺(tái)大數(shù)據(jù)的歌手流行趨勢(shì)預(yù)測(cè)及推薦研究》,山西財(cái)經(jīng)大學(xué)舒居安、趙麗琴、劉逸萌的《基于網(wǎng)絡(luò)輿情的居民購(gòu)買力傾向指數(shù)構(gòu)造研究》和重慶工商大學(xué)李禹鋒的《基于網(wǎng)絡(luò)團(tuán)購(gòu)的重慶火鍋消費(fèi)行為分析》等進(jìn)行了大數(shù)據(jù)的應(yīng)用研究。光環(huán)國(guó)際楊恩博的《大數(shù)據(jù)人才發(fā)展與培養(yǎng)》、廣州泰迪智能科技趙云龍的《大數(shù)據(jù)形勢(shì)下數(shù)據(jù)科學(xué)人才培養(yǎng)初探》和劉彬的《大數(shù)據(jù)雙創(chuàng)實(shí)踐探索與服務(wù)體系》,從業(yè)界不同角度探索了大數(shù)據(jù)人才培養(yǎng)。

      二、統(tǒng)計(jì)基本理論及應(yīng)用研究

      臺(tái)灣淡江大學(xué)蔡宗儒教授在《Accelerated Degradation Tests》中,回顧了可靠度分析近期的發(fā)展,指出隨著制造技術(shù)的進(jìn)步,產(chǎn)品可靠度大幅提升,進(jìn)而提升了對(duì)產(chǎn)品可靠度分析的難度。而傳統(tǒng)設(shè)限方法和近代加速壽命測(cè)試法具有一定局限性,通過(guò)研究加速退化測(cè)試方法,指出如何針對(duì)加速退化數(shù)據(jù)進(jìn)行統(tǒng)計(jì)推斷、評(píng)價(jià)其可靠度,如何在成本的考察下對(duì)加速退化測(cè)試實(shí)驗(yàn)進(jìn)行設(shè)計(jì),以利后續(xù)的測(cè)試實(shí)驗(yàn)參考。

      北京大學(xué)房祥忠教授在《EM算法及其在置信推斷中的作用》中指出醫(yī)學(xué)或產(chǎn)品試驗(yàn)費(fèi)用昂貴等小樣本情況,其精確置信推斷尤為重要;Buehler置信限在多維參數(shù)或刪失數(shù)據(jù)時(shí),難以計(jì)算,并將EM算法用于求精確置信限,給出了可靠性領(lǐng)域中的實(shí)證。

      重慶工商大學(xué)李勇在《灰色統(tǒng)計(jì)基本理論及其應(yīng)用》中系統(tǒng)研究了灰數(shù)的統(tǒng)計(jì)學(xué)基本理論和方法。他從隨機(jī)樣本產(chǎn)生灰色估計(jì)量和直接從灰色數(shù)據(jù)開始,構(gòu)建了一套從數(shù)理統(tǒng)計(jì)逐步過(guò)渡到主要以灰色系統(tǒng)為研究對(duì)象的灰色統(tǒng)計(jì)方法,如灰數(shù)的區(qū)間估計(jì)、灰數(shù)的假設(shè)檢驗(yàn)、灰數(shù)的相關(guān)分析和回歸分析等,并進(jìn)行了實(shí)例分析。

      哈爾濱工業(yè)大學(xué)張孟琦、田波平在《空間模型參數(shù)擬極大似然估計(jì)量的漸近性和實(shí)證》中提出了雙權(quán)重矩陣空間回歸模型參數(shù)的極大似然估計(jì)量,包括對(duì)數(shù)似然函數(shù)、集中似然函數(shù)和參數(shù)估計(jì);證明了相合性和漸進(jìn)分布性質(zhì),并實(shí)例進(jìn)行了空間自相關(guān)檢驗(yàn)和空間計(jì)量模型分析。

      天津財(cái)經(jīng)大學(xué)楊貴軍、于洋、孟杰的《基于AIC的粗糙集擇優(yōu)方法》和楊貴軍、孫玲莉、董世杰的《三種線性回歸多重插補(bǔ)法的模擬研究對(duì)比分析》分別從粗糙集擇優(yōu)和回歸插補(bǔ)進(jìn)行了研究。云南財(cái)經(jīng)大學(xué)張敏博士在《基于高層次結(jié)構(gòu)的多水平發(fā)展模型的統(tǒng)計(jì)建模及應(yīng)用》中研究了擬合高層次嵌套數(shù)據(jù)的多水平發(fā)展建模問(wèn)題。集美大學(xué)紀(jì)的《模糊數(shù)據(jù)Jonckheere-Terpstra檢驗(yàn)法及應(yīng)用》探討了模糊數(shù)據(jù)檢驗(yàn)。廣東財(cái)經(jīng)大學(xué)的劉照德、林海明在《因子分析五個(gè)爭(zhēng)議的解答》中定量分析了因子分析的爭(zhēng)議問(wèn)題。湖南大學(xué)周四軍、王佳星、羅丹在《基于門限面板模型的我國(guó)能源利用效率研究》中,基于柯布―道格拉斯生產(chǎn)函數(shù)理論構(gòu)建了我國(guó)能源利用效率門限面板模型,并進(jìn)行了實(shí)證分析。

      三、統(tǒng)計(jì)方法及實(shí)證研究

      天津財(cái)經(jīng)大學(xué)楊貴軍、孟杰、鄒文慧在《基于模型平均的中國(guó)總和生育率估計(jì)》中指出目前國(guó)內(nèi)學(xué)者對(duì)中國(guó)總和生育率的估計(jì)尚未形成一致性的結(jié)論,缺少高質(zhì)量的數(shù)據(jù)源以及不完善的估計(jì)方法是影響總和生育率估計(jì)的主要問(wèn)題;提出使用社會(huì)和經(jīng)濟(jì)等“人口系統(tǒng)”外部數(shù)據(jù),引入當(dāng)前統(tǒng)計(jì)學(xué)和計(jì)量經(jīng)濟(jì)學(xué)前沿的模型平均方法對(duì)中國(guó)總和生育率進(jìn)行估計(jì)。

      華僑大學(xué)項(xiàng)后軍和浙江財(cái)經(jīng)大學(xué)何康在《自貿(mào)區(qū)的影響與資本流動(dòng)――以上海為例的“自然實(shí)驗(yàn)”估計(jì)》中,從自然實(shí)驗(yàn)角度考察了樣本期內(nèi)上海自貿(mào)區(qū)的設(shè)立對(duì)上海地區(qū)資本流動(dòng)的影響。得出:基于雙重差分模型估計(jì)的自貿(mào)區(qū)對(duì)上海資本流動(dòng)的影響顯著;基于改進(jìn)后合成控制法得到的“合成上海”對(duì)上海設(shè)立自貿(mào)區(qū)之前的模擬程度更高;基于安慰劑檢驗(yàn),證實(shí)了自貿(mào)區(qū)政策的有效性。

      湖南大學(xué)晏艷陽(yáng)、鄧嘉宜、文丹艷在《鄰里效應(yīng)與居民政治信任――基于中國(guó)家庭追蹤調(diào)查(CFPS)的證據(jù)》中,指出近年來(lái)居民對(duì)政府的信任危機(jī)頻發(fā),矛盾不斷出現(xiàn),嚴(yán)重制約著政府的行政效率;基于中國(guó)家庭追蹤調(diào)查(CFPS)截面數(shù)據(jù),建立回歸模型進(jìn)行實(shí)證分析,證實(shí)了其他信息獲取渠道與社會(huì)互動(dòng)之間具有相互替代的關(guān)系,有效解決了關(guān)聯(lián)效應(yīng)和反射性問(wèn)題對(duì)鄰里效應(yīng)估計(jì)帶來(lái)的影響。

      篇(5)

      1 科學(xué)數(shù)據(jù)開放共享中的出版商

      1.1 科學(xué)數(shù)據(jù)開放共享

      在科學(xué)研究過(guò)程中,有不同的利益相關(guān)者參與其中。這些利益相關(guān)者類別多樣,性質(zhì)各異,共同形成科學(xué)研究的生態(tài)系統(tǒng)。根據(jù)各利益相關(guān)者的職能,圍繞研究人員,將這一系統(tǒng)進(jìn)行分類研究,確定出4個(gè)利益相關(guān)者群體,即資助者、數(shù)據(jù)管理者、研究機(jī)構(gòu)與出版商作為關(guān)鍵參與者,以促進(jìn)和實(shí)現(xiàn)科學(xué)研究數(shù)據(jù)的開放共享。

      在這一系統(tǒng)中,每類利益相關(guān)者都有各自不同的職能、驅(qū)動(dòng)力及利益點(diǎn),但總體利益與動(dòng)機(jī)相同,即促進(jìn)科學(xué)的進(jìn)步。利益相關(guān)者的利益與行為動(dòng)機(jī)與各自職能連接在一起,形成了科學(xué)研究系統(tǒng)的邊界。該系統(tǒng)本質(zhì)上受到外部和內(nèi)部因素的雙重影響:外部因素可能表現(xiàn)為政治、社會(huì)、經(jīng)濟(jì)、科學(xué)和文化體系等;內(nèi)部因素包括政治意愿、經(jīng)濟(jì)及學(xué)術(shù)競(jìng)爭(zhēng)、技術(shù)基礎(chǔ)設(shè)施、法律、道德等因素。該系統(tǒng)的價(jià)值與動(dòng)機(jī)是外部和內(nèi)部因素共同作用的結(jié)果,其中外部因素控制資源輸入到該系統(tǒng)中,內(nèi)部因素控制這些資源的可用性和分配。如圖1所示:

      在此科學(xué)開放系統(tǒng)中,利益相關(guān)者群體職能眾多并偶有重疊,總體上各利益相關(guān)方對(duì)研究數(shù)據(jù)的開放獲取的意義已達(dá)成共識(shí),但各利益相關(guān)方對(duì)實(shí)現(xiàn)開放研究數(shù)據(jù)的方式的認(rèn)識(shí)并不一致。本研究主要探討在推動(dòng)科學(xué)數(shù)據(jù)開放共享中,出版商數(shù)據(jù)政策的現(xiàn)狀、問(wèn)題,并構(gòu)建相應(yīng)模型,提出相應(yīng)建議。

      1.2 出版商在科學(xué)數(shù)據(jù)開放共享系統(tǒng)中的目標(biāo)

      在促進(jìn)研究數(shù)據(jù)開放共享方面,各利益相關(guān)方發(fā)揮不同的作用。出版商通過(guò)期刊向作者提供數(shù)據(jù)共享政策,在數(shù)據(jù)開放中發(fā)揮著重要作用。研究出版商的數(shù)據(jù)政策,是因?yàn)檫@是在研究過(guò)程中將數(shù)據(jù)政策與研究人員密切關(guān)聯(lián)起來(lái)的點(diǎn),為研究成果,研究人員有動(dòng)力、有可能遵守?cái)?shù)據(jù)政策。同時(shí),研究發(fā)現(xiàn),雖然包括出資者和研究機(jī)構(gòu)都可能有適用于研究人員的政策,但遵守這些政策的研究人員的比例還很低。研究人員沒(méi)有遵守?cái)?shù)據(jù)政策的直接動(dòng)力;此外研究人員在需要進(jìn)行數(shù)據(jù)存檔時(shí),可能也沒(méi)有合適的機(jī)構(gòu)知識(shí)庫(kù)可以選擇。出版商提出的數(shù)據(jù)政策,是在研究人員完成研究過(guò)程后發(fā)表研究成果前,研究人員有可能、有動(dòng)力遵守出版商的數(shù)據(jù)政策。

      1.2.1 科學(xué)數(shù)據(jù)開放共享的價(jià)值

      科學(xué)的思想與科學(xué)的證據(jù)互相佐證,研究數(shù)據(jù)和科學(xué)實(shí)踐之間的聯(lián)系是不言自明的,因此,推動(dòng)開放獲取研究數(shù)據(jù),與促進(jìn)科學(xué)嚴(yán)謹(jǐn)?shù)哪繕?biāo)相一致。更大程度地共享與獲取數(shù)據(jù),能加強(qiáng)科學(xué)的基礎(chǔ)價(jià)值,即允許科學(xué)研究有效地自我校正,以便二次分析、檢驗(yàn)、質(zhì)疑或改進(jìn)原有成果[3]。此外,開放獲取政策通過(guò)減少重復(fù)工作,最大限度地減少研究人員用在搜索信息和數(shù)據(jù)方面的精力,因而改善了他們的工作條件。

      JISC以英國(guó)高等教育和研究機(jī)構(gòu)為例,指出研究數(shù)據(jù)的監(jiān)護(hù)與開放共享具有如下利益[4]: ①研究人員能夠更廣泛地獲得數(shù)據(jù),從而促進(jìn)更多的跨部門的合作,研究人員在行業(yè)、政府和非政府組織內(nèi)有可能獲得大量的教育和培訓(xùn)機(jī)會(huì)。數(shù)據(jù)的開放共享有助于實(shí)現(xiàn)數(shù)據(jù)使用和重用,降低數(shù)據(jù)的收集和復(fù)制成本,分擔(dān)數(shù)據(jù)收集的直接和間接成本(如避免調(diào)查疲勞,從而提高響應(yīng)率等),創(chuàng)造出在數(shù)據(jù)收集時(shí)未曾預(yù)想到的新的利用方式,進(jìn)行數(shù)據(jù)挖掘等。②在項(xiàng)目申請(qǐng)撥款和評(píng)估階段、出版和研究評(píng)估階段,更容易發(fā)現(xiàn)欺詐和抄襲,更容易進(jìn)行評(píng)估和同行審查。因此將有機(jī)會(huì)創(chuàng)造更加完整和透明的科學(xué)記錄。③通過(guò)將研究人員、知識(shí)庫(kù)、資助者與有價(jià)值的資源相鏈接,從而有更多的機(jī)會(huì)提高研究的可見度。

      科學(xué)研究系統(tǒng)中的各個(gè)利益相關(guān)者群體認(rèn)識(shí)到走向開放數(shù)據(jù)的利益,認(rèn)同將數(shù)據(jù)的開放共享置于戰(zhàn)略高度進(jìn)行考慮。科學(xué)表現(xiàn)為知識(shí)積累的過(guò)程,數(shù)據(jù)在促進(jìn)早期工作中起著重要作用。開放獲取研究數(shù)據(jù),通過(guò)避免重復(fù)勞動(dòng),促進(jìn)協(xié)作,有助于顯著加快這一科學(xué)過(guò)程,從整體上使科學(xué)成為更加透明的進(jìn)程,實(shí)現(xiàn)推動(dòng)公眾參與,激勵(lì)創(chuàng)新和改革公共服務(wù)的宗旨[5]。

      1.2.2 基本情況

      出版商作為利益相關(guān)者,越來(lái)越關(guān)注數(shù)據(jù)密集型研究,認(rèn)同開放獲取研究數(shù)據(jù)的意義。很多出版商認(rèn)同布魯塞爾宣言,即“所有的研究者應(yīng)能自由地獲取原始研究數(shù)據(jù)。出版商鼓勵(lì)公開公布原始研究數(shù)據(jù)結(jié)果,將相關(guān)的數(shù)據(jù)集及子數(shù)據(jù)集與論文共同提交給期刊,應(yīng)盡可能讓其他研究人員自由獲取”[6]。很多出版商的數(shù)據(jù)政策為強(qiáng)制性政策,要求作者將支持出版物的研究數(shù)據(jù)存儲(chǔ)在經(jīng)認(rèn)證的知識(shí)庫(kù)中,實(shí)現(xiàn)開放獲取。研究表明,如果期刊具有強(qiáng)制性數(shù)據(jù)政策,并且有可獲取數(shù)據(jù)的聲明,那么在線找到該數(shù)據(jù)的可能性,幾乎是沒(méi)有類似政策的期刊的1 000倍[7]。

      盡管目前出版商已開始重視出版物的開放獲取,將開放獲取作為一種出版的商業(yè)模式,不過(guò)出版商參與研究數(shù)據(jù)的出版,特別是開放獲取研究數(shù)據(jù),目前尚未形成規(guī)模。出版商關(guān)注研究數(shù)據(jù)及其開放,重要原因在于數(shù)據(jù)為出版商的主要產(chǎn)品即出版物增加了價(jià)值,數(shù)據(jù)有助于驗(yàn)證研究成果,從而增強(qiáng)了所發(fā)表研究成果的可信性,而可信度對(duì)于研究具有重要意義[2]。此外,資助機(jī)構(gòu)的政策要求公開獲取研究數(shù)據(jù),實(shí)質(zhì)上向出版商施加了壓力,出版商需要參與到研究數(shù)據(jù)開放獲取中,幫助作者和研究機(jī)構(gòu)符合出資人的要求。現(xiàn)在,領(lǐng)先發(fā)展的出版商開始與其他利益相關(guān)方合作,試圖挖掘研究數(shù)據(jù)的潛能,形成以數(shù)據(jù)為基礎(chǔ)的新產(chǎn)品和服務(wù),對(duì)研究數(shù)據(jù)進(jìn)行同行評(píng)議,開展提高數(shù)據(jù)質(zhì)量的其他服務(wù)。

      2 出版商主要數(shù)據(jù)管理政策

      本研究根據(jù)STM的年度報(bào)告[8],確定出以下出版商為主要分析對(duì)象(見表1)。這十大出版商所出版期刊占到2014年所有出版期刊的45.2%,另外本研究將開放獲取出版商,科學(xué)公共圖書館(PLoS)、生物醫(yī)學(xué)中心(BioMed Central)的數(shù)據(jù)開放政策考慮在內(nèi)。

      2.1 出版商數(shù)據(jù)政策現(xiàn)狀

      2.1.1 將開放獲取作為默認(rèn)情況

      出版商將數(shù)據(jù)的開放獲取作為訂立政策的基礎(chǔ),如PLOS研究數(shù)據(jù)開放獲取強(qiáng)制性政策[9],指出除了極少數(shù)例外情況,支持PLOS出版物的所有研究數(shù)據(jù)都必須開放獲取。作者在向PLOS提交稿件時(shí),要同時(shí)提交數(shù)據(jù)可用性聲明,在聲明中表明遵守PLOS的政策規(guī)定,在手稿成功提交后,數(shù)據(jù)作為最終手稿的部分內(nèi)容。PLOS要求作者將數(shù)據(jù)存儲(chǔ)于推薦的經(jīng)認(rèn)證的數(shù)據(jù)中心或知識(shí)庫(kù)。小數(shù)據(jù)集可與稿件一并上傳。PLOS的編輯和投稿指南,向研究人員提供指導(dǎo),協(xié)助研究人員遵守期刊開放數(shù)據(jù)政策。在限制數(shù)據(jù)獲取的情況下,PLOS有權(quán)修正說(shuō)明,聯(lián)系作者的機(jī)構(gòu)或資助者,甚至撤銷出版。

      2.1.2 新的出版形式的出現(xiàn)

      出版界越來(lái)越關(guān)注開放數(shù)據(jù),產(chǎn)生了一種新型出版產(chǎn)品,即數(shù)據(jù)期刊。數(shù)據(jù)期刊的出現(xiàn),與數(shù)據(jù)可以單獨(dú)緊密相關(guān)。數(shù)據(jù)的單獨(dú)可以確保數(shù)據(jù)作為科學(xué)記錄的基本組成部分,以可理解的形式向科學(xué)界提供。數(shù)據(jù)期刊是同行評(píng)議的開放獲取平臺(tái),用于、分享和傳播各學(xué)科的數(shù)據(jù)。發(fā)表的數(shù)據(jù)論文包含數(shù)據(jù)集的具體相關(guān)信息,如收集、處理方式等。發(fā)表的數(shù)據(jù)論文與認(rèn)可的知識(shí)庫(kù)互相關(guān)聯(lián),數(shù)據(jù)論文引用存儲(chǔ)于知識(shí)庫(kù)或數(shù)據(jù)中心中的數(shù)據(jù)集。正如澳大利亞國(guó)家數(shù)據(jù)服務(wù)中心(ANDS)在其數(shù)據(jù)期刊指南中所指出的,“從根本上說(shuō),數(shù)據(jù)期刊尋求促進(jìn)科學(xué)認(rèn)證和再利用,提高科學(xué)方法和結(jié)果的透明度,支持良好的數(shù)據(jù)管理方法,并為數(shù)據(jù)集提供一個(gè)可訪問(wèn)的、永久的、可解析的路徑”。ANDS指出,數(shù)據(jù)論文的出版過(guò)程包括對(duì)數(shù)據(jù)集的同行評(píng)議,最大限度地提高了數(shù)據(jù)再利用的機(jī)會(huì),并為研究人員提供了學(xué)術(shù)認(rèn)可的可能性[10]。

      2.1.3 同行評(píng)審

      對(duì)研究數(shù)據(jù)與數(shù)據(jù)出版物開放獲取的關(guān)注,彰顯了研究數(shù)據(jù)的科學(xué)質(zhì)量及研究數(shù)據(jù)同行評(píng)審的重要意義。在此背景下,一些出版商將同行評(píng)議的范圍擴(kuò)大到包括數(shù)據(jù)在內(nèi)的同行評(píng)審。M. S. Mayernik等2014年進(jìn)行了有關(guān)“數(shù)據(jù)同行評(píng)審”的研究,提出因?yàn)槌霭嫖锘蛸Y源類型有所不同,進(jìn)行同行評(píng)審的方式也必須有所變化。研究者對(duì)幾種類型的評(píng)審資源進(jìn)行了區(qū)分,包括在傳統(tǒng)科學(xué)論文中分析的數(shù)據(jù),在傳統(tǒng)科學(xué)期刊上的數(shù)據(jù)文章,以及通過(guò)數(shù)據(jù)期刊的開放獲取知識(shí)庫(kù)與數(shù)據(jù)集。M. S. Mayernik等針對(duì)數(shù)據(jù)的同行評(píng)審、數(shù)據(jù)的質(zhì)量保證過(guò)程確定了一些共同因素,包括:可通過(guò)數(shù)據(jù)中心或知識(shí)庫(kù)獲取數(shù)據(jù)集;數(shù)據(jù)集有足夠的信息以備評(píng)審;期刊有明確的方針指明審核的要點(diǎn),指導(dǎo)評(píng)審者進(jìn)行數(shù)據(jù)審查等[11]。

      開放考古學(xué)雜志(JOAD[12-13])對(duì)所有提交的數(shù)據(jù)論文采用同行評(píng)審程序,評(píng)審內(nèi)容包括論文的內(nèi)容與存儲(chǔ)的數(shù)據(jù)。論文的內(nèi)容指與數(shù)據(jù)集的建立和重用相關(guān)的信息,以及對(duì)數(shù)據(jù)集的描述。存儲(chǔ)的數(shù)據(jù)指以可持續(xù)性模式提交到存儲(chǔ)庫(kù)的數(shù)據(jù),包括其許可方式。

      2.1.4 數(shù)據(jù)引用

      除對(duì)數(shù)據(jù)進(jìn)行同行評(píng)審?fù)猓霭嫔踢€逐步引入數(shù)據(jù)引用政策,以促進(jìn)研究數(shù)據(jù)的標(biāo)準(zhǔn)化使用。研究數(shù)據(jù)對(duì)研究過(guò)程具有重要價(jià)值與意義,為擴(kuò)大高質(zhì)量研究數(shù)據(jù)的傳播,形成數(shù)據(jù)利用的規(guī)范方式,F(xiàn)ORCE11[14]制定了數(shù)據(jù)引用的主要原則。FORCE11的引用原則的前提是數(shù)據(jù)引用需要實(shí)現(xiàn)人類和機(jī)器均可讀。該數(shù)據(jù)引用原則可能并不全面,主要目的是鼓勵(lì)各學(xué)科制定體現(xiàn)自身特點(diǎn)的引用方式。

      FORCE11原則包括:說(shuō)明數(shù)據(jù)引用的重要性;通過(guò)數(shù)據(jù)引用促進(jìn)學(xué)術(shù)信用;數(shù)據(jù)引用要實(shí)現(xiàn)機(jī)器可操作性,包括全球永久唯一標(biāo)識(shí)符;數(shù)據(jù)引用要促進(jìn)對(duì)數(shù)據(jù)本身的獲取;數(shù)據(jù)引用應(yīng)該具有持久性;便于識(shí)別,易于獲取,可以驗(yàn)證;具有互操作、靈活性等特點(diǎn)。

      2.1.5 內(nèi)容發(fā)現(xiàn)和鏈接服務(wù)

      出版商逐漸把發(fā)展方向轉(zhuǎn)移到內(nèi)容發(fā)現(xiàn)和鏈接服務(wù),專注于文本與數(shù)據(jù)挖掘(TDM)工具,以便能開發(fā)內(nèi)容,進(jìn)而提供相關(guān)服務(wù)。出版商越來(lái)越關(guān)注數(shù)據(jù)挖掘是研究人員利用大型數(shù)據(jù)庫(kù)的內(nèi)容、數(shù)據(jù)和出版物的需求的直接結(jié)果。一份文本和數(shù)據(jù)挖掘?qū)<倚〗M的報(bào)告指出,TDM是一種重要技術(shù),可用于從指數(shù)級(jí)增長(zhǎng)的數(shù)字?jǐn)?shù)據(jù)中,分析和提取新的見解和知識(shí)[15]。該報(bào)告的結(jié)論是,因?yàn)檠芯咳藛T的技能和技術(shù)不斷提升,所研究的數(shù)據(jù)集的復(fù)雜性、多樣性及規(guī)模不斷擴(kuò)大,因此TDM有可能會(huì)更加重要。但對(duì)于利用文本與數(shù)據(jù)挖掘工具是否應(yīng)有所限制,目前仍有爭(zhēng)議。

      2.2 期刊數(shù)據(jù)政策問(wèn)題

      2.2.1 數(shù)據(jù)格式與文件大小的差異

      期刊要包括支持文章結(jié)果的所有數(shù)據(jù),往往是很難實(shí)現(xiàn)的。研究的方法不同,產(chǎn)生的數(shù)據(jù)也大不相同,數(shù)據(jù)的格式和文件大小差異巨大。定性研究生成的數(shù)據(jù),多以文本形式存在,例如實(shí)地觀察筆記,或采訪或報(bào)道的文字記錄等。定量研究生成的數(shù)據(jù),多以電子表格的形式保存。一項(xiàng)研究可能產(chǎn)生多種類型的數(shù)據(jù),而論文可能包括附加文本、數(shù)值數(shù)據(jù)集和數(shù)字圖像,這些都可能增加論文的大小。因此出版商表現(xiàn)出對(duì)集成到每篇論文中的數(shù)據(jù)集大小的關(guān)注。某些出版商開始嘗試出版在線期刊文章,以包括多種數(shù)據(jù),例如愛(ài)思唯爾的有關(guān)未來(lái)的文章的探索[16]。然而,并不是每一種期刊都有包括各種數(shù)據(jù)的能力。這就要求期刊的辦刊方針應(yīng)清楚說(shuō)明,作為論文組成部分的數(shù)據(jù),在何種程度上可以包括在論文中。

      2.2.2 機(jī)構(gòu)知識(shí)庫(kù)的成本

      為解決出版商服務(wù)器超載的問(wèn)題,將期刊文章的重要數(shù)據(jù)鏈接到一個(gè)特定的機(jī)構(gòu)知識(shí)庫(kù),可能是一個(gè)合理的選擇,但這將相關(guān)的長(zhǎng)期運(yùn)營(yíng)成本轉(zhuǎn)嫁到了機(jī)構(gòu)中。但資助者目前的基金中并不包括這部分資金,而機(jī)構(gòu)可能也并不愿意在當(dāng)前的管理費(fèi)用中增加這種支出。這就使得在機(jī)構(gòu)知識(shí)庫(kù)中存儲(chǔ)科學(xué)數(shù)據(jù)的可持續(xù)性有待探討。

      2.2.3 研究人員對(duì)數(shù)據(jù)開放的認(rèn)識(shí)

      許多研究人員并不知道相關(guān)的知識(shí)庫(kù),為此期刊數(shù)據(jù)政策應(yīng)說(shuō)明,數(shù)據(jù)是否應(yīng)該在認(rèn)可的知識(shí)庫(kù)中存儲(chǔ),是否要使用永久統(tǒng)一資源定位符(URL),是否要采用某種形式的數(shù)據(jù)引用。數(shù)據(jù)的時(shí)間也是一個(gè)需要關(guān)注的問(wèn)題,研究人員并不關(guān)心在出版過(guò)程中的什么時(shí)候數(shù)據(jù)可被公開訪問(wèn),而是關(guān)心在研究過(guò)程中何時(shí)數(shù)據(jù)應(yīng)被公開訪問(wèn)。研究論文并不是在研究結(jié)果全部產(chǎn)生后才會(huì)形成,而是在研究過(guò)程中逐步產(chǎn)生的。在的同時(shí),是否適合研究數(shù)據(jù)取決于多種因素,諸如某些形式的數(shù)據(jù)有敏感性,要保護(hù)受試者等因素。

      3 構(gòu)建期刊研究數(shù)據(jù)策略模型框架

      3.1 出版商期刊政策的基本要求

      有效的政策制定過(guò)程必然需要將注意力集中于數(shù)據(jù)共享過(guò)程中各利益相關(guān)方的意見,而目前的數(shù)字基礎(chǔ)設(shè)施在不斷變化,出版商、知識(shí)庫(kù)和系統(tǒng)之間,并沒(méi)有強(qiáng)有力的措施鼓勵(lì)共享數(shù)據(jù)。共同點(diǎn)包括:①出版商共享數(shù)據(jù)的方式差異很大;②在出版過(guò)程中,出版商對(duì)所接受的數(shù)據(jù)類型、數(shù)據(jù)應(yīng)存儲(chǔ)的地點(diǎn)、應(yīng)存儲(chǔ)的時(shí)間等說(shuō)明,模糊不清;③研究人員普遍贊成共享數(shù)據(jù),但研究人員不知道該如何克服共享障礙;④研究人員認(rèn)為出版商和期刊有關(guān)數(shù)據(jù)格式和存放地點(diǎn)等清晰的政策,將有益于研究;⑤出版商也認(rèn)為在數(shù)據(jù)的關(guān)聯(lián)與嵌入方面存在障礙。

      科學(xué)數(shù)據(jù)共享的許多問(wèn)題,能夠在出版過(guò)程中通過(guò)期刊強(qiáng)有力而明確的政策加以解決。因此,本研究的目標(biāo)是確定能推薦給期刊使用的政策模型。研究收集到的期刊政策信息,對(duì)材料進(jìn)行分析后,歸納出目前主要的政策要求,如表2所示:

      3.2 框架模型

      基于以上所列出的觀察,形成基本的期刊研究數(shù)據(jù)政策的模型框架。由資助者和研究機(jī)構(gòu)作為一方,與出版商的另一方進(jìn)行合作,發(fā)展數(shù)據(jù)政策。表3為所構(gòu)建的期刊研究數(shù)據(jù)策略模型框架。

      3.3 實(shí)施方式

      3.3.1 逐步制定出版物的支持性數(shù)據(jù)的強(qiáng)制性開放共享政策

      出版商應(yīng)該支持期刊編輯制定研究數(shù)據(jù)的強(qiáng)制性政策,從而提高研究過(guò)程透明度,擴(kuò)展研究數(shù)據(jù)的潛力。數(shù)據(jù)的編輯政策應(yīng)解決諸如文檔、元數(shù)據(jù)、數(shù)據(jù)出版格式、許可、引用等問(wèn)題。編輯政策要求作者在文章提交過(guò)程和同行評(píng)議過(guò)程中,提交數(shù)據(jù)的可用性描述。對(duì)提交的文章不符合規(guī)定的情況,政策應(yīng)提出對(duì)應(yīng)的措施,如撤銷發(fā)表的文章。

      3.3.2 與認(rèn)證知識(shí)庫(kù)和數(shù)據(jù)中心協(xié)作,簡(jiǎn)化數(shù)據(jù)提交流程

      出版商可按照相關(guān)標(biāo)準(zhǔn)考查知識(shí)庫(kù)與數(shù)據(jù)中心的可信度,與符合數(shù)據(jù)認(rèn)證標(biāo)準(zhǔn)的數(shù)據(jù)中心與知識(shí)庫(kù)協(xié)作。類似的知識(shí)庫(kù)或數(shù)據(jù)中心可以是主題明確的學(xué)科知識(shí)庫(kù),也可以是機(jī)構(gòu)知識(shí)庫(kù)或綜合知識(shí)庫(kù)。二者的合作應(yīng)該會(huì)產(chǎn)生積極影響,為研究人員和研究機(jī)構(gòu)提供高品質(zhì)的產(chǎn)品和服務(wù),服務(wù)具有可操作性、技術(shù)上無(wú)縫的特點(diǎn),從而實(shí)現(xiàn)以開放格式傳播和保存高質(zhì)量的學(xué)術(shù)產(chǎn)品和研究數(shù)據(jù)。對(duì)于沒(méi)有公認(rèn)的數(shù)據(jù)中心或知識(shí)庫(kù)的學(xué)科,出版商對(duì)研究人員提供指導(dǎo)和幫助,提供適合存儲(chǔ)與獲取的機(jī)構(gòu)知識(shí)庫(kù)建議,或提供商業(yè)數(shù)據(jù)服務(wù)。在這方面,出版商的角色應(yīng)該是更多地促使學(xué)術(shù)團(tuán)體建立資源庫(kù)評(píng)估準(zhǔn)則,從而幫助研究人員選擇合適的存儲(chǔ)庫(kù)。當(dāng)學(xué)術(shù)界建立起知識(shí)庫(kù)的認(rèn)可標(biāo)準(zhǔn),出版商就可以通過(guò)期刊政策執(zhí)行這些標(biāo)準(zhǔn)。

      3.3.3 數(shù)據(jù)作為一流學(xué)術(shù)成果,接受同行評(píng)議

      出版商的主要職責(zé)之一是確保出版物的高質(zhì)量,而研究數(shù)據(jù)同行評(píng)審制度的建立,有助于提升出版產(chǎn)品的品質(zhì)。同行評(píng)審過(guò)程,應(yīng)詳細(xì)說(shuō)明評(píng)審的標(biāo)準(zhǔn),要評(píng)估研究數(shù)據(jù)的技術(shù)與質(zhì)量問(wèn)題,技術(shù)方面如考量數(shù)據(jù)集的完整性和一致性,收集數(shù)據(jù)的標(biāo)準(zhǔn),使用的軟件等;研究數(shù)據(jù)的科學(xué)質(zhì)量則由研究團(tuán)體通過(guò)出版前與出版后的同行評(píng)審進(jìn)行評(píng)估。同行評(píng)審流程中,出版商也應(yīng)該探索對(duì)評(píng)審者的激勵(lì)方式,包括支付酬金,邀請(qǐng)編寫特稿,加入編輯委員會(huì),甚至聘用一些專家進(jìn)行內(nèi)容評(píng)審。

      3.3.4 發(fā)展有關(guān)研究數(shù)據(jù)引用的策略

      研究數(shù)據(jù)通過(guò)傳統(tǒng)的出版過(guò)程傳播,為實(shí)現(xiàn)數(shù)據(jù)的長(zhǎng)期可重用,需建立并使用數(shù)據(jù)的引用標(biāo)準(zhǔn)。在這方面,出版商應(yīng)要求出版物及相關(guān)的數(shù)據(jù)可引用,并為數(shù)據(jù)的引用提供明確指導(dǎo)。在說(shuō)明數(shù)據(jù)引用時(shí),出版商可參照一些已有的實(shí)踐,如Force11[14]的原則,參與DataCite[17],加入到研究界和編輯討論的過(guò)程中。數(shù)據(jù)引用應(yīng)包括DOI,以及使用許可信息,如創(chuàng)作共用許可,數(shù)據(jù)的引用方式最好是機(jī)器可操作的,可讓用戶知道可以如何處理研究數(shù)據(jù)。

      3.3.5 建立許可政策鼓勵(lì)進(jìn)行文本數(shù)據(jù)挖掘

      出版商的編輯政策應(yīng)以清晰的方式,說(shuō)明研究數(shù)據(jù)的與獲取方式,如默認(rèn)或建議開放獲取等。考慮到文本數(shù)據(jù)挖掘工具可帶來(lái)顯著經(jīng)濟(jì)效益,鼓勵(lì)出版商調(diào)整策略,允許研究人員在研究中使用這種技術(shù)。

      篇(6)

      二、數(shù)據(jù)驅(qū)動(dòng)的高校教育管理智能平臺(tái)架構(gòu)

      在海量教育數(shù)據(jù)亟待有效利用的驅(qū)動(dòng)下,為提高高校管理效益,將商業(yè)智能技術(shù)應(yīng)用到高校教育管理中,對(duì)高校產(chǎn)生的大量數(shù)據(jù)用數(shù)據(jù)挖掘等商業(yè)智能技術(shù)進(jìn)行分析研究與處理,可以幫助高校決策者做出對(duì)學(xué)校發(fā)展更為有利的科學(xué)決策。其關(guān)鍵是建立綜合層面上的、能反映高校整體教育教學(xué)管理的信息集成系統(tǒng)平臺(tái)(下文簡(jiǎn)稱高校BI系統(tǒng)平臺(tái))。高校BI系統(tǒng)平臺(tái)體系架構(gòu)由數(shù)據(jù)源、數(shù)據(jù)存儲(chǔ)與管理層、數(shù)據(jù)分析層和用戶接口層組成,如圖1所示。

      (一)數(shù)據(jù)源

      數(shù)據(jù)源是整個(gè)系統(tǒng)的基礎(chǔ),包括高校各類業(yè)務(wù)管理信息系統(tǒng)的內(nèi)部數(shù)據(jù)和其他外部數(shù)據(jù)。內(nèi)部數(shù)據(jù)包括存放于操作型數(shù)據(jù)庫(kù)中的各種業(yè)務(wù)數(shù)據(jù)和辦公自動(dòng)化系統(tǒng)包含的各類文檔數(shù)據(jù),如學(xué)校財(cái)務(wù)處、人事處、教務(wù)處、科研處、設(shè)備處等部門數(shù)據(jù)庫(kù)中業(yè)務(wù)數(shù)據(jù);外部信息包括各類教育信息、外部統(tǒng)計(jì)和調(diào)研數(shù)據(jù)及文檔等。

      (二)數(shù)據(jù)存儲(chǔ)與管理

      數(shù)據(jù)存儲(chǔ)與管理層是整個(gè)系統(tǒng)的核心,包括ETL管理工具、公共數(shù)據(jù)集、元數(shù)據(jù)、數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)集市。高校BI系統(tǒng)平臺(tái)建設(shè)采用數(shù)據(jù)驅(qū)動(dòng)設(shè)計(jì)方法,從學(xué)校原有的各個(gè)部門的業(yè)務(wù)處理系統(tǒng)和外部數(shù)據(jù)源中經(jīng)過(guò)ETL提取數(shù)據(jù),并根據(jù)常見的分析和統(tǒng)計(jì)主題,建設(shè)校級(jí)數(shù)據(jù)倉(cāng)庫(kù)以及人才培養(yǎng)、師資隊(duì)伍、科學(xué)研究、辦學(xué)資源、交流合作等主題的數(shù)據(jù)集市。

      (三)數(shù)據(jù)查詢與分析

      高校決策者常常希望從不同的角度審視教育數(shù)據(jù),比如從時(shí)間、區(qū)域、學(xué)科、教學(xué)或科研成果、課程建設(shè)、學(xué)生層次、交流合作、辦學(xué)資源等維度全面了解學(xué)校的教育質(zhì)量和狀態(tài)。高校BI系統(tǒng)平臺(tái)的數(shù)據(jù)分析層利用商業(yè)智能技術(shù)為高校管理主要提供固定報(bào)表、即席查詢、統(tǒng)計(jì)分析、多維分析、預(yù)警功能、預(yù)測(cè)分析、數(shù)據(jù)挖掘建模分析及優(yōu)化分析等,根據(jù)學(xué)校現(xiàn)有學(xué)生、教師、資源、科研和人才培養(yǎng)等狀況,有助于高校決策者全面地對(duì)學(xué)校資源配置進(jìn)行調(diào)控、對(duì)學(xué)校整體辦學(xué)信息的內(nèi)部結(jié)構(gòu)進(jìn)行調(diào)整等,做出對(duì)學(xué)校發(fā)展更為有利的科學(xué)決策。

      (四)用戶接口

      用戶接口層根據(jù)高校用戶訪問(wèn)需求和角色訪問(wèn)授權(quán)機(jī)制,提供強(qiáng)大的多用戶數(shù)據(jù)查詢操作,并以儀表盤或表格、直方圖、餅圖等直觀方式將查詢結(jié)果或決策信息呈現(xiàn)給用戶。

      三、應(yīng)用案例

      下面以高校BI系統(tǒng)平臺(tái)中的調(diào)研數(shù)據(jù)為商業(yè)智能技術(shù)應(yīng)用案例,利用回歸方法對(duì)大學(xué)生學(xué)習(xí)成果進(jìn)行數(shù)據(jù)挖掘分析。

      (一)數(shù)據(jù)來(lái)源

      案例分析的數(shù)據(jù)來(lái)源于高校BI系統(tǒng)平臺(tái)中“中山大學(xué)學(xué)生學(xué)習(xí)狀況調(diào)查”項(xiàng)目于2012在中山大學(xué)全校范圍內(nèi)開展的在線調(diào)研數(shù)據(jù)。[13]調(diào)查覆蓋全校36個(gè)學(xué)院(系),調(diào)查總體約為3.3萬(wàn)名本科生。讓學(xué)生在無(wú)壓力的情況下答題,共回收問(wèn)卷7051份,回收率約為21.2%,與國(guó)際上通用的問(wèn)卷回收率相當(dāng)。案例分析聚焦于本科樣本,全部回收的問(wèn)卷根據(jù)答題時(shí)長(zhǎng)、問(wèn)卷質(zhì)量標(biāo)準(zhǔn)等原則,篩選出有效問(wèn)卷數(shù)據(jù)6673份,有效率為94.6%。本研究從學(xué)生學(xué)習(xí)經(jīng)歷角度,在“生源-學(xué)習(xí)-成果”的邏輯框架中,考察分析學(xué)校因素和學(xué)生因素對(duì)于學(xué)生學(xué)習(xí)成果的影響機(jī)制。調(diào)查把學(xué)生學(xué)習(xí)經(jīng)歷和成果分解為生源情況、學(xué)校學(xué)習(xí)資源供給、學(xué)生與學(xué)校的融合、學(xué)生學(xué)習(xí)投入、學(xué)生成果、學(xué)校成果6大維度,各維度下題目的內(nèi)部一致性均達(dá)到0.9以上,具有較高的信度。

      (二)數(shù)據(jù)分析

      逐步回歸提供了一種識(shí)別與學(xué)生學(xué)習(xí)成果相關(guān)的具體經(jīng)歷的方法,對(duì)于學(xué)生學(xué)習(xí)狀況調(diào)查中的227項(xiàng)進(jìn)行相似項(xiàng)合并,用向前和向后逐步回歸確定與學(xué)習(xí)成果相關(guān)的項(xiàng)目,對(duì)殘差圖和診斷法的徹底審查,最后確定17個(gè)獨(dú)立變量出現(xiàn)在多元回歸模型中(如表2所示),其中,相關(guān)系數(shù)R為0.994,校正判定系數(shù)R2為0.988,因變量變化中有98.8%左右的信息可以由預(yù)測(cè)變量解釋,說(shuō)明模型的擬合優(yōu)度較好;Durbin-Watson為1.937,接近最佳理想值,如表1所示。表2顯示的是回歸系數(shù)的相關(guān)統(tǒng)計(jì)量,可以看出,這17個(gè)獨(dú)立變量的顯著性概率Sig.都小于0.05,說(shuō)明其系數(shù)顯著不為0,這17個(gè)變量均與學(xué)生學(xué)習(xí)成果顯著相關(guān)。分析表2中的數(shù)據(jù)可以看出,學(xué)生學(xué)習(xí)經(jīng)歷中的學(xué)校學(xué)習(xí)資源提供、學(xué)生學(xué)習(xí)投入和校園文化及學(xué)校成果等四大維度的17個(gè)變量均為影響學(xué)生學(xué)習(xí)成果的重要預(yù)測(cè)變量,包括課程作業(yè)評(píng)價(jià)、專業(yè)學(xué)習(xí)經(jīng)歷評(píng)價(jià)、學(xué)術(shù)規(guī)范指導(dǎo)、平等文化、多元能力的培養(yǎng)氛圍等學(xué)校因素變量,以及朋輩交流情況、自主學(xué)習(xí)情況、活動(dòng)參與情況、課外閱讀情況、論文寫作情況、討論關(guān)注的內(nèi)容情況、師生交流、課業(yè)活動(dòng)及個(gè)人閑暇活動(dòng)時(shí)間分配等學(xué)生因素變量。同時(shí),在校經(jīng)歷滿意度、綜合滿意度和能力培養(yǎng)滿意度等融合學(xué)校因素和學(xué)生因素的學(xué)校成果也對(duì)學(xué)生學(xué)習(xí)成果具有一定的影響。通過(guò)標(biāo)準(zhǔn)系數(shù)可以看出,朋輩交流情況、自主學(xué)習(xí)情況和討論關(guān)注的內(nèi)容情況分別是第一、第二和第三重要的預(yù)測(cè)變量,而性別、年級(jí)、所在校區(qū)等人口學(xué)變量并未出現(xiàn)在該回歸分析模型中,對(duì)學(xué)生學(xué)習(xí)成果的影響不顯著。進(jìn)一步分析朋輩交流情況和自主學(xué)習(xí)情況調(diào)查指標(biāo)應(yīng)答概況,如表3所示,“有時(shí)”、“時(shí)常”或“頻繁”進(jìn)行朋輩交流的比例為63.7%~97.7%,自主學(xué)習(xí)的比例為52.5%~92.9%,朋輩交流和自主學(xué)習(xí)的平均比例相當(dāng)高(81.8%)。“有時(shí)”、“時(shí)常”或“頻繁”地進(jìn)行朋輩交流方面的主要比例情況為:“與家庭背景(社會(huì)、經(jīng)濟(jì)的)不同的同學(xué)交流”為97.7%、“與興趣不同的同學(xué)交流”為95.6%、“在與同學(xué)的談話中得到啟發(fā),改變自己的想法”為94.4%、“與世界觀、價(jià)值觀不同的同學(xué)交流”為93%、“與不同專業(yè)的同學(xué)交流”為92.6%、“同學(xué)與你談話后,表示受到了你的啟發(fā)”為90.8%。“有時(shí)”、“時(shí)常”或“頻繁”地進(jìn)行自主學(xué)習(xí)的主要比例情況為:“利用圖書館、網(wǎng)絡(luò)等資源豐富自己的學(xué)識(shí)”為92.9%、“根據(jù)課程安排,做課堂展示”為91.3%、“努力掌握對(duì)自己而言較難的課程內(nèi)容”為91.3%、“隨著學(xué)習(xí)經(jīng)歷的豐富不斷整合、梳理自己的知識(shí)系統(tǒng)”為88.4%,“因課程設(shè)置和教師的要求具有挑戰(zhàn)性而更加努力地學(xué)習(xí)”為85.9%。上述情形符合VincentTinto在研究大學(xué)生退學(xué)問(wèn)題時(shí)提出的理論模型:學(xué)生取得較好的學(xué)習(xí)成果,依賴于他們?cè)趯W(xué)習(xí)經(jīng)歷中能否將自身的經(jīng)驗(yàn)和目標(biāo)與學(xué)校系統(tǒng)內(nèi)部的學(xué)術(shù)系統(tǒng)和社交系統(tǒng)相融合。[10]學(xué)術(shù)系統(tǒng)代表學(xué)生個(gè)人的課業(yè)表現(xiàn)、智力發(fā)展、學(xué)業(yè)成就等綜合表現(xiàn),如表2中自主學(xué)習(xí)情況、活動(dòng)參與情況、課外閱讀情況、論文寫作情況、討論關(guān)注的內(nèi)容情況及課業(yè)活動(dòng)等屬于學(xué)術(shù)系統(tǒng)的范疇。社交系統(tǒng)代表學(xué)生在校內(nèi)的同伴關(guān)系、師生關(guān)系、社交行為等綜合表現(xiàn),如朋輩交流情況、師生交流及個(gè)人閑暇活動(dòng)時(shí)間分配等屬于社交系統(tǒng)的范疇。學(xué)生在其學(xué)習(xí)經(jīng)歷中,有效地利用學(xué)習(xí)資源和校園文化氛圍、將學(xué)術(shù)系統(tǒng)和社交系統(tǒng)進(jìn)行整合,可以從學(xué)業(yè)和人際關(guān)系上自我提升,從而提高學(xué)習(xí)成果。

      篇(7)

      2.1Web數(shù)據(jù)挖掘概述

      數(shù)據(jù)挖掘(DataMining)是從大量的、不完全的、有噪聲的、模糊的和隨機(jī)的數(shù)據(jù)中提取人們事先不知道的、潛在有用的信息和知識(shí)的非平凡過(guò)程。

      Web數(shù)據(jù)挖掘(WebMining)是從Web文檔和Web活動(dòng)中抽取感興趣的、潛在的有用模式和隱藏的信息,是數(shù)據(jù)庫(kù)、數(shù)據(jù)挖掘、人工智能、信息檢索、自然語(yǔ)言理解等技術(shù)的綜合應(yīng)用,是在一定基礎(chǔ)上應(yīng)用數(shù)據(jù)挖掘的方法以發(fā)現(xiàn)有用的知識(shí)來(lái)幫助人們從WWW中提取知識(shí)。Web數(shù)據(jù)挖掘可以分為Web內(nèi)容挖掘(WebContentMining)、Web結(jié)構(gòu)挖掘(WebStructureMining)、Web使用記錄挖掘(WebUsageMining)三類。Web內(nèi)容挖掘是指從文檔內(nèi)容或其描述中抽取知識(shí)的過(guò)程,又可以分為基于文本的挖掘和基于多媒體的挖掘兩種。Web文本挖掘可以對(duì)Web上大量文檔集合的內(nèi)容進(jìn)行總結(jié)、分類、聚類、關(guān)聯(lián)分析等。Web結(jié)構(gòu)挖掘是指從Web組織結(jié)構(gòu)和鏈接關(guān)系中推導(dǎo)知識(shí)。通過(guò)對(duì)Web結(jié)構(gòu)的挖掘,可以用來(lái)指導(dǎo)對(duì)頁(yè)面進(jìn)行分類和聚類,找到權(quán)威頁(yè)面,從而提高檢索的性能,同時(shí)還可以用來(lái)指導(dǎo)網(wǎng)頁(yè)采集工作,提高采集效率。Web使用記錄挖掘是指從服務(wù)器端記錄的客戶訪問(wèn)日志或從客戶的瀏覽信息中抽取感興趣的模式。

      基于Web的數(shù)據(jù)挖掘技術(shù)的出現(xiàn)不僅為商家做出正確的商業(yè)決策提供了強(qiáng)有力的工具,也為商家更加深入地了解客戶需求信息和購(gòu)物行為的特征提供了可能性。

      2.2電子商務(wù)中Web數(shù)據(jù)挖掘的步驟

      電子商務(wù)中Web數(shù)據(jù)挖掘的步驟如下:

      ①明確數(shù)據(jù)挖掘的對(duì)象—業(yè)務(wù)對(duì)象,確定商業(yè)應(yīng)用主題,不能盲目地進(jìn)行挖掘;

      ②將與業(yè)務(wù)對(duì)象的各類原始數(shù)據(jù)收集起來(lái)作為挖掘的數(shù)據(jù)源泉;

      ③對(duì)收集的數(shù)據(jù)進(jìn)行預(yù)處理,一般包括數(shù)據(jù)凈化、用戶識(shí)別、會(huì)話識(shí)別、路徑補(bǔ)充、事務(wù)識(shí)別和格式化等階段,以提高挖掘效率,剔除無(wú)用、無(wú)關(guān)信息并對(duì)信息進(jìn)行必要的整理。

      ④根據(jù)需要解決的問(wèn)題建立合適的數(shù)據(jù)挖掘模型,然后利用已知數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練和測(cè)試,并應(yīng)用該模型得到挖掘結(jié)果;

      ⑤利用可視化技術(shù),驗(yàn)證、解釋挖掘的結(jié)果,并據(jù)此做出決策或豐富知識(shí),即進(jìn)行模式分析與應(yīng)用。

      在整個(gè)Web數(shù)據(jù)挖掘的過(guò)程中,被明確的業(yè)務(wù)對(duì)象是挖掘過(guò)程的基礎(chǔ),它驅(qū)動(dòng)整個(gè)Web數(shù)據(jù)挖掘的全過(guò)程;同時(shí),也是檢驗(yàn)挖掘結(jié)果和引導(dǎo)分析人員完成挖掘的依據(jù)。

      2.3電子商務(wù)中Web數(shù)據(jù)挖掘的數(shù)據(jù)源

      在電子商務(wù)中,可以用來(lái)作為數(shù)據(jù)挖掘分析的數(shù)據(jù)量比較大,而且類型眾多,總結(jié)起來(lái)有以下幾種類型的數(shù)據(jù)可用于Web數(shù)據(jù)挖掘技術(shù)產(chǎn)生各種知識(shí)模式。

      ①服務(wù)器數(shù)據(jù)。客戶訪問(wèn)站點(diǎn)時(shí)會(huì)在Web服務(wù)器上留下相應(yīng)的日志數(shù)據(jù),這些日志數(shù)據(jù)通常以文本文件的形式存儲(chǔ)在服務(wù)器上。一般包括serverslogs、errorlogs、cookieslogs等。

      ②查詢數(shù)據(jù)。它是電子商務(wù)站點(diǎn)在服務(wù)器上產(chǎn)生的一種典型數(shù)據(jù)。例如,對(duì)于再現(xiàn)存儲(chǔ)的客戶也許會(huì)搜索一些產(chǎn)品或某些廣告信息,這些查詢信息就是通過(guò)cookie或是登記信息連接到服務(wù)器的訪問(wèn)日志上。

      ③在線市場(chǎng)數(shù)據(jù)。這類數(shù)據(jù)主要是傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)里存儲(chǔ)的有關(guān)電子商務(wù)站點(diǎn)信息、用戶購(gòu)買信息、商品信息等數(shù)據(jù)。

      ④Web頁(yè)面。主要是指HTML和XML頁(yè)面的內(nèi)容,包括文本、圖片、語(yǔ)音、圖像等。

      ⑤Web頁(yè)面超級(jí)鏈接關(guān)系。主要是指頁(yè)面之間存在的超級(jí)鏈接關(guān)系,這也是一種重要的資源。

      ⑥客戶登記信息。客戶登記信息是指客戶通過(guò)Web頁(yè)輸入的、要提交給服務(wù)器的相關(guān)用戶信息,這些信息通常是關(guān)于用戶的人口特征。在Web的數(shù)據(jù)挖掘中,客戶登記信息需要和訪問(wèn)日志集成,以提高數(shù)據(jù)挖掘的準(zhǔn)確度,使之能更進(jìn)一步的了解客戶。

      2.4Web數(shù)據(jù)挖掘能夠獲取的知識(shí)模式

      運(yùn)用Web數(shù)據(jù)挖掘技術(shù)能夠?qū)φ军c(diǎn)上的各種數(shù)據(jù)源進(jìn)行挖掘,找到相關(guān)的一些知識(shí)模式,以指導(dǎo)站點(diǎn)人員更好地運(yùn)作站點(diǎn)和向客戶提供更好的服務(wù)。一般運(yùn)用Web數(shù)據(jù)挖掘可以在站點(diǎn)上挖掘出來(lái)的知識(shí)模式有以下幾個(gè):

      ①路徑分析。它可以被用于判定在一個(gè)Web站點(diǎn)中最頻繁訪問(wèn)的路徑。通過(guò)路徑分析,可以得到重要的頁(yè)面,可以改進(jìn)頁(yè)面及網(wǎng)站結(jié)構(gòu)的設(shè)計(jì)。

      ②關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)。在電子商務(wù)中關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)可以找到客戶對(duì)網(wǎng)站上各種文件之間訪問(wèn)的相互關(guān)系,可以找到用戶訪問(wèn)的頁(yè)面與頁(yè)面之間的相關(guān)性和購(gòu)買商品間的相關(guān)性。利用這些相關(guān)性,可以更好的組織站點(diǎn)的內(nèi)容,實(shí)施有效的市場(chǎng)策略,增加交叉銷售量,同時(shí)還可以減少用戶過(guò)濾信息的負(fù)擔(dān)。

      ③序列模式的發(fā)現(xiàn)。序列模式的發(fā)現(xiàn)就是在時(shí)間戳有序的事務(wù)集中,找到那些“一些項(xiàng)跟隨另一項(xiàng)”的內(nèi)部事務(wù)模式。它能夠便于進(jìn)行電子商務(wù)的組織預(yù)測(cè)客戶的訪問(wèn)模式,對(duì)客戶開展有針對(duì)性的廣告服務(wù)。通過(guò)系列模式的發(fā)現(xiàn),能夠在服務(wù)器方選擇有針對(duì)性地頁(yè)面,以滿足訪問(wèn)者的特定要求。

      ④分類和預(yù)測(cè)。分類發(fā)現(xiàn)就是給出識(shí)別一個(gè)特殊群體的公共屬性的描述,這個(gè)描述可以用來(lái)分類新的項(xiàng)。分類的目的是通過(guò)構(gòu)造分類模型或分類器,把數(shù)據(jù)庫(kù)中的數(shù)據(jù)項(xiàng)映射到給定類別中的某一個(gè),以便用于預(yù)測(cè);也就是利用歷史數(shù)據(jù)記錄自動(dòng)推導(dǎo)出對(duì)給定數(shù)據(jù)的推廣描述,從而能對(duì)未來(lái)數(shù)據(jù)進(jìn)行預(yù)測(cè),進(jìn)行適合某一類客戶的商務(wù)活動(dòng)。

      ⑤聚類分析。聚類分析可以從Web訪問(wèn)信息數(shù)據(jù)中聚集出具有相似特性的那些客戶。在Web事務(wù)日志中,聚類顧客信息或數(shù)據(jù)項(xiàng)能夠便于開發(fā)和執(zhí)行未來(lái)的市場(chǎng)策略。這種市場(chǎng)策略包括自動(dòng)給一個(gè)特定的顧客聚類發(fā)送銷售郵件、為屬于某一個(gè)顧客聚類中的顧客推薦特定的商品等。對(duì)電子商務(wù)來(lái)說(shuō),客戶聚類可以對(duì)市場(chǎng)細(xì)分理論提供有力的支持。通過(guò)對(duì)聚類客戶特征的提取,電子商務(wù)網(wǎng)站可以為客戶提供個(gè)性化的服務(wù)。

      ⑥異常檢測(cè)。異常檢測(cè)是對(duì)分析對(duì)象的少數(shù)的、極端的特例的描述,以揭示內(nèi)在的原因,從而減小經(jīng)營(yíng)的風(fēng)險(xiǎn)。異常檢測(cè)在電子商務(wù)中的應(yīng)用可以體現(xiàn)在信用卡欺詐甄別、發(fā)現(xiàn)異常客戶和網(wǎng)絡(luò)入侵檢測(cè)等方面。

      Web數(shù)據(jù)挖掘的各項(xiàng)功能不是獨(dú)立存在的,而是在挖掘過(guò)程中互相聯(lián)系,發(fā)揮作用。

      3Web數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用

      3.1數(shù)據(jù)抽取方法在電子商務(wù)中的應(yīng)用

      與傳統(tǒng)商務(wù)活動(dòng)相比,電子商務(wù)具有更多的虛擬和不確定的因素:如客戶購(gòu)買的心理、動(dòng)機(jī)、能力、欲望等。Web數(shù)據(jù)挖掘要解決的問(wèn)題就是如何從零散的無(wú)規(guī)則的網(wǎng)絡(luò)數(shù)據(jù)中找到有用的和有規(guī)則的數(shù)據(jù)和知識(shí),基本方法之一就是進(jìn)行數(shù)據(jù)抽取,以期對(duì)數(shù)據(jù)進(jìn)行濃縮,給出它的緊湊描述,如方差值等統(tǒng)計(jì)值或用直方圖等圖形方式表示,從數(shù)據(jù)泛化的角度討論數(shù)據(jù)總結(jié),把最原始、基本的信息數(shù)據(jù)從低層次抽象到高層次,以便于企業(yè)決策。

      3.2基于Web數(shù)據(jù)挖掘的智能化搜索引擎

      電子商務(wù)企業(yè)在活動(dòng)過(guò)程中面臨的問(wèn)題之一是如何通過(guò)Internet全面、準(zhǔn)確、及時(shí)地收集到企業(yè)內(nèi)、外部的環(huán)境信息,尤其是一些隱性的、關(guān)系到企業(yè)經(jīng)營(yíng)成敗的關(guān)鍵信息,以提高競(jìng)爭(zhēng)力。目前的搜索引擎存在著查準(zhǔn)率低、返回?zé)o用信息多的問(wèn)題,使企業(yè)無(wú)法得到優(yōu)質(zhì)的信息。鑒于此,將Web數(shù)據(jù)挖掘技術(shù)應(yīng)用于搜索引擎,使之成為智能搜索引擎,從而提高性能,滿足電子商務(wù)企業(yè)的需要。Web挖掘技術(shù)主要在以下幾個(gè)方面對(duì)搜索引擎有借鑒作用:文檔的自動(dòng)分類、自動(dòng)摘要的形成、檢索結(jié)果的聯(lián)機(jī)聚類和相關(guān)度排序及實(shí)現(xiàn)個(gè)性化的搜索引擎。經(jīng)過(guò)文檔的分類處理,可以對(duì)搜索結(jié)果進(jìn)行分門別類,可以通過(guò)限制搜索范圍來(lái)使文本的查找更為容易,幫助用戶快速的對(duì)目標(biāo)知識(shí)進(jìn)行定位,從而提高用戶進(jìn)行網(wǎng)上信息搜索的效率;自動(dòng)摘要能夠解決大部分搜索引擎機(jī)械地截取文檔的前幾句和固定字?jǐn)?shù)的摘要使信息反映不完整的缺陷,使用戶能較準(zhǔn)確、快速、方便地了解檢索信息;通過(guò)對(duì)檢索結(jié)果的文檔集合進(jìn)行聚類,可以使得與用戶檢索結(jié)果相關(guān)的文檔集中在一起,從而遠(yuǎn)離那些不相關(guān)的文檔,將處理以后的信息以超鏈結(jié)構(gòu)組織的層次方式可視化地提供給用戶,由用戶選擇他所感興趣的那一簇,將大大縮小所需瀏覽的頁(yè)面數(shù)量;將Web使用挖掘中的個(gè)性化技術(shù)應(yīng)用在搜索引擎中,可以在大量訓(xùn)練樣本的基礎(chǔ)上,得到數(shù)據(jù)對(duì)象間的內(nèi)在特征,并以此為依據(jù)進(jìn)行有目的的信息提取,使得搜索引擎可以按照用戶的興趣偏好擴(kuò)充用戶搜索的關(guān)鍵詞,以使得檢索結(jié)果更接近用戶要求,或者根據(jù)用戶歷史瀏覽信息的分析獲得用戶興趣庫(kù),調(diào)用個(gè)性化的搜索引擎可以提高用戶檢索的查全率與查準(zhǔn)率。通過(guò)借鑒Web挖掘技術(shù)可以提高查準(zhǔn)率與查全率,改善檢索結(jié)果的組織,從而使檢索效率得到改善。

      3.3Web數(shù)據(jù)挖掘在客戶關(guān)系管理中的應(yīng)用

      ①客戶關(guān)系管理的核心

      客戶關(guān)系管理(CustomerRelationshipManagement,簡(jiǎn)稱CRM)的核心是通過(guò)客戶和他們行為的有效數(shù)據(jù)收集,發(fā)現(xiàn)潛在的市場(chǎng)和客戶,從而獲得更高的商業(yè)利潤(rùn),通過(guò)完善的客戶服務(wù)和深入的客戶分析來(lái)滿足客戶的需求,保證實(shí)現(xiàn)客戶的終生價(jià)值。可以說(shuō)CRM能給傳統(tǒng)企業(yè)帶來(lái)在網(wǎng)絡(luò)經(jīng)濟(jì)時(shí)代謀取生存之道的管理制度和技術(shù)手段。它要求企業(yè)從“以產(chǎn)品為中心”的模式向“以客戶為中心”的模式轉(zhuǎn)移。

      ②Web數(shù)據(jù)挖掘在客戶關(guān)系管理中的應(yīng)用

      Web數(shù)據(jù)挖掘能夠幫助企業(yè)確定客戶的特點(diǎn),使企業(yè)能夠?yàn)榭蛻籼峁┯嗅槍?duì)性的服務(wù)。將Web數(shù)據(jù)挖掘用在電子商務(wù)CRM中主要體現(xiàn)在客戶的獲取和保持、價(jià)值客戶鑒別、客戶滿意度分析及改善站點(diǎn)結(jié)構(gòu)等幾方面。

      通過(guò)Web數(shù)據(jù)挖掘,可以理解訪問(wèn)者的動(dòng)態(tài)行為,據(jù)此優(yōu)化電子商務(wù)網(wǎng)站的經(jīng)營(yíng)模式。通過(guò)把所掌握的大量客戶分成不同的類,對(duì)不同類的客戶提供個(gè)性化服務(wù)來(lái)提高客戶的滿意度,從而保持老客戶;通過(guò)對(duì)新訪問(wèn)者的網(wǎng)頁(yè)瀏覽記錄進(jìn)行分析,就可以判斷出該訪問(wèn)者是屬于哪一類客戶,是有利可圖的潛在客戶還是毫無(wú)價(jià)值的過(guò)客,達(dá)到區(qū)別對(duì)待、節(jié)省銷售成本、提高訪問(wèn)者到購(gòu)買者的轉(zhuǎn)化率的目的,從而挖掘潛在客戶;通過(guò)對(duì)具有相似瀏覽行為的客戶進(jìn)行分組,提取組中客戶的共同特征,從而實(shí)現(xiàn)客戶的聚類,這可以幫助電子商務(wù)企業(yè)更好地了解客戶的興趣、消費(fèi)習(xí)慣和消費(fèi)傾向,預(yù)測(cè)他們的需求,有針對(duì)性地向他們推薦特定的商品并實(shí)現(xiàn)交叉銷售,可以提高交易成功率和交易量,提高營(yíng)銷效果。

      此外,站點(diǎn)的結(jié)構(gòu)和內(nèi)容是吸引客戶的關(guān)鍵。利用關(guān)聯(lián)規(guī)則的發(fā)現(xiàn),針對(duì)不同客戶動(dòng)態(tài)調(diào)整站點(diǎn)結(jié)構(gòu)和頁(yè)面內(nèi)容,把具有一定支持度和信任度的相關(guān)聯(lián)的物品放在一起以有助于銷售;通過(guò)路徑分析等技術(shù)可以判定出一類用戶對(duì)Web站點(diǎn)頻繁訪問(wèn)的路徑,這些路徑反映這類用戶瀏覽站點(diǎn)頁(yè)面的順序和習(xí)慣,將客戶訪問(wèn)的有關(guān)聯(lián)的文件實(shí)現(xiàn)直接鏈接,讓客戶容易地訪問(wèn)到想要的頁(yè)面。這樣的網(wǎng)站會(huì)給客戶留下好印象,提高客戶忠誠(chéng)度,吸引客戶,延長(zhǎng)他們?cè)诰W(wǎng)站上的駐留時(shí)間以及提高再次訪問(wèn)的機(jī)率。

      通過(guò)挖掘客戶的行為記錄和反饋情況,進(jìn)一步優(yōu)化網(wǎng)站組織結(jié)構(gòu)和服務(wù)方式以提高網(wǎng)站的效率。通過(guò)Web數(shù)據(jù)挖掘,可以得到可靠的市場(chǎng)反饋信息,評(píng)測(cè)廣告的投資回報(bào)率,從而評(píng)估網(wǎng)絡(luò)營(yíng)銷模式的成功與否;可以根據(jù)關(guān)心某產(chǎn)品的訪問(wèn)者的瀏覽模式來(lái)決定廣告的位置,增加廣告針對(duì)性,提高廣告的投資回報(bào)率,降低公司的運(yùn)營(yíng)成本。③維護(hù)客戶的隱私權(quán)

      維護(hù)客戶的隱私權(quán)是商家在商業(yè)運(yùn)作過(guò)程中不能忽視的一個(gè)基本組成部分。因此,作為電子商務(wù)企業(yè),應(yīng)該盡量避免對(duì)單個(gè)客戶數(shù)據(jù)進(jìn)行挖掘。企業(yè)管理客戶隱私權(quán)的保護(hù)應(yīng)該從技術(shù)和管理兩個(gè)方面來(lái)實(shí)現(xiàn):技術(shù)上,通常是采用加密標(biāo)志符,并且盡量避免對(duì)單個(gè)客戶數(shù)據(jù)進(jìn)行挖掘;管理上,很多電子商務(wù)企業(yè)現(xiàn)在已經(jīng)增設(shè)了首席隱私官(CPO,ChiefPrivacyOfficer)職位,隱私官將能在個(gè)人對(duì)隱私的需求和公司以合理手段使用隱私材料的權(quán)利之間,建立適當(dāng)?shù)钠胶怅P(guān)系。這種平衡關(guān)系的大成,需要以長(zhǎng)期的實(shí)踐和經(jīng)驗(yàn)為基礎(chǔ)。除了電子商務(wù)企業(yè)以單獨(dú)的主體身份進(jìn)行客戶隱私權(quán)保護(hù)的管理之外,行業(yè)自律也是保護(hù)客戶隱私權(quán)的一個(gè)行之有效的手段。目前,電子商務(wù)網(wǎng)站越來(lái)越傾向于通過(guò)行業(yè)自律的方式來(lái)樹立其在客戶心目中的形象,讓客戶放心地提交數(shù)據(jù)。

      3.4Web數(shù)據(jù)挖掘在個(gè)性化服務(wù)推薦系統(tǒng)中的應(yīng)用

      電子商務(wù)個(gè)性化服務(wù)推薦系統(tǒng)是向站點(diǎn)企業(yè)提供在電子商務(wù)中更好地運(yùn)作CRM,建立良好客戶關(guān)系的一種解決方法,是“以客戶為中心”、“一對(duì)一”的行銷的堅(jiān)實(shí)執(zhí)行者。

      該系統(tǒng)主要是將數(shù)據(jù)挖掘的思想和方法應(yīng)用到Web服務(wù)器日志及Web數(shù)據(jù)庫(kù)等資源上,挖掘出客戶的訪問(wèn)規(guī)律;然后將在線訪問(wèn)客戶歸結(jié)到某一類中去,根據(jù)該類用戶的訪問(wèn)規(guī)律進(jìn)行Web頁(yè)面的推薦;并且系統(tǒng)還可以通過(guò)不斷地跟蹤用戶的當(dāng)前訪問(wèn),實(shí)時(shí)調(diào)整推薦集,為用戶提供個(gè)性化的訪問(wèn)。該系統(tǒng)由五大模塊組成:數(shù)據(jù)收集模塊、數(shù)據(jù)預(yù)處理模塊、數(shù)據(jù)存儲(chǔ)模塊、離線挖掘模塊和在線推薦模塊。其系統(tǒng)結(jié)構(gòu)模型如圖1所示:

      圖1基于Web數(shù)據(jù)挖掘的個(gè)性化服務(wù)推薦系統(tǒng)結(jié)構(gòu)模型

      數(shù)據(jù)收集模塊主要用于收集Web數(shù)據(jù)庫(kù)、使用日志等數(shù)據(jù),形成數(shù)據(jù)采集庫(kù),為以后的挖掘做準(zhǔn)備;數(shù)據(jù)預(yù)處理模塊主要是對(duì)所收集的數(shù)據(jù)進(jìn)行預(yù)處理,數(shù)據(jù)預(yù)處理的質(zhì)量與挖掘的效率和結(jié)果緊密相關(guān);數(shù)據(jù)存儲(chǔ)模塊將預(yù)處理后的數(shù)據(jù)存入用戶事務(wù)庫(kù);離線挖掘模塊中的挖掘引擎使用挖掘算法庫(kù)中的數(shù)據(jù)挖掘技術(shù)如統(tǒng)計(jì)分析、關(guān)聯(lián)規(guī)則、聚類分析、序列模式等,來(lái)發(fā)現(xiàn)用戶瀏覽模式,并通過(guò)模式分析對(duì)其進(jìn)行分析與解釋,根據(jù)實(shí)際應(yīng)用,通過(guò)觀察和選擇,把發(fā)現(xiàn)的統(tǒng)計(jì)結(jié)果、規(guī)則和模型轉(zhuǎn)換為知識(shí),經(jīng)過(guò)篩選后得到有用的模式用來(lái)指導(dǎo)實(shí)際的電子商務(wù)行為;在線推薦模塊在Web服務(wù)器前端設(shè)置了推薦引擎,它將用戶當(dāng)前的瀏覽活動(dòng)與瀏覽出的頁(yè)面推薦集結(jié)合起來(lái)考慮,生成相應(yīng)推薦集,然后在用戶最新請(qǐng)求的頁(yè)面上添加推薦集的頁(yè)面,再通過(guò)Web服務(wù)器傳遞到用戶端的瀏覽器,為用戶實(shí)現(xiàn)實(shí)時(shí)個(gè)性化服務(wù);同時(shí)將推薦結(jié)果送往網(wǎng)站管理中心,以便調(diào)整網(wǎng)站設(shè)計(jì),優(yōu)化網(wǎng)站結(jié)構(gòu),提高網(wǎng)站效率。

      總的來(lái)說(shuō),在個(gè)性化服務(wù)推薦系統(tǒng)中運(yùn)用數(shù)據(jù)挖掘技術(shù)有兩個(gè)階段:第一個(gè)階段是學(xué)習(xí)階段,離線進(jìn)行。第二個(gè)階段是模式的使用階段,在線進(jìn)行。挖掘和在線推薦的特征獲取和規(guī)則生成是離線處理的,而當(dāng)用戶訪問(wèn)該網(wǎng)站時(shí)通過(guò)在線推薦引擎進(jìn)行在線服務(wù)。離線模塊和在線模塊相互聯(lián)系,在線模塊主要是利用離線模塊提供的規(guī)則模型對(duì)在線用戶推薦(推薦引擎);離線模塊主要是利用在線模塊積累的數(shù)據(jù)運(yùn)用系統(tǒng)推薦算法形成相應(yīng)的規(guī)則。挖掘算法和推薦策略可以根據(jù)不同類型站點(diǎn)的要求來(lái)具體選擇,挖掘結(jié)果和推薦集通過(guò)推薦引擎反饋給用戶。電子商務(wù)網(wǎng)站的客戶登錄網(wǎng)站以后,其訪問(wèn)信息將會(huì)被記錄到服務(wù)器端。這些數(shù)據(jù)將在經(jīng)過(guò)預(yù)處理后,在專用的數(shù)據(jù)挖掘模塊中,通過(guò)具體的挖掘算法和推薦策略來(lái)進(jìn)行模式識(shí)別和模式分析。用戶訪問(wèn)信息也會(huì)傳到推薦引擎,推薦引擎根據(jù)客戶的會(huì)員標(biāo)識(shí),向挖掘模塊抽取對(duì)應(yīng)客戶的挖掘結(jié)果和推薦集,將其可視化地反饋給用戶,達(dá)到個(gè)性化服務(wù)的目的。

      3.5基于Web的數(shù)據(jù)挖掘在商業(yè)信用評(píng)估中的應(yīng)用

      發(fā)達(dá)的社會(huì)信用水平是發(fā)展電子商務(wù)的重要基礎(chǔ),通過(guò)Web數(shù)據(jù)挖掘?qū)φ军c(diǎn)數(shù)據(jù)統(tǒng)計(jì)和歷史記錄之間的差別,結(jié)果與期望值的偏離以及反常實(shí)例進(jìn)行充分的分析,可以有效地防范投資和經(jīng)營(yíng)風(fēng)險(xiǎn)。另外,通過(guò)數(shù)據(jù)挖掘技術(shù)對(duì)企業(yè)經(jīng)營(yíng)進(jìn)行跟蹤,開展企業(yè)的資產(chǎn)評(píng)估、利潤(rùn)收益分析和發(fā)展?jié)摿︻A(yù)測(cè),構(gòu)建完善的安全保障體系,實(shí)施網(wǎng)上全程監(jiān)控,監(jiān)督網(wǎng)上言論,維護(hù)企業(yè)信譽(yù),強(qiáng)化網(wǎng)上交易和在線支付的安全管理,利用數(shù)據(jù)挖掘的信用評(píng)估模型,對(duì)交易歷史數(shù)據(jù)進(jìn)行挖掘發(fā)現(xiàn)客戶的交易數(shù)據(jù)特征,建立客戶信譽(yù)度級(jí)別,有效地防范和化解信用風(fēng)險(xiǎn),提高企業(yè)信用甄別與風(fēng)險(xiǎn)管理的水平和能力。

      4結(jié)論

      本文對(duì)Web挖掘技術(shù)進(jìn)行了綜述,介紹了其在電子商務(wù)中的典型應(yīng)用。Web數(shù)據(jù)挖掘高度自動(dòng)化地對(duì)電子商務(wù)中的大量信息進(jìn)行分析和推理,從中挖掘出潛在的模式,預(yù)測(cè)客戶行為,幫助企業(yè)的決策者調(diào)整市場(chǎng)策略,減少風(fēng)險(xiǎn),做出正確的決策。Web數(shù)據(jù)挖掘是近幾年來(lái)數(shù)據(jù)挖掘領(lǐng)域的探討熱點(diǎn),利用它的技術(shù)知識(shí)將它運(yùn)用到電子商務(wù),將會(huì)解決許多實(shí)際問(wèn)題,具有豐富的學(xué)術(shù)價(jià)值。將Web數(shù)據(jù)挖掘技術(shù)和電子商務(wù)兩者有機(jī)結(jié)合,將會(huì)為企業(yè)更有效的確認(rèn)目標(biāo)市場(chǎng),改進(jìn)決策,獲得競(jìng)爭(zhēng)優(yōu)勢(shì)提供幫助,有著很廣闊的應(yīng)用前景,使電子商務(wù)網(wǎng)站更具有競(jìng)爭(zhēng)力,從而為企業(yè)帶來(lái)更多的效益。面向電子商務(wù)的Web數(shù)據(jù)挖掘能發(fā)現(xiàn)大量數(shù)據(jù)背后隱藏的知識(shí),指導(dǎo)商家提高銷售額,改善企業(yè)客戶關(guān)系,提高網(wǎng)站運(yùn)行效率,改進(jìn)系統(tǒng)性能,具有良好的發(fā)展和應(yīng)用前景,必將得到越來(lái)越多的關(guān)注。

      參考文獻(xiàn):

      [1]毛國(guó)君.數(shù)據(jù)挖掘原理與算法[M].清華大學(xué)出版社.2005(07).

      [2]張冬青.數(shù)據(jù)挖掘在電子商務(wù)中應(yīng)用問(wèn)題研究[J].現(xiàn)代情報(bào).2005(09).

      [3]李鳳慧.面向電子商務(wù)的Web數(shù)據(jù)挖據(jù)的研究[D].山東科技大學(xué)碩士學(xué)位論文.2004(06).

      篇(8)

      【中圖分類號(hào)】G40-057【文獻(xiàn)標(biāo)識(shí)碼】A【論文編號(hào)】1009-8097(2015) 06-0089-07【DOI】10.3969/j.issn.1009-8097.2015.06.014

      引言

      2011年以來(lái),在美國(guó)頂尖大學(xué)中迅速發(fā)展起來(lái)并迅速影響世界的MOOC(大規(guī)模開放在線課程)模式無(wú)疑給“在線學(xué)習(xí)”這一學(xué)習(xí)形式樹立了成功應(yīng)用的典范,該模式證明了只有當(dāng)大學(xué)的課程、課堂教學(xué)、學(xué)生學(xué)習(xí)進(jìn)程、學(xué)生體驗(yàn)、師生互動(dòng)過(guò)程等被完整、系統(tǒng)地在線實(shí)現(xiàn)…,特別是當(dāng)輔導(dǎo)教師的存在以及相關(guān)系統(tǒng)指導(dǎo)活動(dòng)實(shí)現(xiàn)時(shí),在線學(xué)習(xí)才是有效的。這從一個(gè)側(cè)面說(shuō)明,在線學(xué)習(xí)并不是純粹的學(xué)生自主學(xué)習(xí),還需要充分發(fā)揮輔導(dǎo)教師的主導(dǎo)作用。

      在線學(xué)習(xí)模式下,師生活動(dòng)在時(shí)空上相對(duì)分離,盡管有同步教學(xué)活動(dòng)發(fā)生,但更多時(shí)候是異步教學(xué)活動(dòng),因?yàn)楫惒浇虒W(xué)更有助于滿足學(xué)習(xí)者的個(gè)性化學(xué)習(xí)需要。不同于課堂面授教學(xué),輔導(dǎo)教師難以把握一門在線課程學(xué)習(xí)者學(xué)習(xí)開展情況的全貌。但是,通過(guò)在線學(xué)習(xí)平臺(tái)對(duì)學(xué)習(xí)過(guò)程的記錄,輔導(dǎo)教師了解課程的教學(xué)過(guò)程是可能的,而且基于學(xué)習(xí)過(guò)程記錄開展在線教學(xué)的反思以不斷改進(jìn)在線教學(xué)這一做法也是必要的。一文獻(xiàn)探討

      “教學(xué)反思”,顧名思義,反思對(duì)象就是教學(xué)過(guò)程,反思的基礎(chǔ)是對(duì)教學(xué)過(guò)程的忠實(shí)記錄。波斯納(Poser)將教師的成長(zhǎng)發(fā)展與其對(duì)自己經(jīng)驗(yàn)的反思結(jié)合起來(lái),提出了一個(gè)教師成長(zhǎng)的公式:經(jīng)驗(yàn)+反思=成長(zhǎng)。由此可見反思對(duì)教師成長(zhǎng)以及專業(yè)發(fā)展的重要性。

      教學(xué)反思的方法是多樣的。王映學(xué)、趙興奎指出教學(xué)反思的途徑主要有錄像反思、日記反思、從學(xué)習(xí)者角度反思、與同事及專家的交流中反思以及通過(guò)向?qū)W生征詢意見反思。張大均將教師成長(zhǎng)的途徑從觀摩教學(xué)、微格教學(xué)、教學(xué)決策訓(xùn)練和教學(xué)反思幾個(gè)方面來(lái)說(shuō)明。俞國(guó)良等則將教師的反思訓(xùn)練列為錄像反思法、對(duì)話反思法和教學(xué)反思法。從上述方法中可以看到,教學(xué)反思的基礎(chǔ)是對(duì)教學(xué)過(guò)程的忠實(shí)記錄。在“日記反思法”中,第一步就是對(duì)教學(xué)中包含問(wèn)題的教學(xué)事件進(jìn)行詳細(xì)、忠實(shí)的描述。在“從學(xué)習(xí)者角度反思”中,第一步就是“簡(jiǎn)要記下學(xué)習(xí)發(fā)生的時(shí)間、場(chǎng)合、涉及的學(xué)習(xí)內(nèi)容和培訓(xùn)(講授或主持)人員”。在微格教學(xué)法中,則通過(guò)錄像設(shè)備記錄教學(xué)全過(guò)程。

      在信息化網(wǎng)絡(luò)時(shí)代,教師可以利用現(xiàn)代教育技術(shù)手段來(lái)實(shí)現(xiàn)教學(xué)過(guò)程的忠實(shí)記錄,進(jìn)行有效的教學(xué)反思,從而更好地促進(jìn)自身的專業(yè)發(fā)展。各種新的網(wǎng)絡(luò)技術(shù)工具給我們的生活帶來(lái)了新的便利,同時(shí)也為教師提供了新的教學(xué)反思工具。近年來(lái)興起的學(xué)習(xí)分析技術(shù)可以成為教師開展在線教學(xué)反思的有力工具。學(xué)習(xí)分析技術(shù)是對(duì)學(xué)生生成的海量數(shù)據(jù)進(jìn)行解釋和分析,以評(píng)估學(xué)生的學(xué)術(shù)進(jìn)展,預(yù)測(cè)未來(lái)的表現(xiàn),并發(fā)現(xiàn)潛在的問(wèn)題。對(duì)教師而言,學(xué)習(xí)分析技術(shù)可用來(lái)開展更為深入的教學(xué)分析,以便教師在數(shù)據(jù)分析的基礎(chǔ)上為學(xué)生提供更有針對(duì)性的教學(xué)干預(yù)。在線學(xué)習(xí)中,在線學(xué)習(xí)平臺(tái)詳細(xì)記錄了師生行為,猶如課堂教學(xué)錄像。借助學(xué)習(xí)分析技術(shù),分析師生行為記錄數(shù)據(jù),可以再現(xiàn)在線學(xué)習(xí)過(guò)程,使教師能夠把握在線教學(xué)過(guò)程全貌,并了解每個(gè)教學(xué)環(huán)節(jié)、重要教學(xué)活動(dòng)以及每個(gè)學(xué)生的種種細(xì)節(jié),使原本模糊的印象數(shù)字化、清晰化,輔助教師反思其在教學(xué)設(shè)計(jì)、資源制作、學(xué)習(xí)引導(dǎo)、學(xué)習(xí)評(píng)價(jià)等方面的可取之處與不足之處。

      因此,本文選取基于Moodle平臺(tái)的在線課程為樣本,應(yīng)用學(xué)習(xí)分析技術(shù),具體包括話語(yǔ)分析、社會(huì)網(wǎng)絡(luò)分析等分析技術(shù),統(tǒng)計(jì)分析與可視化、聚類、預(yù)測(cè)、關(guān)系挖掘、文本挖掘等數(shù)據(jù)挖掘方法,以及SSAS、SPSS、ucrNET、EXCEL、ICTCLAS中文分詞系統(tǒng)等工具,從一位輔導(dǎo)教師的視角,開展基于學(xué)習(xí)過(guò)程記錄的在線教學(xué)反思研究,探索一種全新的教學(xué)反思形式。

      二 研究樣本

      本文選取國(guó)家開放大學(xué)主辦的網(wǎng)絡(luò)教育從業(yè)人員培訓(xùn)班為研究對(duì)象。該培訓(xùn)班依托Moodle平臺(tái)開設(shè)(網(wǎng)址:http://),有“學(xué)生支持服務(wù)”、“在線學(xué)習(xí)輔導(dǎo)”和“在線課程設(shè)計(jì)”三門課,每門課的培訓(xùn)時(shí)間為6周,學(xué)生通過(guò)Moodle平臺(tái)開展在線學(xué)習(xí),輔導(dǎo)教師提供全程的在線輔導(dǎo)。本文具體選擇“在線學(xué)習(xí)輔導(dǎo)”課程第五期培訓(xùn)班作為研究樣本。

      三 數(shù)據(jù)分析與培訓(xùn)反思

      1 重溫整個(gè)教學(xué)過(guò)程――師生群體平臺(tái)訪問(wèn)行為分析

      通過(guò)對(duì)平臺(tái)模塊訪問(wèn)、模塊訪問(wèn)序列以及師生活動(dòng)時(shí)間分布情況的分析,重新回顧教學(xué)過(guò)程,并對(duì)一些突出的數(shù)據(jù)表現(xiàn)加以解讀,使原本時(shí)空分離的師生活動(dòng)再度整合,還原輔導(dǎo)教師的教學(xué)過(guò)程與學(xué)生學(xué)習(xí)過(guò)程的原貌。

      (1)平臺(tái)模塊訪問(wèn)總體情況

      表l是該期培訓(xùn)過(guò)程中,師生訪問(wèn)Moodle平臺(tái)各模塊的頻次統(tǒng)計(jì)結(jié)果。

      從統(tǒng)計(jì)結(jié)果可知,師生最常訪問(wèn)的模塊是“forum”,占總活動(dòng)頻次的近50%,說(shuō)明課堂討論是最主要的學(xué)習(xí)活動(dòng),也是這門基于討論的探究式課程學(xué)習(xí)的突出特點(diǎn)。其次就是“wiki”、“resource”和“assignment”三類行為。這三類行為的頻次和比例較為平均,是位列“Forum”之后的重要學(xué)習(xí)活動(dòng)。在討論的基礎(chǔ)上,課程設(shè)計(jì)中的“wiki”其實(shí)是為了給學(xué)生協(xié)作式小組學(xué)習(xí)的機(jī)會(huì),是除“forum”外學(xué)生之間重要的交互空間。“resource”(瀏覽資源)是學(xué)習(xí)內(nèi)容重要的組成部分,在此基礎(chǔ)上參加討論和wiki協(xié)作學(xué)習(xí),最終的學(xué)習(xí)成果以“assignment”(小論文、大論文)的形式呈現(xiàn)。這幾個(gè)模塊的頻次和比例分配較為合理,較好地還原了教學(xué)過(guò)程。

      (2)平臺(tái)模塊訪問(wèn)序列分析

      我們已經(jīng)了解了不同模塊的訪問(wèn)頻次,下面我們?cè)賮?lái)了解一些師生訪問(wèn)平臺(tái)模塊的路徑。

      這里采用Microsoft順序分析和聚類分析算法,數(shù)據(jù)來(lái)源則是用戶每天瀏覽課程頁(yè)面產(chǎn)生的過(guò)程數(shù)據(jù)。筆者選取5個(gè)頻繁訪問(wèn)模塊包括forum、wiki、assignment,resource和user(course除外,因?yàn)樵谠撃K主要發(fā)生登錄行為,并沒(méi)有實(shí)際的學(xué)習(xí)行為)的數(shù)據(jù)來(lái)分析模塊訪問(wèn)序列,得到如圖l所示結(jié)果。由圖l可知,從user、resource、assignment、wiki四個(gè)模塊跳轉(zhuǎn)到forum的條件概率均比較高(分別為0.40、0.32、0.26、0.16),可見forum是一個(gè)活動(dòng)中心模塊,也是一個(gè)重要的活動(dòng)中介模塊,諸如resource、assignment、wiki等活動(dòng)可以從中再次啟動(dòng)。而在由forum跳轉(zhuǎn)到其他模塊的情形中,forumresource的轉(zhuǎn)換組合的發(fā)生概率是最高的,達(dá)到0.06。在發(fā)帖參與討論的過(guò)程中,發(fā)現(xiàn)問(wèn)題、深入思考再繼續(xù)學(xué)習(xí)相關(guān)資源,這符合學(xué)習(xí)常規(guī),也形成了討論帶動(dòng)資源的學(xué)習(xí)兩者之間的良性互動(dòng),從而實(shí)現(xiàn)深度學(xué)習(xí)和反思。另外,resource模塊對(duì)其他模塊的支撐作用還表現(xiàn)為assignmentresource,這一條件概率達(dá)到0.13,即學(xué)生在做作業(yè)的過(guò)程中要求助于資源模塊,這也是符合學(xué)習(xí)常規(guī)的。

      (3)不同時(shí)期各模塊訪問(wèn)特點(diǎn)

      接下來(lái)結(jié)合時(shí)間維度,了解不同時(shí)期平臺(tái)各模塊訪問(wèn)特點(diǎn),以了解不同時(shí)期師生關(guān)注重點(diǎn)的變化。計(jì)算出本期培訓(xùn)不同周此平臺(tái)模塊訪問(wèn)頻次分布情況,并繪制師生在主要學(xué)習(xí)模塊的活動(dòng)頻次占比隨時(shí)間分布的折線圖,得到如圖2所示結(jié)果。

      從圖2可以看出,除高頻訪問(wèn)模塊forum外,在正式學(xué)習(xí)開始前兩周及第1周,學(xué)生的訪問(wèn)重點(diǎn)user模塊和resource模塊反映出學(xué)生在熟悉人和內(nèi)容。這啟示我們,在網(wǎng)絡(luò)課程開始之前,輔導(dǎo)教師可能需要提前兩到三周就介入課程的學(xué)習(xí),實(shí)時(shí)跟蹤學(xué)習(xí)進(jìn)程,為他們提供相應(yīng)的服務(wù)來(lái)進(jìn)行預(yù)熱,這對(duì)于后面課程學(xué)習(xí)的順利發(fā)展和學(xué)生積極性的保持都很有幫助。進(jìn)入第2周,開始主要的學(xué)習(xí)活動(dòng),主要模塊則是wiki以及forum。到第3周,wiki活動(dòng)達(dá)到頂峰一一第3周出現(xiàn)本課程第一次wiki協(xié)作式小組學(xué)習(xí)活動(dòng),所以這時(shí)達(dá)到頂峰是正常的;另外,這些學(xué)生從沒(méi)有接觸過(guò)基于wiki的小組寫作式學(xué)習(xí),所以他們有很強(qiáng)的好奇心和強(qiáng)烈的興趣參與。到第4周,assignment活動(dòng)達(dá)到頂峰。這實(shí)際上是學(xué)生提交的第3周布置的assignment(小論文),這是本課程第一次提交assignment;課程結(jié)束后的三周,assignment模塊的活動(dòng)逐漸增強(qiáng),伴隨著resource模塊活動(dòng)的增強(qiáng),forum活動(dòng)相對(duì)減弱,進(jìn)入做作業(yè)(撰寫大論文)的狀態(tài)。

      2 聚焦重點(diǎn)教學(xué)活動(dòng)一一師生論壇交互分析

      師生在論壇的討論發(fā)言是本課程的一項(xiàng)重點(diǎn)教學(xué)活動(dòng)。通過(guò)這一活動(dòng),相關(guān)教學(xué)信息得以傳遞,各種其他教學(xué)活動(dòng)得以依次展開,課程知識(shí)也在這里不斷呈現(xiàn),支持服務(wù)也在這里相繼給出。

      (1)師生交互的數(shù)量與內(nèi)容

      該課程討論活動(dòng)在6個(gè)學(xué)習(xí)單元分散展開,本期培訓(xùn)班發(fā)帖數(shù)量累計(jì)743個(gè),如表2所示。由表2可知,輔導(dǎo)教師的發(fā)帖量基本呈緩慢下降的趨勢(shì)。從該趨勢(shì)我們可以看到,在第1周“學(xué)習(xí)指南”和第2周“第一單元:什么是在線輔導(dǎo)?”兩周的教學(xué)中,由于是在線教學(xué)的開始階段,輔導(dǎo)教師需要更多地引導(dǎo)學(xué)生進(jìn)行討論,投入相對(duì)更多的時(shí)間。從第3周開始,數(shù)據(jù)顯示,輔導(dǎo)教師的發(fā)帖量開始有所減少,從將近50%的比例下降到40%左右。這是因?yàn)椋?jīng)過(guò)前兩周的學(xué)習(xí),由于輔導(dǎo)教師的有效引導(dǎo),學(xué)生保持了較高的積極性,效果明顯。從第3周開始,輔導(dǎo)教師有意減少了發(fā)帖的量,注意留給學(xué)生更多的時(shí)間思考并參與討論,這時(shí)候?qū)W生明顯上升到了討論的主角這一角色,這說(shuō)明輔導(dǎo)教師對(duì)于討論的把握和控制比較成功。

      (2)師生交互發(fā)帖的內(nèi)容

      作者采用傅騫、魏順平等研發(fā)的術(shù)語(yǔ)提取算法從所發(fā)帖子中提取了約240個(gè)術(shù)語(yǔ),如表3所示。這些術(shù)語(yǔ)的出現(xiàn)頻次為4909次(其中輔導(dǎo)教師使用976次,約占20%);在481個(gè)帖子中出現(xiàn)(其中教師帖為204個(gè)),占帖子總數(shù)的65%。從另外一個(gè)角度說(shuō),有1/3左右的帖子沒(méi)有出現(xiàn)任何術(shù)語(yǔ)。由此可見,論壇的主要功能是開展課程知識(shí)討論,次要功能則是激發(fā)并維持學(xué)生的學(xué)習(xí)動(dòng)機(jī),引導(dǎo)、鼓勵(lì)學(xué)生不斷參加學(xué)習(xí)。

      在前10位術(shù)語(yǔ)中,“輔導(dǎo)”出現(xiàn)了3次,“在線(遠(yuǎn)程)”出現(xiàn)了4次,這比較好地體現(xiàn)了本課程的特點(diǎn),即在線學(xué)習(xí)輔導(dǎo)。而排在前兩位的是“輔導(dǎo)教師”和“電大”,這更能說(shuō)明這次培訓(xùn)的內(nèi)容和對(duì)象的特點(diǎn)。無(wú)一例外,本次培訓(xùn)的對(duì)象全部來(lái)自電大系統(tǒng),所以他們對(duì)本系統(tǒng)是最關(guān)注的,另外他們對(duì)如何做好“輔導(dǎo)教師”也是最關(guān)心的,所以他們選擇了這門課。從這些術(shù)語(yǔ)可以看出,本期的討論比較成功,課程的設(shè)計(jì)也比較合理,能夠滿足學(xué)生的需求。

      接著,作者對(duì)各單元使用的普通詞匯(包括動(dòng)詞和名詞等實(shí)詞,不含虛詞,不含術(shù)語(yǔ))使用頻次進(jìn)行統(tǒng)計(jì),以體現(xiàn)輔導(dǎo)教師的語(yǔ)言藝術(shù)和輔導(dǎo)特色。其中使用頻次排名前十的普通詞匯分別是“同學(xué)、加油、學(xué)生、謝謝、可以、學(xué)習(xí)、問(wèn)題、課程、研究、討論”。“加油”和“謝謝”這兩個(gè)詞的大量使用反映了輔導(dǎo)教師為學(xué)生提供的情感支持。輔導(dǎo)教師時(shí)時(shí)刻刻不忘鼓勵(lì)、支持任何一位學(xué)生的發(fā)言和進(jìn)步,處處對(duì)他們的討論表示感謝,無(wú)論發(fā)言是否精彩,無(wú)論對(duì)他們的觀點(diǎn)是否贊同,都通過(guò)“加油”和“謝謝”表示感謝。

      (3)師生交互的動(dòng)態(tài)過(guò)程與靜態(tài)結(jié)構(gòu)

      我們從師生交互發(fā)帖時(shí)間分布以及師生交互網(wǎng)絡(luò)分析來(lái)了解師生交互的動(dòng)態(tài)過(guò)程與靜態(tài)結(jié)構(gòu)。本培訓(xùn)課程設(shè)有6個(gè)單元外加大論文指導(dǎo)環(huán)節(jié)(實(shí)際上是7個(gè)單元),計(jì)劃教學(xué)時(shí)間是6周,一個(gè)單元用時(shí)一周。理想情況下,學(xué)生應(yīng)該在規(guī)定的學(xué)習(xí)時(shí)間內(nèi)完成相應(yīng)單元的活動(dòng),但事實(shí)并非如此。以每個(gè)單元的“話題討論”為例,某個(gè)單元的話題往往要持續(xù)3周才會(huì)真正結(jié)束。各單元討論活動(dòng)隨時(shí)間分布情況如表4所示。

      表4中帶*號(hào)的數(shù)字部分是在單元規(guī)定學(xué)習(xí)時(shí)間內(nèi)的發(fā)帖數(shù)量,但是每個(gè)單元在規(guī)定學(xué)習(xí)時(shí)間后,在隨后的2至3周還陸續(xù)有帖子發(fā)出來(lái)。于是從第3單元開始,將會(huì)有3個(gè)單元的活動(dòng)疊加在一起。出現(xiàn)這種疊加現(xiàn)象,可能較大程度上是由工學(xué)矛盾造成的。學(xué)生不能及時(shí)完成本周的學(xué)習(xí)活動(dòng),所以會(huì)往后拖延。其實(shí),從學(xué)生的角度是可以理解的,這也要求我們的在線教學(xué)要有一定的靈活性。同時(shí),也恰恰是在第3周開始出現(xiàn)第一個(gè)assgignment(小論文),學(xué)生的負(fù)擔(dān)開始加重。正是當(dāng)“新債舊債”交織在一起的時(shí)候,出現(xiàn)了連鎖式疊加的現(xiàn)象。當(dāng)然,這種現(xiàn)象也會(huì)無(wú)形中增加輔導(dǎo)教師的負(fù)擔(dān)。

      根據(jù)輔導(dǎo)教師和學(xué)生發(fā)帖、回帖的關(guān)系,借助UCINET社會(huì)網(wǎng)絡(luò)分析工具,可繪制師生交互網(wǎng)絡(luò)圖,如圖3所示。從圖3可以看出,所有24個(gè)成員(包括輔導(dǎo)教師,如圖中編號(hào)為68的正方形節(jié)點(diǎn))均在一個(gè)網(wǎng)絡(luò)中,不存在孤立的成員。

      篇(9)

      2001年以來(lái),信息推送模式成為我國(guó)圖書情報(bào)界關(guān)注與討論的熱點(diǎn),對(duì)信息推送的技術(shù)、內(nèi)容、方式、應(yīng)用和存在的問(wèn)題等進(jìn)行了研究[7],尤其在數(shù)字圖書館信息推送中得到較多的實(shí)踐,如浙江大學(xué)圖書館推出了入藏新書郵件推送服務(wù)[8],西北工業(yè)大學(xué)圖書館對(duì)三大索引收錄論文進(jìn)行郵件推送服務(wù)等[9]。期刊擁有3支較大的隊(duì)伍,即作者隊(duì)伍、審稿專家隊(duì)伍和編委隊(duì)伍,他們是期刊文獻(xiàn)潛在的用戶群。由于用戶以拉取模式獲取期刊文獻(xiàn)存在以上問(wèn)題,筆者提出基于用戶科研工作文獻(xiàn)信息的需要,以電子郵件方式進(jìn)行期刊文獻(xiàn)的推送,以便用戶能夠及時(shí)獲取和引用相關(guān)文獻(xiàn)信息。這樣可以宣傳與推介期刊,轉(zhuǎn)變服務(wù)理念,由過(guò)去的用戶單向被動(dòng)獲取文獻(xiàn),到現(xiàn)在的期刊主動(dòng)出擊,從而加強(qiáng)用戶與期刊的互動(dòng)與合作,以實(shí)現(xiàn)“推”“拉”結(jié)合的方式,為用戶提供更及時(shí)、主動(dòng)和有針對(duì)性的文獻(xiàn)服務(wù),提升期刊文獻(xiàn)的顯示度、利用率和影響力。

      2電子郵件系統(tǒng)進(jìn)行期刊文獻(xiàn)推送的策略

      2.1用戶數(shù)據(jù)庫(kù)的建立

      要向用戶推送期刊文獻(xiàn),必須要有需求期刊文獻(xiàn)用戶的數(shù)據(jù)信息和電子郵件地址等,可以通過(guò)多種渠道準(zhǔn)確獲取用戶的有關(guān)信息:一是通過(guò)編輯部的投審稿系統(tǒng)提取投稿作者及評(píng)審專家的信息,如用戶姓名、研究方向及電子郵箱等;二是通過(guò)編委資源庫(kù)獲取相關(guān)編委的個(gè)人信息;三是通過(guò)行業(yè)學(xué)術(shù)會(huì)議的通訊錄等提取相關(guān)專業(yè)學(xué)者的信息;四是通過(guò)高校院系網(wǎng)站獲取專業(yè)學(xué)科帶頭人及有關(guān)學(xué)者的信息;五是與其他期刊編輯部進(jìn)行資源互換,獲取有關(guān)專家的信息。將收集到的用戶數(shù)據(jù)(用戶名、專業(yè)方向、電子郵箱等)建立在群發(fā)郵件工具Outlook(或OutlookExpress等)中,及時(shí)更新用戶數(shù)據(jù)庫(kù),并將用戶按照專業(yè)方向進(jìn)行歸類分組,不斷挖掘和發(fā)現(xiàn)用戶文獻(xiàn)信息的需求。

      2.2期刊文獻(xiàn)的提取

      篇(10)

      中圖分類號(hào):G251.5文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1003-1588(2015)03-0113-03

      服務(wù)是圖書館永恒的主題,程煥文提出圖書館精神為“智慧與服務(wù)”[1]。2008年孫浩在論文《關(guān)于文獻(xiàn)計(jì)量服務(wù)的研究》首次提出文獻(xiàn)計(jì)量服務(wù)(Bibliometric Service)的概念以及相關(guān)理論。文獻(xiàn)計(jì)量服務(wù)工作是促進(jìn)知識(shí)生產(chǎn)的配套措施,是采用數(shù)學(xué)分析工具和計(jì)算機(jī)技術(shù)對(duì)各類文獻(xiàn)計(jì)量特征進(jìn)行統(tǒng)計(jì)分析,從而發(fā)現(xiàn)文獻(xiàn)情報(bào)規(guī)律、文獻(xiàn)管理方法以及學(xué)科發(fā)展趨勢(shì)的情報(bào)服務(wù)工作,向讀者和社會(huì)提供全方位的文獻(xiàn)分布藍(lán)圖[2]。文獻(xiàn)計(jì)量服務(wù)理念恰好符合圖書館智慧服務(wù)的精神,迎合了圖書館深層次、學(xué)科化服務(wù)的理念,作為拓展延伸高校圖書館科研支持服務(wù)的新生長(zhǎng)點(diǎn),在一定程度上能夠很好地適應(yīng)當(dāng)前高校及其科研工作者的信息需求,為圖書館轉(zhuǎn)變職能角色以及深化學(xué)科服務(wù)提供了切實(shí)可行的理論、方法和途徑。

      1開展文獻(xiàn)計(jì)量服務(wù)工作的基礎(chǔ)

      隨著網(wǎng)絡(luò)信息技術(shù)的飛速發(fā)展以及全面的數(shù)據(jù)庫(kù)資源的開發(fā),分析型數(shù)據(jù)庫(kù)也隨之出現(xiàn),其中比較著名的有SCI、SSCI、ESI、CSSCI、EI、Scopus、Incites等,這些數(shù)據(jù)庫(kù)可以為文獻(xiàn)計(jì)量服務(wù)提供全面而可靠的統(tǒng)計(jì)源,即硬件條件。文獻(xiàn)計(jì)量服務(wù)要求圖書館員掌握一定量的數(shù)學(xué)分析工具和計(jì)算機(jī)技術(shù)方法來(lái)對(duì)各種類型的文獻(xiàn)計(jì)量特征進(jìn)行統(tǒng)計(jì)分析,這項(xiàng)工作具有很強(qiáng)的知識(shí)性與技術(shù)性。高校圖書館近年來(lái)引進(jìn)大量高素質(zhì)高水平人才,其中包含一批既具有學(xué)科背景又有圖書情報(bào)專業(yè)知識(shí)的全能型館員,雖然目前他們暫時(shí)分布在各個(gè)業(yè)務(wù)部門,但經(jīng)過(guò)專業(yè)訓(xùn)練,就會(huì)形成一支能夠開展文獻(xiàn)計(jì)量服務(wù)的隊(duì)伍,因此目前高校圖書館已經(jīng)具備開展文獻(xiàn)計(jì)量服務(wù)的技術(shù)保障與人員力量,這為文獻(xiàn)計(jì)量服務(wù)工作的開展奠定了堅(jiān)實(shí)的基礎(chǔ)。

      2文獻(xiàn)計(jì)量服務(wù)的內(nèi)容

      文獻(xiàn)計(jì)量服務(wù)是使用文獻(xiàn)計(jì)量(信息計(jì)量)分析方法和工具,通過(guò)一定的情報(bào)分析和文獻(xiàn)數(shù)據(jù)挖掘技巧,對(duì)文獻(xiàn)進(jìn)行深層次的加工,技術(shù)含量較高,屬于高層次的知識(shí)服務(wù)工作。在高校開展文獻(xiàn)計(jì)量服務(wù),通過(guò)對(duì)各類文獻(xiàn)計(jì)量特征進(jìn)行統(tǒng)計(jì)與分析,從而發(fā)現(xiàn)文獻(xiàn)情報(bào)規(guī)律、文獻(xiàn)管理方法以及學(xué)科發(fā)展趨勢(shì),達(dá)到對(duì)研究機(jī)構(gòu)、科研工作者或?qū)W科科研競(jìng)爭(zhēng)力以及學(xué)科發(fā)展態(tài)勢(shì)發(fā)展?fàn)顩r等進(jìn)行客觀評(píng)估及分析[3],以評(píng)估科研績(jī)效和檢測(cè)科研發(fā)展態(tài)勢(shì),從而輔助科研管理者進(jìn)行科研決策,包括學(xué)校人才的整體狀況分析以及各學(xué)科師資力量的分布、科研課題的申報(bào)與獎(jiǎng)勵(lì),科研基金分配、成果獎(jiǎng)勵(lì)、人才選拔與引進(jìn)等。輔助研究者的科學(xué)研究包括分析本學(xué)科的發(fā)展態(tài)勢(shì)、個(gè)人的科研業(yè)績(jī)以及在同行中的競(jìng)爭(zhēng)優(yōu)勢(shì)、研究前沿、趨勢(shì)、引領(lǐng)學(xué)科發(fā)展等。具體可以通過(guò)對(duì)學(xué)術(shù)期刊、文獻(xiàn)的統(tǒng)計(jì)分析,了解研究機(jī)構(gòu)分布、學(xué)科的成長(zhǎng)階段判斷、發(fā)展趨勢(shì)預(yù)測(cè)等,以此作為評(píng)價(jià)學(xué)科發(fā)展的依據(jù)。通過(guò)對(duì)科研能力、優(yōu)勢(shì)學(xué)科分布、發(fā)展?fàn)顩r、人力資源狀況、科研效率等進(jìn)行統(tǒng)計(jì)分析,可以對(duì)學(xué)術(shù)機(jī)構(gòu)進(jìn)行評(píng)價(jià)。還可以通過(guò)某一著者的科研論文及專著發(fā)表情況、研究領(lǐng)域與專長(zhǎng)、學(xué)術(shù)貢獻(xiàn)、科研潛在能力等進(jìn)行著者評(píng)價(jià)。文獻(xiàn)計(jì)量服務(wù)在很大程度上是以大型分析數(shù)據(jù)庫(kù)作為依據(jù),主要以科研論文作為學(xué)科分析與評(píng)價(jià)統(tǒng)計(jì)源,具體的基于論文數(shù)據(jù)平臺(tái)的學(xué)科分析見表1。表1學(xué)科分析常用論文數(shù)據(jù)庫(kù)平臺(tái)

      數(shù)據(jù)庫(kù)名稱評(píng)價(jià)指標(biāo)評(píng)價(jià)內(nèi)容評(píng)價(jià)維度ESI數(shù)據(jù)庫(kù)國(guó)際論文總量排名總體科研表現(xiàn)國(guó)際論文總被引排名總體學(xué)科影響力學(xué)科綜合實(shí)力Incites數(shù)據(jù)庫(kù)WOS數(shù)據(jù)平臺(tái)論文占全球的比例科研活躍度論文總被引占全球的比例科研影響力學(xué)科H指數(shù)學(xué)術(shù)綜合實(shí)力學(xué)術(shù)影響力Incites數(shù)據(jù)庫(kù)ESI數(shù)據(jù)庫(kù)WOS數(shù)據(jù)平臺(tái)篇均被引的全球均值比科研平均質(zhì)量ESI高被引論文或熱點(diǎn)論文比例科研前沿性頂級(jí)期刊論文的國(guó)際份額同行認(rèn)可度基金項(xiàng)目的論文質(zhì)量項(xiàng)目完成質(zhì)量學(xué)術(shù)質(zhì)量Incites數(shù)據(jù)庫(kù)國(guó)際合作論文占全球的比例國(guó)際科研合作國(guó)際會(huì)議論文占全球的比例國(guó)際學(xué)術(shù)交流國(guó)際合作與交流WOS數(shù)據(jù)平臺(tái)跨院系的合作論文比例學(xué)科交叉活躍度跨院系的合作論文的學(xué)科分布學(xué)科交叉的聚度跨院系的合作論文的期刊及被引學(xué)科交叉的質(zhì)量學(xué)科交叉王芳,龐德盛,楊錯(cuò):高校圖書館開展文獻(xiàn)計(jì)量服務(wù)的探索與思考王芳,龐德盛,楊錯(cuò):高校圖書館開展文獻(xiàn)計(jì)量服務(wù)的探索與思考學(xué)校的職能部門即科研管理者和科研機(jī)構(gòu)及科研工作者對(duì)文獻(xiàn)計(jì)量服務(wù)的關(guān)注側(cè)重點(diǎn)各有不同,因此文獻(xiàn)計(jì)量服務(wù)針對(duì)不同的對(duì)象采取不同的服務(wù)內(nèi)容,這樣服務(wù)才更合理、更具針對(duì)性。

      3文獻(xiàn)計(jì)量服務(wù)的模式

      根據(jù)文獻(xiàn)計(jì)量服務(wù)的特點(diǎn),將服務(wù)模式分為兩種,主動(dòng)推送和用戶個(gè)性化定制。主動(dòng)推送就是定期通過(guò)微博、微信、圖書館主頁(yè)、簡(jiǎn)報(bào)等平臺(tái)主動(dòng)推送服務(wù)產(chǎn)品,或通過(guò)培訓(xùn)講座、問(wèn)卷調(diào)查、讀者沙龍等形式讓大家充分了解圖書館館員所做的工作及其價(jià)值,特別是工作開展初期,在用戶對(duì)文獻(xiàn)計(jì)量服務(wù)不了解的情況下,這種模式可以讓用戶了解文獻(xiàn)計(jì)量服務(wù)人員所能做的科研服務(wù)內(nèi)容及服務(wù)價(jià)值。圖書館可以提供個(gè)性化服務(wù),年齡在40歲以上的副教授和教授由于在業(yè)界已經(jīng)有了一定名譽(yù)和地位,可以對(duì)他們進(jìn)行團(tuán)隊(duì)學(xué)術(shù)影響力的分析(包括團(tuán)隊(duì)科研成果的產(chǎn)出情況、被引用情況及影響力、H指數(shù)以及與其他團(tuán)隊(duì)合作情況進(jìn)行分析),同時(shí)也關(guān)注教授個(gè)人在全球、國(guó)內(nèi)、同行中的位置,如某教授本人的科研狀況分析,某教授科研論文發(fā)文量和被引情況分析。而對(duì)于剛進(jìn)入科研領(lǐng)域的年輕教師,文獻(xiàn)計(jì)量服務(wù)就要重點(diǎn)關(guān)注學(xué)者個(gè)人學(xué)術(shù)影響力的分析和所在學(xué)科領(lǐng)域的發(fā)展態(tài)勢(shì),還可以對(duì)教師本人在本學(xué)科領(lǐng)域的成就和影響力進(jìn)行分析評(píng)價(jià)。文獻(xiàn)計(jì)量服務(wù)的個(gè)性化科研分析,不僅有利于挖掘?qū)W科領(lǐng)域中堅(jiān)力量和有潛力的科研人才,還可以挖掘某一領(lǐng)域的知識(shí)淵源、演進(jìn)脈絡(luò)、熱點(diǎn)研究等內(nèi)容。通過(guò)對(duì)高校及其內(nèi)部的各種計(jì)量對(duì)象進(jìn)行統(tǒng)計(jì)分析,可以為高校管理者的科研決策提供參考。

      4文獻(xiàn)計(jì)量服務(wù)的業(yè)務(wù)框架

      通過(guò)分析文獻(xiàn)計(jì)量服務(wù)的對(duì)象、模式及核心業(yè)務(wù)流程,并將這些流程與服務(wù)業(yè)務(wù)框架有機(jī)融合在一起,初步建立起文獻(xiàn)計(jì)量服務(wù)的業(yè)務(wù)框架。文獻(xiàn)計(jì)量服務(wù)工作首先要確定服務(wù)對(duì)象的層次進(jìn)而選擇相應(yīng)的服務(wù)模式,然后找出與之相匹配的服務(wù)方法,再根據(jù)文獻(xiàn)計(jì)量服務(wù)的核心業(yè)務(wù)流程進(jìn)行有效文獻(xiàn)計(jì)量產(chǎn)品的創(chuàng)造,最后綜合反饋的結(jié)果,進(jìn)行數(shù)據(jù)的綜合分析,形成最終的文獻(xiàn)計(jì)量服務(wù)報(bào)告。

      5討論

      5.1文獻(xiàn)計(jì)量服務(wù)是圖書館構(gòu)建主導(dǎo)型服務(wù)模式的途徑

      近年來(lái),隨著圖書情報(bào)事業(yè)外部發(fā)展環(huán)境的不斷變化以及圖書情報(bào)學(xué)新理論、新思想的不斷呈現(xiàn),圖情專家開始從廣義的服務(wù)視角,思索探討發(fā)揮圖書情報(bào)機(jī)構(gòu)的文獻(xiàn)計(jì)量功能。高校圖書館新時(shí)期提升工作水平的一個(gè)重要突破口就是著力強(qiáng)化決策服務(wù)功能,顯著提升參考咨詢工作水平。高校圖書館特別是研究型高校圖書館擁有豐富的文獻(xiàn)信息資源優(yōu)勢(shì),又集合了專業(yè)學(xué)科館員力量,大多具有調(diào)研課題的成功經(jīng)驗(yàn),完全有條件建立文獻(xiàn)計(jì)量服務(wù)部門。圖書館應(yīng)加快情報(bào)服務(wù)水平的提升,提供與教學(xué)科研相關(guān)的信息和情報(bào)研究產(chǎn)品,構(gòu)建主導(dǎo)型服務(wù)模式。

      5.2文獻(xiàn)計(jì)量服務(wù)是實(shí)現(xiàn)高校圖書館可持續(xù)發(fā)展的選擇

      將文獻(xiàn)計(jì)量服務(wù)理念引入高校圖書館,更好地實(shí)現(xiàn)智慧服務(wù),不僅可以提高圖書館對(duì)高校教學(xué)和科研的影響力,而且可以為圖書館尋求和發(fā)展服務(wù)新的生長(zhǎng)點(diǎn)提供有力支持。隨著現(xiàn)代信息技術(shù)的不斷發(fā)展,圖書館情報(bào)學(xué)的技術(shù)含量也相應(yīng)地提高,賦予其全新內(nèi)涵,可以說(shuō),加強(qiáng)并大力發(fā)展圖書情報(bào)領(lǐng)域?qū)W科化服務(wù)必然成為高校圖書館可持續(xù)發(fā)展的要求。文獻(xiàn)計(jì)量服務(wù)為高校圖書館在大學(xué)中的角色轉(zhuǎn)變打開一扇新的大門,使圖書館參與到高校的科研發(fā)展、政策制定和學(xué)科引領(lǐng)之中,轉(zhuǎn)變其在高校發(fā)展中的邊緣角色。通過(guò)創(chuàng)新服務(wù),真正迎合用戶科研支持服務(wù)需求,探索有效的文獻(xiàn)計(jì)量服務(wù)模式,建立可持續(xù)發(fā)展的長(zhǎng)效服務(wù)機(jī)制,真正實(shí)現(xiàn)圖書館服務(wù)的不可替代性,實(shí)現(xiàn)高校圖書館的可持續(xù)發(fā)展[5]。

      5.3文獻(xiàn)計(jì)量服務(wù)是高校發(fā)展的需要

      學(xué)科建設(shè)是高等院校提高教學(xué)質(zhì)量和科研水平的重要基礎(chǔ),而學(xué)科發(fā)展策略的制定首先需要對(duì)自身的學(xué)科發(fā)展情況進(jìn)行客觀準(zhǔn)確的評(píng)估和分析,進(jìn)而合理地完善自身的學(xué)科體系、加強(qiáng)重點(diǎn)學(xué)科的優(yōu)勢(shì)。國(guó)內(nèi)外高校也越來(lái)越重視通過(guò)各種類型的學(xué)科評(píng)估把握自身的學(xué)科發(fā)展態(tài)勢(shì)、本學(xué)科的優(yōu)勢(shì)和劣勢(shì)、重點(diǎn)研究方向、資源分配方案等,從而對(duì)高校的學(xué)科發(fā)展戰(zhàn)略提供重要依據(jù)和指導(dǎo)意義。通過(guò)文獻(xiàn)計(jì)量和相關(guān)統(tǒng)計(jì)數(shù)據(jù)的分析能幫助科研人員很好地判斷出某一學(xué)科的發(fā)展現(xiàn)狀、發(fā)展趨勢(shì)及潛力,同時(shí)也能在一定程度上判斷出科研人員的科研能力、學(xué)術(shù)水平及影響力。隨著文獻(xiàn)計(jì)量理論研究和應(yīng)用的不斷深入,適時(shí)在高校圖書館推出文獻(xiàn)計(jì)量服務(wù)模式是一種必然趨勢(shì)。在信息化大環(huán)境下,面對(duì)新的機(jī)遇和挑戰(zhàn),高校圖書館必須積極分析自己的優(yōu)勢(shì)并加以充分利用與發(fā)揮,提升圖書館的軟實(shí)力。

      參考文獻(xiàn):

      [1]程煥文.實(shí)在的圖書館精神與圖書館精神的實(shí)在――《圖書館精神》自序[J].大學(xué)圖書館學(xué)報(bào),2006(4):2-14.

      [2]孫浩.關(guān)于文獻(xiàn)計(jì)量服務(wù)的研究[J].現(xiàn)代情報(bào),2008(6):64-66.

      [3]孫玉偉,劉昌榮,朱玉強(qiáng).大學(xué)圖書館文獻(xiàn)計(jì)量服務(wù)實(shí)踐探索[J].圖書館雜志,2014(1):56-61.

      篇(11)

      中圖分類號(hào):F299.2 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3198(2010)02-0028-02

      1 分部門、分災(zāi)種的危機(jī)管理決策支持系統(tǒng)

      我國(guó)防震減災(zāi)系統(tǒng)應(yīng)用和輔助決策系統(tǒng)的發(fā)展是與計(jì)算機(jī)技術(shù),主要是GIS技術(shù)的發(fā)展相輔相成的。在20世紀(jì)80年代初,我國(guó)通過(guò)世行貸款開始了有關(guān)城市地理信息系統(tǒng)的開發(fā)研究。“九五”期間,結(jié)合950 項(xiàng)目(大中城市防震減災(zāi)示范研究與應(yīng)用),地震系統(tǒng)有關(guān)單位在烏魯木齊、天津、大連、合肥、自貢、泰安、福州、廈門等地建立了各自地區(qū)的“基于GIS的防震減災(zāi)信息與輔助決策系統(tǒng)”,利用GIS等工具軟件,姚保華(2002)將區(qū)域地震環(huán)境、震害預(yù)測(cè)成果和應(yīng)急輔助決策模塊等進(jìn)行集成。云南地震局王景來(lái)(1999)將GIS應(yīng)用到地震災(zāi)害的評(píng)估提出將地震災(zāi)害評(píng)估智能化或半智能化的設(shè)想,在此基礎(chǔ)上建立了玉溪地震減災(zāi)信息系統(tǒng)。上海地震局宋俊高、火恩杰等(2000)將GIS應(yīng)用到城市防震減災(zāi)應(yīng)急研究,以上海市寶山區(qū)為試點(diǎn),建立了上海市防震減災(zāi)應(yīng)急決策信息系統(tǒng)。王曉青等(2004)利用現(xiàn)代通訊技術(shù)、GIS技術(shù)和信息處理技術(shù),構(gòu)建了基于GIS的地震現(xiàn)場(chǎng)災(zāi)害損失評(píng)估系統(tǒng),實(shí)現(xiàn)破壞性地震發(fā)生后地震現(xiàn)場(chǎng)災(zāi)害損失的快速、動(dòng)態(tài)評(píng)估,現(xiàn)場(chǎng)震情和災(zāi)情信息的顯示以及各種信息的遠(yuǎn)程交換。

      火災(zāi)是各種災(zāi)害中發(fā)生最頻繁且具有很強(qiáng)破壞性的一種。謝喚亮(1997)給出了基于GIS的決策支持系統(tǒng)的框架,并在南京市消防指揮中心初步實(shí)現(xiàn)。許云,任愛(ài)珠(2003)對(duì)虛擬現(xiàn)實(shí)技術(shù)(VR)在基于GIS的城市消防指揮系統(tǒng)中的應(yīng)用進(jìn)行了研究。朱霽平(2004)建立城市火災(zāi)應(yīng)急決策支持系統(tǒng),一旦發(fā)生火災(zāi),信息可以迅速傳遞到指揮中心,并快速模擬災(zāi)害現(xiàn)場(chǎng)情況、預(yù)測(cè)災(zāi)害發(fā)展趨勢(shì),綜合各種要素,生成救援方案,有效調(diào)度和科學(xué)利用消防減災(zāi)資源。

      國(guó)內(nèi)防洪減災(zāi)決策支持系統(tǒng)的研究起源于20世紀(jì)80年代末期,特別是國(guó)家在“八五”期間安排的“八五”重點(diǎn)科技攻關(guān)項(xiàng)目――長(zhǎng)江、黃河、淮河防洪減災(zāi)DSS研究,出現(xiàn)了很多比較成功的成果,胡四一等(1996)在分析總結(jié)長(zhǎng)江中下游防洪經(jīng)驗(yàn)和防洪決策流程的基礎(chǔ)上,研究防洪決策支持系統(tǒng)建立的開發(fā)模式、程序、方法、技術(shù)和應(yīng)用模式,研制和開發(fā)了系統(tǒng)中總控管理――人機(jī)界面系統(tǒng)、數(shù)據(jù)庫(kù)、知識(shí)庫(kù)、系統(tǒng)接口和通訊軟件、洪水演進(jìn)和調(diào)度仿真模型、防洪決策風(fēng)險(xiǎn)分析模型等,初步建立了可運(yùn)行的原型系統(tǒng),并通過(guò)聯(lián)機(jī)試驗(yàn)運(yùn)行、檢驗(yàn)系統(tǒng)設(shè)計(jì)、推進(jìn)分洪決策支持系統(tǒng)的實(shí)際應(yīng)用。到20世紀(jì)90年代初,又有翁文斌等開發(fā)的安陽(yáng)市防洪DSS,浙江省洪澇臺(tái)風(fēng)災(zāi)害預(yù)報(bào)及省級(jí)防洪調(diào)度決策系統(tǒng)、黃河防洪調(diào)度決策支持系統(tǒng)和長(zhǎng)江防洪決策支持系統(tǒng)等投入運(yùn)行。這些系統(tǒng)都以關(guān)系數(shù)據(jù)庫(kù)為核心,系統(tǒng)具有一定的可擴(kuò)展性、可移植性。余達(dá)征等(1999)針對(duì)防洪減災(zāi)DSS的不足和防洪減災(zāi)決策的特點(diǎn),將專家系統(tǒng)中的知識(shí)處理思想引入防洪減災(zāi)DSS中以解決其不足之處。設(shè)計(jì)出智能型的城市防洪減災(zāi)DSS。

      2 城市危機(jī)管理決策支持系統(tǒng)

      2.1 城市危機(jī)管理決策支持系統(tǒng)理論研究

      韓燕暉將城市公共危機(jī)防范與救助系統(tǒng)分為指揮決策系統(tǒng)這一上位系統(tǒng)與預(yù)警系統(tǒng)、預(yù)案系統(tǒng)、信息系統(tǒng)、保障系統(tǒng)、動(dòng)員系統(tǒng)、善后系統(tǒng)等六個(gè)下位系統(tǒng)。劉寧認(rèn)為突發(fā)事件應(yīng)急決策支持系統(tǒng)是用戶通過(guò)人機(jī)交互與系統(tǒng)主推理機(jī)連接,并借助規(guī)則、案例、模糊知識(shí)推理部分共同完成不同庫(kù)間的調(diào)用和內(nèi)部推理求解。朱曉峰等根據(jù)政府決策支持系統(tǒng)的信息復(fù)雜程度和時(shí)效程度將其分為四大類:日常決策支持系統(tǒng)、宏觀決策支持系統(tǒng)、重大活動(dòng)決策支持系統(tǒng)和危機(jī)決策支持系統(tǒng)。惠志斌構(gòu)造了由危機(jī)信息管理預(yù)警、危機(jī)信息管理知識(shí)、危機(jī)管理指揮、危機(jī)管理反應(yīng)、危機(jī)管理恢復(fù)等子系統(tǒng)構(gòu)成的綜合性危機(jī)信息管理系統(tǒng)。谷巖,馮華綜介運(yùn)用數(shù)據(jù)倉(cāng)庫(kù)、聯(lián)機(jī)分析處理(OLAP)、數(shù)據(jù)挖掘、信息智能推拉等多種信息處理技術(shù),以多種形式靈活地生成各種應(yīng)急方案。徐志勝等以地理信息系統(tǒng)(G1S)為平臺(tái),集成決策支持系統(tǒng)(DSS),研究開發(fā)了“基于G1S的城市公共安全應(yīng)急決策支持系統(tǒng)”。唐裙裙認(rèn)為應(yīng)該采用五級(jí)架構(gòu),底層是硬件支持層;其次是基礎(chǔ)信息層;基于其上的是決策支撐平臺(tái)層;再上層是決策應(yīng)用平臺(tái)層;最上層是用戶界面,需要針對(duì)不同類型的用戶進(jìn)行設(shè)計(jì)。張茜公共危機(jī)管理決策支持系統(tǒng)的主要功能包括機(jī)理分析、預(yù)警預(yù)報(bào)、資源優(yōu)化、綜合評(píng)價(jià)和決策建議。柳宗偉,景廣軍提出利用信息技術(shù)促進(jìn)我國(guó)城市危機(jī)管理機(jī)制創(chuàng)新的思路,即建立以統(tǒng)一機(jī)構(gòu)(城市危機(jī)管理中心)為核心的調(diào)度統(tǒng)一、聯(lián)動(dòng)協(xié)調(diào)、信息共享的城市綜合危機(jī)管理機(jī)制,研制實(shí)用的城市危機(jī)管理決策支持系統(tǒng)以支持該模式的高效運(yùn)作。

      2.2 城市危機(jī)管理決策支持系統(tǒng)技術(shù)支撐

      在智能決策支持系統(tǒng)的算法研究方面,研究的焦點(diǎn)集中在GIS路徑優(yōu)化、案例檢索算法以及數(shù)據(jù)挖掘等方面:黃詩(shī)峰等對(duì)災(zāi)民撤退網(wǎng)絡(luò)流模型及其GIS模擬技術(shù)進(jìn)行了深入研究;羅忠良對(duì)案例推理系統(tǒng)中案例檢索算法的改進(jìn)進(jìn)行了探討;馮興杰等對(duì)有關(guān)數(shù)據(jù)挖掘及其關(guān)聯(lián)規(guī)則算法進(jìn)行了詳細(xì)地討論;陶靈皎,孫繼銀等對(duì)決策樹的算法進(jìn)行詳細(xì)探討并針對(duì)自己的研究對(duì)象作了適當(dāng)優(yōu)化;王秀坤等設(shè)計(jì)了改進(jìn)的EM算法并實(shí)現(xiàn)了在防洪決策中的應(yīng)用。

      2.3 城市危機(jī)管理決策支持系統(tǒng)工程實(shí)踐

      2003年“非典”事件后,我國(guó)目前許多城市已經(jīng)開始設(shè)置專門的應(yīng)急管理機(jī)構(gòu),將應(yīng)急管理作為政府的一項(xiàng)日常的工作來(lái)抓,使城市應(yīng)急管理逐漸走上正規(guī)化和制度化的軌道。已建成的城市應(yīng)急管理機(jī)構(gòu)有北京市突發(fā)公共事件應(yīng)急委員會(huì)、上海市突發(fā)公共事件應(yīng)急管理委員會(huì)、深圳市處置緊急事務(wù)委員會(huì)、廣州110社會(huì)聯(lián)動(dòng)中心、武漢市110聯(lián)動(dòng)服務(wù)中心、南寧市社會(huì)應(yīng)急聯(lián)動(dòng)中心等。城市危機(jī)管理信息系統(tǒng)一般由以下四個(gè)子系統(tǒng),即應(yīng)急指揮系統(tǒng)、應(yīng)急業(yè)務(wù)處理系統(tǒng)、信息與資源共享系統(tǒng)、決策支持系統(tǒng)組成。管理決策支持系統(tǒng)作為城市危機(jī)管理信息系統(tǒng)的一個(gè)子系統(tǒng),目前大多城市尚未進(jìn)行專門建設(shè)。但在某些城市危機(jī)管理信息系統(tǒng)中包含了初步的輔助決策功能,下面分別對(duì)具有代表性的北京、天津、深圳、臺(tái)灣的城市危機(jī)管理信息系統(tǒng)中所包含的輔助決策功能進(jìn)行介紹。

      北京市危機(jī)管理信息系統(tǒng)主要由以下子系統(tǒng)組成:①網(wǎng)絡(luò)通信子系統(tǒng),比如有政府網(wǎng)、應(yīng)急呼報(bào)警網(wǎng);②信息數(shù)據(jù)庫(kù)子系統(tǒng),城市地理環(huán)境數(shù)據(jù)庫(kù)、城市社會(huì)經(jīng)濟(jì)數(shù)據(jù)庫(kù)、災(zāi)害歷史數(shù)據(jù)庫(kù);③應(yīng)急評(píng)估數(shù)學(xué)模型子系統(tǒng),危機(jī)事件潛勢(shì)預(yù)測(cè)模型、社會(huì)災(zāi)變心理分析模型等;④對(duì)策預(yù)案子系統(tǒng),綜合應(yīng)急管理總體預(yù)案,單災(zāi)種專業(yè)應(yīng)急預(yù)案,預(yù)案實(shí)施決策流程;⑤專業(yè)救援子系統(tǒng),比如醫(yī)療急救網(wǎng)、消防網(wǎng)自然災(zāi)害現(xiàn)象救援保障,還有公共設(shè)施搶修隊(duì),治安和反恐防爆隊(duì)。這里應(yīng)急評(píng)估數(shù)學(xué)模型子系統(tǒng)和對(duì)策預(yù)案子系統(tǒng)就包含了初步的輔助決策功能。其應(yīng)急指揮系統(tǒng)中心設(shè)計(jì)聯(lián)動(dòng)國(guó)家減災(zāi)中心、水利、氣象、地震、消防社區(qū)、單位重點(diǎn)區(qū)域,城市生命線系統(tǒng)管理部門,它有一些監(jiān)測(cè)設(shè)備,比如現(xiàn)場(chǎng)空中監(jiān)測(cè),還有現(xiàn)場(chǎng)救援指揮車,對(duì)突發(fā)公共事件進(jìn)行災(zāi)害的動(dòng)態(tài)顯示。還有應(yīng)急對(duì)策的顯示系統(tǒng),根據(jù)專家的意見和對(duì)策,進(jìn)行會(huì)商結(jié)果,最后形成一個(gè)綜合的減災(zāi)策指令。

      天津市負(fù)責(zé)突發(fā)公共事件應(yīng)急管理的主要部門是防災(zāi)應(yīng)急指揮中心,配置有線、無(wú)線通信系統(tǒng)、指揮輔助決策系統(tǒng)、指揮辦公自動(dòng)化系統(tǒng)、遠(yuǎn)程圖像傳輸系統(tǒng)、綜合視訊系統(tǒng)、應(yīng)急供電、供水系統(tǒng)、樓宇保安監(jiān)控系統(tǒng)等,運(yùn)用現(xiàn)代通信網(wǎng)絡(luò)和高技術(shù)手段,實(shí)現(xiàn)各類應(yīng)急信息的收集、處理、整合,為市領(lǐng)導(dǎo)處置重大災(zāi)害和突發(fā)事件實(shí)施應(yīng)急指揮提供了基本平臺(tái)和手段。指揮中心在樓設(shè)置了專家會(huì)商室和相關(guān)單位、搶險(xiǎn)專業(yè)組、應(yīng)急救援隊(duì)工作室,可集中各險(xiǎn)種專家和專業(yè)組、隊(duì)共同會(huì)商,為領(lǐng)導(dǎo)提供輔助決策。

      深圳市應(yīng)急指揮系統(tǒng)的輔助決策概況:深圳政府特別重視對(duì)預(yù)案信息系統(tǒng)的設(shè)計(jì)和開發(fā)。深圳有關(guān)部門制定和修改了各項(xiàng)應(yīng)急預(yù)案,明確各類突發(fā)事件分級(jí)分類定量標(biāo)準(zhǔn),提高預(yù)案的可操作性,并建成預(yù)案數(shù)據(jù)庫(kù),納人應(yīng)急指揮技術(shù)平臺(tái)的“預(yù)案生成系統(tǒng)”。深圳市發(fā)生重特大突發(fā)性事件時(shí),市領(lǐng)導(dǎo)不但可以在應(yīng)急指揮中心通過(guò)視頻、音頻系統(tǒng)進(jìn)行現(xiàn)場(chǎng)指揮,還通過(guò)地理信息系統(tǒng)和電子地圖了解事件發(fā)生地點(diǎn)的具置及周邊情況。同時(shí),系統(tǒng)還將根據(jù)現(xiàn)場(chǎng)和數(shù)據(jù)庫(kù)中的各種數(shù)據(jù),自動(dòng)生成多個(gè)應(yīng)急預(yù)案以供領(lǐng)導(dǎo)決策選擇。

      臺(tái)灣的災(zāi)害管理決策支持系統(tǒng)研究結(jié)合了地理信息系統(tǒng)(GlS)、遙感(RS)、全球定位系統(tǒng)(GPS)以及日益成熟的網(wǎng)絡(luò)技術(shù),建立一套整體性的防災(zāi)救災(zāi)決策支持系統(tǒng)。該系統(tǒng)使用災(zāi)害生命周期法來(lái)進(jìn)行決策支持系統(tǒng)整體架構(gòu)的規(guī)劃,將災(zāi)害從發(fā)生前至發(fā)生后的整個(gè)過(guò)程視為一個(gè)完整的災(zāi)害管理循環(huán)周期,并進(jìn)一步分析各階段所需的決策支持需求,運(yùn)用模組化的概念規(guī)劃其中的各項(xiàng)子系統(tǒng)。完整的災(zāi)害防救決策支持系統(tǒng)資料庫(kù)由地理資料庫(kù)、氣象水文觀測(cè)資料庫(kù)、歷史性災(zāi)害資料庫(kù)、趨勢(shì)分析與境況模擬成果資料庫(kù)、詮釋資料庫(kù)等五大資料庫(kù)組成。臺(tái)灣是多發(fā)地震的地區(qū),以該系統(tǒng)的地震知識(shí)管理為例,通過(guò)“案例式推理”的研究方法,搜集臺(tái)灣歷年來(lái)都市層級(jí)的地震防災(zāi)救災(zāi)相關(guān)研究(不含地質(zhì)研究、地震工程)案例一百余例,并利用英國(guó)Wales大學(xué)所開發(fā)的CBR軟件caspian(1999),建置“地震防災(zāi)救災(zāi)文獻(xiàn)案例式查詢系統(tǒng)”,探討其應(yīng)用于都市防災(zāi)救災(zāi)的可行性,初步獲得了良好的成果。

      參考文獻(xiàn)

      [1]姚保華,陶夏新.分布式防震減災(zāi)系統(tǒng)的可行性[M].南京:東南大學(xué)出版社,2002.10.

      [2]王曉青,丁香.基于GIS的地震現(xiàn)場(chǎng)災(zāi)害損失評(píng)估系統(tǒng)[J].自然災(zāi)害學(xué)報(bào),2004, 13(1):118-125.

      [3]許云,任愛(ài)珠,潘國(guó)帥.基于GIS和VR的消防指揮系統(tǒng)研究[J].土木工程學(xué)報(bào),2003,36(5):92-96.

      [4]朱霽平.基于GIS的城市火災(zāi)應(yīng)急空間決策支持系統(tǒng)和仿真模型[D].中國(guó)科學(xué)技術(shù)大學(xué)博士學(xué)位論文,2004.

      [5]谷巖,馮華.智能化城市防災(zāi)救災(zāi)應(yīng)急處理支持系統(tǒng)的研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2005,(6): 1503-1505.

      主站蜘蛛池模板: 国产精品成人观看视频国产奇米| HEYZO无码综合国产精品227| 国产精品无码日韩欧| 狠狠精品干练久久久无码中文字幕| 国产91大片精品一区在线观看| 91久久精品电影| 99re热视频这里只精品| 国产精品无码素人福利| 亚洲国产第一站精品蜜芽| 精品福利一区二区三区| 久久精品国产亚洲精品2020| 久久久久人妻一区精品| 国产精品九九久久免费视频| 久久久精品2019免费观看| 亚洲精品第一国产综合境外资源 | 国内精品手机在线观看视频| 国产在线精品观看免费观看| 亚洲精品国产成人99久久| 国产成人精品日本亚洲11| 久久久久国产精品嫩草影院| 国产乱码精品一区二区三区中文| 国产精品V亚洲精品V日韩精品| 久久99热精品| 久久久久久亚洲精品成人| 亚洲欧洲美洲无码精品VA| 911亚洲精品不卡| 国内精品久久久久久野外| 一色屋精品视频在线观看| 中文精品人人永久免费| 亚洲色精品88色婷婷七月丁香| 亚洲精品天堂成人片?V在线播放| 无码人妻一区二区三区精品视频 | 91精品国产麻豆国产自产在线| 亚洲视频在线精品| 国产成人无码精品久久久免费 | 国产欧美在线观看精品一区二区 | 久久精品成人免费网站| 亚洲国产精品无码久久| 亚洲AV日韩精品久久久久久久| 亚洲AV无码国产精品色午友在线| 国产免费久久精品丫丫|