<dfn id="a4kkq"></dfn>
<ul id="a4kkq"></ul>
    • 大數(shù)據(jù)開發(fā)的過程大全11篇

      時間:2023-05-15 11:54:45

      緒論:寫作既是個人情感的抒發(fā),也是對學術(shù)真理的探索,歡迎閱讀由發(fā)表云整理的11篇大數(shù)據(jù)開發(fā)的過程范文,希望它們能為您的寫作提供參考和啟發(fā)。

      大數(shù)據(jù)開發(fā)的過程

      篇(1)

      數(shù)據(jù)技術(shù)事實上是將人類日常生活中產(chǎn)生的各種數(shù)字信息,將這些信息收集起來之后分類處理,設(shè)定不同類別的存儲空間,按照類別存儲。大數(shù)據(jù)技術(shù)從功能的角度出發(fā)可以劃分為多個類別,諸如分析技術(shù)、機器學習技術(shù)、遺傳算法技術(shù)、自然語音處理技術(shù)等。應用大數(shù)據(jù)技術(shù)分析,就是基于當前的科學技術(shù)發(fā)展起來的一種分析技術(shù)。它主要依靠現(xiàn)代科技手段發(fā)揮技術(shù)的作用,特別網(wǎng)絡技術(shù)發(fā)揮著基礎(chǔ)性的作用。整理基礎(chǔ)數(shù)據(jù),對數(shù)據(jù)信息進行分類整理,應用相應的計算機算法,將相似特性的數(shù)據(jù)劃分為一類,最終得到大量的數(shù)據(jù),應用大數(shù)據(jù)技術(shù)對這些數(shù)據(jù)進行分析。大數(shù)據(jù)分析應用于互聯(lián)網(wǎng)行業(yè)中,所發(fā)揮的優(yōu)勢是有目共睹的,而且還不斷地引入新技術(shù),在軟件工程技術(shù)中應用,對該技術(shù)的發(fā)展起到了促進作用[1]。

      大數(shù)據(jù)時代,社會各個領(lǐng)域都已經(jīng)實現(xiàn)了信息化發(fā)展,人們對軟件工程的概念越來越熟悉。事實上,軟件工程的歷史始于20世紀的中期,其研究重點是軟件技術(shù)和工程管理。將相關(guān)工程內(nèi)容引入其中,使得工程系統(tǒng)化運行,其中所涵蓋的研究內(nèi)容包括軟件的生命周期、軟件工程設(shè)計、軟件的技術(shù)維護等方面。因此,在軟件設(shè)計的過程中,要控制好技術(shù)開發(fā)成本,保證工程質(zhì)量,使其生命周期不斷延長,不同項目的技術(shù)需求和用戶的各種技術(shù)需求都能夠得到滿足。

      2大數(shù)據(jù)背景下的軟件工程基礎(chǔ)

      處于大數(shù)據(jù)時代環(huán)境中,軟件工程的發(fā)展中關(guān)乎到不同的領(lǐng)域,需要高度重視。大數(shù)據(jù)技術(shù)具有專業(yè)性的特點,還具有很強的實用性價值。在軟件工程技術(shù)的研究中,要從應用需求出發(fā)不斷創(chuàng)新軟件技術(shù),對于傳統(tǒng)的技術(shù)要不斷摒棄,對軟件工程的發(fā)展創(chuàng)造良好的客觀條件。大數(shù)據(jù)技術(shù)環(huán)境下,軟件工程基礎(chǔ)是基于互聯(lián)網(wǎng)技術(shù)建立起來的,對各種數(shù)據(jù)信息系統(tǒng)化管理,根據(jù)需要進行處理,對工業(yè)的發(fā)展非常有利[2]。在軟件工程技術(shù)中,大數(shù)據(jù)的安全性問題是需要高度重視的,否則,就會對軟件工程技術(shù)造成不良影響,引起嚴重的后果。

      2.1軟件服務工程

      在軟件工程的研究范疇中,軟件服務工程的數(shù)量不斷增多。軟件工程服務化方向發(fā)展,就是發(fā)揮服務的作用,使其成為軟件開發(fā)的基本原則,按照服務項目內(nèi)容為用戶展開服務。由于軟件工程發(fā)展的主題有所,服務內(nèi)容也要做出相應的調(diào)整,同城是對軟件工程的進行技術(shù)維護。在具體的服務工作中,需要軟件開發(fā)人員使用分布式應用程序,在管理工作中采用虛擬操作的方法為用戶2019.08提供服務[3]。軟件工程技術(shù)應用中,結(jié)合使用大數(shù)據(jù)技術(shù),可以對網(wǎng)絡數(shù)據(jù)進行編程,使得軟件具有互操作性,對于數(shù)據(jù)主動協(xié)調(diào),使其符合動態(tài)場景的變化節(jié)奏,軟件系統(tǒng)的集成度有所提高。

      2.2軟件開源

      軟件開源更為注重用戶對軟件技術(shù)的體驗。在對軟件開源進行研究的過程中,采用常規(guī)的方法,雖然獲得一定的成果,但是應用價值不是很高。一些研究人員在研究軟件工程技術(shù)的時候,就是將軟件開源作為突破口,將開發(fā)項目劃分為多個模塊,將每個模塊分給指定的研究人員進行開發(fā)。

      2.3群體軟件工程

      群體軟件工程是通過網(wǎng)絡的方式進行軟件開發(fā),具體的實施中采用工程眾包的形式,使得軟件開發(fā)技術(shù)發(fā)揮作用。群體軟件工程是一個分布式軟件開發(fā)模型,這個工程項目的運行中,可以通過網(wǎng)絡實現(xiàn),對各項任務進行分配,也可以進行創(chuàng)造性的查詢,通過眾包解決軟件開發(fā)過程中遇到的一些困難和重要問題。同時,在軟件工程開發(fā)過程中,軟件工程可以在任何階段通過眾包進行開發(fā)[4]。

      3大數(shù)據(jù)與軟件工程技術(shù)的未來發(fā)展方向

      3.1大數(shù)據(jù)與軟件工程技術(shù)開放式的發(fā)展

      大數(shù)據(jù)技術(shù)的主要前提是大量的數(shù)據(jù)流,需要技術(shù)不斷地升級和創(chuàng)新,尋求開發(fā)的研究途徑是非常必要的。計算機網(wǎng)絡的發(fā)展意味著計算機可以在開放的環(huán)境中相互通信,共享數(shù)據(jù)資源,軟件等信息的有效利用能力也會有所提升。通過網(wǎng)絡運行可以增加利潤,使得用戶的各種需求得到滿足,提高資源的利用率。

      3.2大數(shù)據(jù)與軟件工程技術(shù)融合到其他領(lǐng)域

      軟件工程技術(shù)在當今許多科學領(lǐng)域有著廣泛的應用。由于軟件工程技術(shù)給予各個領(lǐng)域非常大的幫助,從航空到生活中都發(fā)揮著軟件工程技術(shù)的作用[5]。應用程序的運行,可以使用數(shù)據(jù)平臺對信息進行收集并分析。比如,用戶在進行股票交易的過程中應用大數(shù)據(jù)技術(shù),可以使用軟件工程技術(shù)構(gòu)建數(shù)據(jù)模型,通過對數(shù)據(jù)模型的分析,預測股票的變化趨勢。

      4眾包軟件服務工程中的大數(shù)據(jù)技術(shù)

      在軟件開發(fā)過程中,必須有足夠的硬件和軟件基礎(chǔ)來支持數(shù)據(jù)流,隨著數(shù)據(jù)流的量逐漸增多,對硬件和軟件就有了新的要求。專家學者在分析數(shù)據(jù)流的時候,還對在線服務進行了研究。數(shù)據(jù)流是重點內(nèi)容,主要是對數(shù)據(jù)流的使用方法進行研究,對支撐數(shù)據(jù)流的軟件和硬件進行研究[6]。從軟件工程開發(fā)的角度而言,軟件運行中都會產(chǎn)生大量的數(shù)據(jù)流,包括服務端、用戶端等,都會有很多的數(shù)據(jù)信息產(chǎn)生,這些數(shù)據(jù)流對軟件和硬件的使用壽命起到了決定性的作用。軟件工程的開發(fā)中,要做好數(shù)據(jù)流的管理工作。有必要對原始數(shù)據(jù)進行深入的研究,為提高軟件的使用壽命創(chuàng)造條件,對數(shù)據(jù)流的分析要高度重視[7]。

      5密集型數(shù)據(jù)科研第四范式

      第四種科學研究范式是指根據(jù)實際情況建立獨立的科學研究方法,探索第四種范式的理論基礎(chǔ),以及大型數(shù)據(jù)存儲設(shè)備在發(fā)展中的重要性。軟件工程中,采用傳統(tǒng)的大數(shù)據(jù)研究方法,大數(shù)據(jù)的有效分析是不可能的,大數(shù)據(jù)的研究還沒有取得突破性的成果。因此,目前大多數(shù)軟件不能在短時間內(nèi)同時實現(xiàn)數(shù)據(jù)信息的存儲、數(shù)據(jù)信息的傳輸和有效識別。在探索第四范式理論和研究方法的過程中,首先需要對集成大數(shù)據(jù)的軟件服務價值進行估計,拋棄傳統(tǒng)的大數(shù)據(jù)統(tǒng)計方法,建立新的大數(shù)據(jù)信息統(tǒng)計方法和分析方法[8]。此外,有必要從多個方面研究大數(shù)據(jù)的處理,對大數(shù)據(jù)信息進行管理并深入分析,討論大數(shù)據(jù)的價值以及存在的可變性,這對軟件工程的發(fā)展起著重要的作用。在研究軟件工程技術(shù)的時候,必須更新傳統(tǒng)的軟件開發(fā)理念,重視軟件處理和分析大數(shù)據(jù)能力的發(fā)展,使得軟件產(chǎn)業(yè)呈現(xiàn)出新的發(fā)展面貌。

      在當今大數(shù)據(jù)時代,軟件工程技術(shù)的研究已經(jīng)區(qū)域復雜。隨著數(shù)據(jù)的指數(shù)的不斷增長,軟件技術(shù)對硬件設(shè)備數(shù)據(jù)處理能力產(chǎn)生一定的影響。因此,在對軟件工程技術(shù)的研究中,就需要對大數(shù)據(jù)技術(shù)的特點進行研究,基于此研究軟件工程技術(shù),使得硬件設(shè)備的數(shù)據(jù)處理能力有所提高。在研發(fā)開發(fā)軟件技術(shù)的過程中,要從應用領(lǐng)域的需求出發(fā)對大數(shù)據(jù)技術(shù)進行分析,在大數(shù)據(jù)開發(fā)理論的基礎(chǔ)上創(chuàng)新軟件開發(fā)理論,促進軟件技術(shù)更好地發(fā)展。

      篇(2)

      二、大數(shù)據(jù)對高等教育的重要性

      1.大數(shù)據(jù)便于分析學習行為

      在教育活動中,教育數(shù)據(jù)是對教育成效、創(chuàng)新思維、創(chuàng)新能力、科研活動、學習主動性、學習積極性和教學活動進行分析的重要依據(jù),它為教育教學和科研活動提供重要的科學依據(jù)和可行性論證的材料。教育數(shù)據(jù)可以通過面授的方法即面對面的教育互動獲取,如一問一答、講座交流、分組討論、課題合作、興趣小組等,教育數(shù)據(jù)也可以通過網(wǎng)絡課程平臺或慕課等多媒體課程獲取,以這種方式獲取的數(shù)據(jù)樣本大、效率高、存儲方便。教育大數(shù)據(jù)可以呈現(xiàn)學生學習的即時效果以及學生參與課堂教學和科研活動的情況,這是智慧教育的客觀分析的依據(jù)和比較研究的素材。教育大數(shù)據(jù)以其便利性和可操作性為學生學習行為的研究和分析提供了便利條件。首先,教育大數(shù)據(jù)便于對學生學習行為進行分析。教育大數(shù)據(jù)便于留存,方便調(diào)閱,有助于評價和分析學生的學習行為,進而有針對性地解決問題。其次,教育大數(shù)據(jù)便于教師從全局把控學生的學習情況。利用數(shù)據(jù)的關(guān)聯(lián)性和演繹規(guī)律,可以從中獲取課堂上學生互動、課堂接受程度和專注度等教學反饋信息,有利于挖掘個體學生的學習特點,推進個性化教學,或從整體上評估學習行為,對學生進行科學指導。最后,便于教育管理者更好地組織教育資源。教育管理者可以從教育大數(shù)據(jù)中挖掘有價值的信息,制定教育改革的方向和措施,并采取和風細雨、滋潤心田的管理方式。

      2.大數(shù)據(jù)促進教育科學化發(fā)展

      首先,大數(shù)據(jù)提供智能學習平臺。將眾多的高校信息收集起來,資源共享,信息互通,讓世界高校變成地球村,這給教育智能化發(fā)展創(chuàng)造了極好的條件。芝加哥大學等多所世界名校達成共識,聯(lián)合建設(shè)在線教育公共課程,通過網(wǎng)絡平臺免費開放課程,供全球幾十萬人同時收聽或觀看同一知名教授的課程,共享學術(shù)精髓。這是教育資源的高效利用,也是高教發(fā)展的必然。同時,還可以在網(wǎng)絡平臺上通過MOOC等多種形式進行學術(shù)討論和交流。智能化學習平臺讓學習和交流變得更便捷。其次,大數(shù)據(jù)構(gòu)建全新教學模式。大數(shù)據(jù)的應用給高等教育帶來了革命性變革,面對面的課堂講授形式面臨建立在教育大數(shù)據(jù)基礎(chǔ)上的在線、視頻、多維度、全視角的立體化教育模式的挑戰(zhàn)。教育大數(shù)據(jù)時代的教學模式,其知識傳授途徑已從課堂走向網(wǎng)絡,從線下走到線上;其知識傳授不受時空限制,可以隨時隨地上網(wǎng)學習在線課程,接受世界名師的網(wǎng)絡課程教育;其教學方式也更靈活。通過觀察或記錄鼠標對某一知識點的點擊量、在一張幻燈片上停留的時間的長短、回答問題后有針對性的關(guān)注的有無等情況,可以判斷不同的人對不同知識點的關(guān)注和接受程度,從而使得視情況而定的詳解或弱講,或個性化、差異化教學得以實現(xiàn)。教育大數(shù)據(jù)時代的教學模式還有效地延伸了教學資源和師資。在線上接受世界名師授課,這是高等教育全方位、全時空的重大突破。最后,大數(shù)據(jù)促進教育科技創(chuàng)新。高等教育大數(shù)據(jù)通過提供科技創(chuàng)新所需要的信息資源、科研知識和科技問題交流的平臺以及科技信息的實時交流,促進了產(chǎn)學研協(xié)同創(chuàng)新,促進了成果的轉(zhuǎn)化和創(chuàng)新。高等教育大數(shù)據(jù)之所以能夠發(fā)揮這樣的作用,是因為它積聚了科研、教學、工程信息、管理科學、音樂藝術(shù)等海量信息,而且這些集音頻、視頻、文字、圖形于一體的立體化信息是可以即時查詢或交流的。高等教育大數(shù)據(jù)的雙向性和交互性,對于提高科研效率、促成科研成果轉(zhuǎn)化有很大幫助,間接地促進了高校的進一步發(fā)展。

      三、高等教育大數(shù)據(jù)的建設(shè)途徑

      1.搭建數(shù)據(jù)平臺,開發(fā)大數(shù)據(jù)處理技術(shù)

      建立高校大數(shù)據(jù)應用平臺,在整合原有信息系統(tǒng)的基礎(chǔ)上,升級、建設(shè)數(shù)據(jù)釆集設(shè)備、數(shù)據(jù)傳輸網(wǎng)絡、數(shù)據(jù)儲存和分析系統(tǒng),并通過對數(shù)據(jù)和應用的高度集成將復雜的大數(shù)據(jù)處理程序交給專業(yè)人員處理,為一線教師減輕負擔。高校大數(shù)據(jù)應用平臺擁有強大的數(shù)據(jù)收集和分析能力,可以有效地提高數(shù)據(jù)管理質(zhì)量和效率,促進資源共享,為高校管理決策提供支撐,推動高校資源配置的優(yōu)化。大數(shù)據(jù)應用可以在人才培養(yǎng)、科學研究、社會服務和文化傳承創(chuàng)新等多個方面全面推動高等教育的發(fā)展。

      海量數(shù)據(jù)包含了許多冗余和雜質(zhì),這樣的數(shù)據(jù)不便使用,甚至不能使用。要發(fā)揮大數(shù)據(jù)的功用,提高其價值密度,就必須開發(fā)大數(shù)據(jù)的相關(guān)技術(shù)。首先,開發(fā)大數(shù)據(jù)集成技術(shù)。對數(shù)據(jù)進行有效的集成和整合,以剔除無關(guān)信息而不使有用的信息流失。完成這種除冗降噪過程的,是大數(shù)據(jù)技術(shù)中的數(shù)據(jù)采集和算法技術(shù)。不同來源的數(shù)據(jù)存在結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化三種結(jié)構(gòu)形式,數(shù)據(jù)之間的差異給數(shù)據(jù)的集成帶來了巨大的困難。這需要開發(fā)比Hadoop分布式處理軟件更先進的系統(tǒng)進行集成。其次,改進大數(shù)據(jù)存儲技術(shù)。存儲設(shè)備容量不可能跟上數(shù)據(jù)規(guī)模的擴張,而大數(shù)據(jù)存儲技術(shù)又與數(shù)據(jù)成本、計算和分析速度直接相關(guān),這就要求開發(fā)一種既能夠存貯多元異構(gòu)數(shù)據(jù)又滿足數(shù)據(jù)格式統(tǒng)一、標準統(tǒng)一要求的存儲技術(shù)。再次,開發(fā)高效的實時分析技術(shù)。傳統(tǒng)的分析技術(shù)可以對大數(shù)據(jù)中結(jié)構(gòu)化靜態(tài)數(shù)據(jù)進行分析,但數(shù)據(jù)的一致性、可用性和容錯性不可兼得。大數(shù)據(jù)的可擴展性和可用性不能得到滿足,影響它的使用。只有開發(fā)一種橫向擴展能力強、能大規(guī)模處理非結(jié)構(gòu)性數(shù)據(jù)的分析技術(shù),才能滿足高效地進行動態(tài)分析的要求。最后,開發(fā)可移植處理模型。目前的大數(shù)據(jù)處理框架大多是針對各行業(yè)、各領(lǐng)域的情況開發(fā)的,不具有廣適性和可移植性,限制了大數(shù)據(jù)的應用。在高等教育領(lǐng)域,大數(shù)據(jù)專業(yè)人員應同各領(lǐng)域?qū)<液献鳎_發(fā)可移植處理模型。

      篇(3)

      DOIDOI:10.11907/rjdk.161946

      中圖分類號:TP319

      文獻標識碼:A文章編號文章編號:16727800(2016)009013202

      作者簡介作者簡介:楊洋(1995-),女,湖北武漢人,華中師范大學信息管理學院學生,研究方向為信息管理與信息系統(tǒng)。

      0引言

      隨著互聯(lián)網(wǎng)時代的來臨,越來越多的數(shù)據(jù)都來源于網(wǎng)絡,網(wǎng)絡數(shù)據(jù)呈爆炸式增長,如何對這些網(wǎng)絡信息資源進行有效的采集、組織、分析和利用成為急需解決的問題。運用先進的技術(shù)和管理經(jīng)驗來對網(wǎng)絡信息資源進行開發(fā)是大數(shù)據(jù)時代急待解決的問題。

      1大數(shù)據(jù)概述

      2011年,位于美國的全球知名咨詢公司麥肯錫最早提出了“大數(shù)據(jù)時代”概念,隨即在全球掀起了軒然大波,似乎所有學科都被冠以大數(shù)據(jù)的頭銜。隨著網(wǎng)絡時代的發(fā)展,數(shù)據(jù)以驚人的速度增長――每秒鐘有60張照片上傳到網(wǎng)絡;每分鐘有60個小時的視頻上傳到Y(jié)ouTube;每天,全球互聯(lián)網(wǎng)中產(chǎn)生的數(shù)據(jù)可以刻滿1.68億張DVD,發(fā)出的論壇帖子達到200萬個,相當于美國《時代》雜志770年的文字量。

      到目前為止,大數(shù)據(jù)還沒有一個完全準確且被公認的定義。麥肯錫全球研究所給出的定義是:大數(shù)據(jù)是一種規(guī)模大到在獲取、存儲、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合。現(xiàn)在被廣泛認可的是大數(shù)據(jù)的4V特征:海量的數(shù)據(jù)規(guī)模(Volume)、快速的數(shù)據(jù)流轉(zhuǎn)(Velocity)、多樣的數(shù)據(jù)類型(Variety)、價值密度低(Value)。

      隨著科技時代的發(fā)展,大數(shù)據(jù)的處理要求與日俱增,特別是面對海量的網(wǎng)絡信息資源,亟需大數(shù)據(jù)技術(shù)的特殊處理,才能夠得到充分的組織利用,才會為社會創(chuàng)造更大的價值。

      2大數(shù)據(jù)時代網(wǎng)絡信息資源開發(fā)利用現(xiàn)狀

      2.1網(wǎng)絡信息資源概念

      廣義上講,信息資源是指一個貫穿于人類社會信息活動中從事生產(chǎn)、分配、交換、流通、消費全過程的多要素集合,包括信息勞動的對象、信息勞動設(shè)備、信息勞動技術(shù)、信息勞動者等[1]。而網(wǎng)絡信息資源作為知識經(jīng)濟時代的產(chǎn)物,即虛擬的信息資源,是指借助于網(wǎng)絡環(huán)境可以利用的各種信息資源總和。網(wǎng)絡信息資源可以指以數(shù)字化形式記錄的、通過計算機網(wǎng)絡通信方式進行傳遞的信息內(nèi)容集合,也可以是為滿足人類需求,借助計算機等設(shè)備開發(fā)、生產(chǎn)和傳遞的、通過網(wǎng)絡獲取的信息集合。

      2.2大數(shù)據(jù)時代網(wǎng)絡信息資源開發(fā)利用機遇

      過去,很多行業(yè)對網(wǎng)絡數(shù)據(jù)只是進行傳統(tǒng)挖掘,比如點擊率、網(wǎng)絡流量以及其它僅局限于網(wǎng)絡數(shù)據(jù)的指標。因為技術(shù)、人才的缺乏,導致很多詳細的網(wǎng)絡行為數(shù)據(jù)沒有被充分挖掘。但是現(xiàn)在,在基于大數(shù)據(jù)的有關(guān)技術(shù)以及在全行業(yè)大數(shù)據(jù)的浪潮中,來自于網(wǎng)頁瀏覽器、移動應用終端、自助服務終端、社交媒體等地方的網(wǎng)絡數(shù)據(jù)被挖掘整理為有價值的網(wǎng)絡信息資源,為科研、商業(yè)、教育等領(lǐng)域提供源源不斷的可用情報,從而促進各大行業(yè)蓬勃發(fā)展。在大數(shù)據(jù)時代,網(wǎng)絡信息資源中可挖掘的有用信息更加豐富。

      早在大數(shù)據(jù)概念提出不久的2012年,美國就已經(jīng)將大數(shù)據(jù)研究和發(fā)展計劃提升為國家發(fā)展戰(zhàn)略。美國作為一個科技與經(jīng)濟強國,其對大數(shù)據(jù)的重視程度可見一斑。雖然我國互聯(lián)網(wǎng)起步較晚,但政府在實行大數(shù)據(jù)戰(zhàn)略時也給予了充分的經(jīng)濟與政策支持。2016年中國大數(shù)據(jù)產(chǎn)業(yè)峰會暨中國電子商務創(chuàng)新發(fā)展峰會的主題便是大數(shù)據(jù)開啟智能時代,國務院總理出席開幕式并發(fā)表致辭。信息處理技術(shù)作為四項關(guān)鍵技術(shù)創(chuàng)新工程之一,涵蓋了海量數(shù)據(jù)存儲、圖像視頻智能分析、數(shù)據(jù)挖掘等信息處理技術(shù),是大數(shù)據(jù)技術(shù)的重要組成部分。

      2.3大數(shù)據(jù)時代網(wǎng)絡信息資源開發(fā)利用的挑戰(zhàn)

      大數(shù)據(jù)時代,網(wǎng)絡信息資源開發(fā)利用有著良好的發(fā)展條件,機遇和挑戰(zhàn)并存。首先,我國現(xiàn)階段在數(shù)據(jù)挖掘、數(shù)據(jù)倉庫、搜索引擎、元數(shù)據(jù)等技術(shù)上與科技發(fā)達國家還存在著差距[2],如何使用先進的大數(shù)據(jù)技術(shù)來處理龐大的網(wǎng)絡數(shù)據(jù),增強信息的采集、組織、分析和運用能力成為亟待解決的難題;其次,如何有效管理龐雜的信息資源也是急需解決的問題[3]。在互聯(lián)網(wǎng)時代甚至是移動互聯(lián)網(wǎng)時代,網(wǎng)民產(chǎn)生的海量數(shù)據(jù)雜亂無序,需要合理管理才能組織利用好這些數(shù)據(jù),為生產(chǎn)生活創(chuàng)造價值。

      大數(shù)據(jù)時代,網(wǎng)絡信息資源利用發(fā)展迅速,但人們的從眾心理會導致盲目投資,很多人往往在沒有徹底弄清大數(shù)據(jù)的發(fā)展形勢前就跟風操作,這會加重網(wǎng)絡信息資源管理的負擔,不良的大數(shù)據(jù)產(chǎn)業(yè)還會帶來行業(yè)風險,信息的真實性和可靠性得不到保障。

      3大數(shù)據(jù)時代網(wǎng)絡信息資源開發(fā)利用策略

      3.1提升大數(shù)據(jù)技術(shù)水平

      我國的大數(shù)據(jù)技術(shù)水平與美國等科技發(fā)達國家還存在差異,要利用好網(wǎng)絡信息資源,進行有效合理的開發(fā),就一定要掌握核心技術(shù)。

      大數(shù)據(jù)核心技術(shù)有:①Hadoop,是一個能對大量數(shù)據(jù)進行分布式處理的軟件框架,Hadoop 是以一種可靠、高效、可伸縮的方式進行處理的;②Storm是自由的開源軟件,一個分布式的、容錯的實時計算系統(tǒng)。Storm可以非常可靠地處理龐大的數(shù)據(jù)流,用于處理Hadoop的批量數(shù)據(jù);③RapidMiner是世界領(lǐng)先的數(shù)據(jù)挖掘解決方案,其數(shù)據(jù)挖掘任務涉及范圍廣泛,包括各種數(shù)據(jù)技術(shù),能簡化數(shù)據(jù)挖掘過程的設(shè)計和評價。

      3.2加強網(wǎng)絡信息資源的引導和管理

      大數(shù)據(jù)時代的社會輿論環(huán)境非常復雜,互聯(lián)網(wǎng)時代,每個網(wǎng)民都是大數(shù)據(jù)的生產(chǎn)者和接受者[4]。首先,有關(guān)部門要疏通網(wǎng)絡輿論環(huán)境渠道,善于利用大數(shù)據(jù)技術(shù)分析解剖輿情問題,提取采集有價值的網(wǎng)絡信息,整理網(wǎng)民關(guān)注的焦點和熱點問題;其次,對于網(wǎng)絡信息資源反映的問題提出有效的解決方案,甚至可以預測問題、提出預警。對于網(wǎng)絡行為進行數(shù)據(jù)挖掘,從而得到經(jīng)濟、政治、社會層面有價值的信息資源。比如在淘寶網(wǎng)上,通過用戶的購買數(shù)據(jù)和瀏覽數(shù)據(jù)得出用戶偏好,在后臺處理這類信息,形成商品推薦呈現(xiàn)給用戶,以此增加用戶購買行為概率,提高潛在經(jīng)濟效益。

      大數(shù)據(jù)時代應以先進的管理方式來進行網(wǎng)絡信息資源的開發(fā)利用。基于大數(shù)據(jù)的4V特征,一般的管理方式是難以駕馭大數(shù)據(jù)的,所以新型的先進管理經(jīng)驗應運而生。要利用數(shù)據(jù)挖掘和數(shù)據(jù)倉庫技術(shù)對大數(shù)據(jù)進行管理。數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中自動搜索隱藏于其中的有著特殊關(guān)系的信息過程。數(shù)據(jù)倉庫,是為企業(yè)所有級別的決策制定過程,提供所有類型數(shù)據(jù)支持的戰(zhàn)略集合。它是單個數(shù)據(jù)存儲,出于分析性報告和決策支持目的而創(chuàng)建。這都需要專業(yè)的管理人員進行操作與管理,對大數(shù)據(jù)時代下的網(wǎng)絡信息資源管理提出了更高的要求。

      3.3制訂相應的政策推動網(wǎng)絡信息資源開發(fā)利用

      在大數(shù)據(jù)時代,網(wǎng)絡信息資源的開發(fā)利用可以深入到上至國家下到個人的各個層面,數(shù)據(jù)的真實可靠性、個人的隱私也都會受到影響。國家不僅要在促進大數(shù)據(jù)發(fā)展上制定相應的政策,還應該加強宏觀調(diào)控,制定政策和法規(guī),用相應的法律來進行約束管理。

      我國相關(guān)機構(gòu)要建立符合實際的技術(shù)、人才、財政等政策保障體系[5],為大數(shù)據(jù)產(chǎn)業(yè)發(fā)展營造良好環(huán)境,生產(chǎn)并提供適合受眾的網(wǎng)絡信息資源與服務。在經(jīng)濟政治條件允許下,可以建立大數(shù)據(jù)創(chuàng)業(yè)園區(qū),集聚大數(shù)據(jù)開發(fā)運營企業(yè),對相關(guān)企業(yè)提供便利條件或相關(guān)支持,從而促進網(wǎng)絡信息資源的開發(fā)利用。

      4結(jié)語

      大數(shù)據(jù)時代的歷史潮流勢不可擋,大數(shù)據(jù)與互聯(lián)網(wǎng)相輔相成,共同發(fā)展。大數(shù)據(jù)時代的網(wǎng)絡信息資源開發(fā)利用成為連接兩者的橋梁。隨著科技發(fā)達國家對大數(shù)據(jù)的重視,國家之間的實力對比也逐漸成為信息力量的權(quán)衡,網(wǎng)絡信息資源在國家領(lǐng)域和日常生活中越來越占據(jù)主導地位。我國應緊跟大數(shù)據(jù)時代的發(fā)展潮流,加緊對網(wǎng)絡信息資源進行有效地開發(fā)和利用,以提升綜合國力和核心競爭力。

      參考文獻參考文獻:

      [1]張欣.大數(shù)據(jù)時代的網(wǎng)絡信息內(nèi)容建設(shè)管理[J].新技術(shù),2015(5):119.

      [2]嚴頌.大數(shù)據(jù)時代的網(wǎng)絡信息內(nèi)容建設(shè)管理[J].成都行政學院學報,2014(1):1922.

      篇(4)

      【關(guān)鍵詞】大數(shù)據(jù) 基礎(chǔ)數(shù)據(jù)結(jié)構(gòu) 軟件工程 數(shù)據(jù)標準

      隨著智慧城市建設(shè)項目的開展,作為智慧城市建設(shè)的重要基礎(chǔ)就是圍繞大型基礎(chǔ)數(shù)據(jù)平臺的建設(shè),在業(yè)界定義為大數(shù)據(jù)時代的來臨。圍繞大數(shù)據(jù)的概念,在全國范圍內(nèi)的各領(lǐng)域各行業(yè)都在大數(shù)據(jù)的如何組織、如何應用、如何共享、如何關(guān)聯(lián)召開了各類研討會。大數(shù)據(jù)應用的云計算技術(shù)、數(shù)據(jù)倉庫技術(shù)等成為業(yè)內(nèi)討論的重要話題。本人認為,在做了這些工作后,應回過頭來看一看,無論數(shù)據(jù)量有多大,都離不開基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)與體系的建設(shè),在此要闡明的一個基本觀點就是在大數(shù)據(jù)時代更應該重視基礎(chǔ)數(shù)據(jù)結(jié)果的研究與應用。

      1 大數(shù)據(jù)的概念

      什么是大數(shù)據(jù), IBM 最早的定義是:將大數(shù)據(jù)的特征歸納為4個“V”(量Volume,多樣Variety,價值Value,速Velocity),或者說特點有四個層面:第一,數(shù)據(jù)體量巨大。大數(shù)據(jù)的起始計量單位至少是P(1000個T)、E(100萬個T)或Z(10億個T);第二,數(shù)據(jù)類型繁多。比如,網(wǎng)絡日志、視頻、圖片、地理位置信息等等。第三,價值密度低,商業(yè)價值高。第四,處理速度快。最后這一點也是和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同。

      在大數(shù)據(jù)概念中的第一條是數(shù)據(jù)量大,這是大數(shù)據(jù)的特點,而卻隨著信息系統(tǒng)應用的深入,數(shù)量的數(shù)量級也在不斷的提高,這是毋容置疑的。我們在此要討論的是第二條數(shù)據(jù)類型繁多的問題。

      2 目前大數(shù)據(jù)應用存在的主要問題

      隨著信息化系統(tǒng)應用的深入,在社會、自然界、生活中所涉及的數(shù)據(jù)面越來越廣,由此使得數(shù)據(jù)類型也越來越多,數(shù)據(jù)類型的數(shù)量在不斷增加,這些數(shù)據(jù)類型之間的關(guān)系和相互關(guān)聯(lián)性也越來越復雜,大數(shù)據(jù)量下的數(shù)據(jù)應用造成了困難。數(shù)據(jù)結(jié)構(gòu)類型繁多造成問題主要表現(xiàn)在以下幾個方面。

      2.1 數(shù)據(jù)類型是有限量的認識不清楚

      未來大數(shù)據(jù)情況下,數(shù)據(jù)類型是有限量的還是無限量的概念模糊,為此首先要么明確一個基本的概念,那就是,數(shù)據(jù)類型在繁多,但是數(shù)據(jù)類型的數(shù)量是有限量的,只是這個限量的數(shù)量級大一些而已。在數(shù)據(jù)類型是有限量的情況下,對于解決數(shù)據(jù)類型繁多的方法是完全不同的。

      如果數(shù)據(jù)類型的量是無限量的,那么解決問題的方法是要研究解決數(shù)據(jù)類型問題的方式是研究規(guī)律,拿出解決問題的方式與方法,對于具體數(shù)據(jù)類型時,按照方式方法理論與技術(shù)去解決問題。如果數(shù)據(jù)類型是有限量的話,那么解決問題的方式就不只是從理論上的解決問題方法,而應該更加切合實際的去針對每一種數(shù)據(jù)類型直接進行研究,形成數(shù)據(jù)標準,指導各個系統(tǒng)對每一個具體數(shù)據(jù)類型的應用。

      2.2 相同數(shù)據(jù)在不同系統(tǒng)中的表現(xiàn)類型繁多

      由于系統(tǒng)開發(fā)方各自的開發(fā)經(jīng)驗、所開發(fā)系統(tǒng)的規(guī)模不同,系統(tǒng)應用方對系統(tǒng)要求不同,系統(tǒng)應用行業(yè)的不同,使得在開發(fā)過程中,對于數(shù)據(jù)類型的定義只遵循本系統(tǒng)使用需要進行定義,沒有完整的標準,即是有相應的國家或國際標準,也不能完全遵循。

      2.3 各個行業(yè)制定的標準相互矛盾

      各個行業(yè)在制定相應的標準時,是以滿足自身需要為主導,造成了數(shù)據(jù)類型在其數(shù)據(jù)定義時不但長度不同,就是數(shù)據(jù)類型都不相同。這也就造成了各個系統(tǒng)在未來大數(shù)據(jù)應用中出現(xiàn)了嚴重的數(shù)據(jù)應用障礙。

      2.4 大數(shù)據(jù)應用的實現(xiàn)效率低

      由于不同系統(tǒng)技術(shù)數(shù)據(jù)結(jié)構(gòu)的不統(tǒng)一,使得對于大數(shù)據(jù)的應用上要對不同系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)進行分析,構(gòu)建關(guān)聯(lián),而后才能進行數(shù)據(jù)的應用,這項工作的工作量大,技術(shù)含量高,降低數(shù)據(jù)的應用效率。這些都是事后分析數(shù)據(jù)存在的問題。

      2.5 數(shù)據(jù)浪費巨大

      由于數(shù)據(jù)各個系統(tǒng)間數(shù)據(jù)結(jié)構(gòu)的不同,加上分析手段的局限性,使許多的數(shù)據(jù)無法進行使用,由此也降低了數(shù)據(jù)的使用率。并造成數(shù)據(jù)的大量浪費。

      3 造成目前對大數(shù)據(jù)應用存在問題原因

      由于以上幾方面的問題存在,為了做好大數(shù)據(jù)的應用,許多相應的技術(shù)應運而生,數(shù)據(jù)倉庫技術(shù)、網(wǎng)格技術(shù)、云計算的數(shù)據(jù)處理技術(shù)等等。這些技術(shù)促進了數(shù)據(jù)應用的發(fā)展,提高了數(shù)據(jù)應用效率,為大數(shù)據(jù)應用發(fā)揮了巨大作用。但是這種做法只能針對具體的大數(shù)據(jù)應用項目起到作用,不能從根本上解決問題。那么造成這種問題根本是什么呢?

      3.1 理論基礎(chǔ)有偏差

      目前所有這些高精尖技術(shù)的發(fā)展,為大數(shù)據(jù)應用的發(fā)展起到了不可替代的作用,但是這些技術(shù)在理論出發(fā)點上存在偏差,那就是,這些技術(shù)的理論出發(fā)點設(shè)定的是,數(shù)據(jù)類型是無限量的,是無窮盡的,所以所有的技術(shù)研究都不面對具體的數(shù)據(jù)項,這樣做的結(jié)果是促進技術(shù)的發(fā)展,弊端是不能面對具體的應用,所有的技術(shù)應用都要在這就技術(shù)下進行二次應用研究。也就是,這些理論是治標不治本的做法。

      有限量數(shù)據(jù)類型與無限量數(shù)據(jù)類型是兩個根本不同的概念,對于技術(shù)的發(fā)展影響也是完全不同的。為此,目前在無限量數(shù)據(jù)類型概念下的大數(shù)據(jù)應用技術(shù)與體系將會存在極大的局限性,對未來的大數(shù)據(jù)應用造成影響。

      3.2 對大數(shù)據(jù)認識有偏差

      目前在各個系統(tǒng)對大數(shù)據(jù)的應用中,對大數(shù)據(jù)的認識是,只要有足夠量的數(shù)據(jù),就是大數(shù)據(jù),而對于數(shù)據(jù)之間的關(guān)系,整體的數(shù)據(jù)結(jié)構(gòu)體系沒有很深的認識,甚至將原有的多個分散的系統(tǒng)中的數(shù)據(jù)庫,做一個小的關(guān)聯(lián)數(shù)據(jù)庫,就認為是數(shù)據(jù)云計算,就是綜合數(shù)據(jù)平臺了,而在這種情況下,對于大數(shù)據(jù)的應用,因為系統(tǒng)的獨立,數(shù)據(jù)庫的獨立、數(shù)據(jù)結(jié)構(gòu)的不統(tǒng)一造成了大數(shù)據(jù)應用的瓶頸和障礙,在系統(tǒng)應用到一定程度后,數(shù)據(jù)量是很大,但是無法進行大數(shù)據(jù)應用,或者說是要進行大數(shù)據(jù)的應用,需要另外投入很高的成本進行數(shù)據(jù)整理、數(shù)據(jù)管理和數(shù)據(jù)分析。所以應該明確的是,在數(shù)據(jù)結(jié)構(gòu)混亂的情況下,在大的數(shù)據(jù)量也不能稱為大數(shù)據(jù),這個觀念上的偏差,是造成目前數(shù)據(jù)應用困難的原因之一。

      3.3 數(shù)據(jù)結(jié)構(gòu)不規(guī)范

      這些情況的出現(xiàn),歸結(jié)的一起,就是數(shù)據(jù)結(jié)構(gòu)不規(guī)范,不統(tǒng)一。在三方面主要原因造成這個局面,一是目前的應用系統(tǒng)的開發(fā),由不同的公司進行,每個開發(fā)單位對數(shù)據(jù)結(jié)構(gòu)的定義有各自的標準,基本都是按照多年開發(fā)經(jīng)驗總結(jié)出來的,因此各個公司開發(fā)的系統(tǒng)在數(shù)據(jù)結(jié)構(gòu)上相差很遠。二是對于同一個公司不同時期開發(fā)的系統(tǒng)所涉及的數(shù)據(jù)結(jié)構(gòu)不統(tǒng)一,到后期,開發(fā)單位不愿意在投入成本對前期開發(fā)的系統(tǒng)進行重新開發(fā),這就造成了前期開的的系統(tǒng)中的數(shù)據(jù)結(jié)構(gòu)與后期開發(fā)的數(shù)據(jù)結(jié)構(gòu)不統(tǒng)一。三是對于應用開發(fā)單位在開發(fā)每一個具體應用項目時,由于是不同的開發(fā)小組在進行,為此,在進行數(shù)據(jù)結(jié)構(gòu)設(shè)定時,只為了滿足本系統(tǒng)開發(fā)的需要,而沒有考慮系統(tǒng)未來的發(fā)展和系統(tǒng)的整體架構(gòu),這也造成了不同應用系統(tǒng)中對相同字段的設(shè)定不相同,數(shù)據(jù)結(jié)構(gòu)不統(tǒng)一。以上這些都是在應用系統(tǒng)開發(fā)過程中遺留的問題,而這些問題嚴重影響了大數(shù)據(jù)的使用。

      3.4 有統(tǒng)一的標準不用

      在系統(tǒng)開發(fā)過程中涉及的數(shù)據(jù)結(jié)構(gòu),許多都有相應的標準,主要有以下幾個方面,一是國家法律層面的,對于一些重要的數(shù)據(jù)要求以立法方式進行規(guī)范。二是國家標準,制定和規(guī)范了國家層面的有關(guān)方面的數(shù)據(jù)要求和限定。三是部頒標準,由各個部委辦局制定的相應標準,這些標準有一大部分直接針對信息化系統(tǒng)建設(shè)的應用和數(shù)據(jù)標準。四是行業(yè)標準,作為每一個行業(yè)內(nèi)進行行為約束的標準,這種標準雖然不具備強制性,但是在行業(yè)內(nèi)是一個自覺遵守的標準。四是國際相關(guān)標準,雖然國際標準沒有任何的法律約束性,但是為了走出去,各行各業(yè)都在遵循這個標準。

      這些標準都是在系統(tǒng)建立時的數(shù)據(jù)結(jié)構(gòu)依據(jù),但是目前許多系統(tǒng)在進行數(shù)據(jù)結(jié)構(gòu)設(shè)定時,都沒有按照這些標準執(zhí)行,而是根據(jù)自己系統(tǒng)的需要進行設(shè)定的。這使得許多的系統(tǒng)中的數(shù)據(jù)不能相互交換使用,由此而影響了大數(shù)據(jù)的應用。

      3.5 不同行業(yè)對標準的設(shè)定不統(tǒng)一

      在國家標準體系中,由于標準制定的年代不同,同是一個部門頒布的標準對相同的數(shù)據(jù)要求也不同,各個部門由于獨立制定標準,同樣出現(xiàn)相同數(shù)據(jù)在不同部門制定的標準中規(guī)定的不同,這幾方面原因也就造成了即使遵照標準,也存在著相同數(shù)據(jù)在不同應用系統(tǒng)中的數(shù)據(jù)結(jié)構(gòu)不同的現(xiàn)象。

      以上是大數(shù)據(jù)應用問題出現(xiàn)的主要原因,作為大數(shù)據(jù)應用的剛剛起步階段,應針對這些問題進行研究給出相應的解決方案,為未來大數(shù)據(jù)應用的發(fā)展打下一個良好的基礎(chǔ),避免今后的大數(shù)據(jù)應用走彎路。

      4 解決大數(shù)據(jù)應用問題的對策

      解決大數(shù)據(jù)應用存在的問題,應從最基礎(chǔ)的數(shù)據(jù)結(jié)構(gòu)建立開始,從根本上去解決問題,也為未來大數(shù)據(jù)應用的發(fā)展打下一個良好的基本數(shù)據(jù)結(jié)構(gòu)基礎(chǔ),對此提出以下幾方面的對策。

      4.1 開展和加強對基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)建立的理論研究

      從軟件工程學的角度出發(fā),以數(shù)據(jù)結(jié)構(gòu)類型是有限量的概念為依托,圍繞具體的數(shù)據(jù)類型開展數(shù)據(jù)結(jié)構(gòu)體系的理論研究。依托一個數(shù)據(jù)結(jié)構(gòu)分類的理論體系來支撐整個數(shù)據(jù)結(jié)構(gòu)體系的劃分,其中包括劃分方法、劃分層次、劃分的軟件工程學理論支撐等內(nèi)容,制定大數(shù)據(jù)底層數(shù)據(jù)結(jié)構(gòu)劃分的理論體系,形成在大數(shù)據(jù)下的數(shù)據(jù)結(jié)構(gòu)構(gòu)建的理論體系。

      4.2 開展對具體數(shù)據(jù)結(jié)構(gòu)的研究

      按照建立的數(shù)據(jù)結(jié)構(gòu)理論體系要求,對每一個具體數(shù)據(jù)結(jié)構(gòu)進行研究,針對數(shù)據(jù)項的名稱、類型、含義、層次、結(jié)構(gòu)、與其他數(shù)據(jù)的關(guān)系、涉及內(nèi)容規(guī)定等方面制定出具體數(shù)據(jù)的標準。這項工作可以在有組織的情況下由全社會共同參與,按照指導理論的要求進行研究,這樣,隨著應用系統(tǒng)的不斷深入,所涉及的數(shù)據(jù)類型項將逐步擴展,最終實現(xiàn)數(shù)據(jù)的全覆蓋,而完成整個架構(gòu)體系的建立。

      4.3 制定相應的數(shù)據(jù)結(jié)構(gòu)標準

      對于由各個方面制定的數(shù)據(jù)結(jié)構(gòu)進行分類、篩選、審核,而后想這些結(jié)構(gòu)形成一個統(tǒng)一的架構(gòu)體系,制定相應的技術(shù)標準,通過這個標準來規(guī)范應用系統(tǒng)的開發(fā),形成完整的、規(guī)范的、統(tǒng)一的數(shù)據(jù)結(jié)構(gòu)體系,為大數(shù)據(jù)應用打下堅實的基礎(chǔ)。

      4.4 成立相應的機構(gòu)來負責這項工作的完成

      對于這項工作的開展,應在軟件工程相應的有關(guān)組織下,建立一個專門的機構(gòu),負責指導這項工作的完成。由這個機構(gòu)成立專門的實驗室,負責整體架構(gòu)的制定,數(shù)據(jù)類型項的搜集、分類、篩選,并形成統(tǒng)一的數(shù)據(jù)庫體系,為所有的應用系統(tǒng)的開發(fā)提供數(shù)據(jù)庫基礎(chǔ)支撐和服務。

      綜上所述,通過對基礎(chǔ)數(shù)結(jié)構(gòu)的研究與體系的建立,從根本上解決大數(shù)據(jù)應用的效率,充分發(fā)揮未來大數(shù)據(jù)的作用,簡化大數(shù)據(jù)應用的方式與過程。

      參考文獻

      [1]嚴霄鳳,張德馨.大數(shù)據(jù)研究[J].計算機技術(shù)與發(fā)展,2013(04).

      [2]李學龍,龔海剛.大數(shù)據(jù)系統(tǒng)綜述[J].中國科學:信息科學,2015(01).

      [3]方璐.大數(shù)據(jù)時代的科學研究方法[J].浙江工業(yè)大學,2014.

      作者簡介

      篇(5)

      全國乃至全球范圍內(nèi),政府部門將大數(shù)據(jù)運用作為順應經(jīng)濟發(fā)展規(guī)律、提升政府治理能力、增強地區(qū)競爭優(yōu)勢的新動力、新機遇、新途徑。加強對數(shù)據(jù)的分析和應用,有助于政府部門通過數(shù)據(jù)來合理制定產(chǎn)業(yè)政策、引導企業(yè)投資經(jīng)營、培育新模式和新業(yè)態(tài),推動實體經(jīng)濟與虛擬經(jīng)濟的融合發(fā)展;有助于政府部門提升經(jīng)濟數(shù)據(jù)分析的能力,推動社會事業(yè)數(shù)據(jù)的共享,創(chuàng)新行業(yè)管理服務的模式,加快建設(shè)法治服務型政府;有助于儲備基礎(chǔ)戰(zhàn)略資源,帶動科技創(chuàng)新,釋放經(jīng)濟潛能,創(chuàng)造區(qū)域經(jīng)濟發(fā)展的潛在空間。

      大數(shù)據(jù)在政府行業(yè)統(tǒng)計監(jiān)測中應用的基本情況

      目前,大數(shù)據(jù)在政府行業(yè)統(tǒng)計監(jiān)測中的應用主要包括兩個方面,一是成為政府統(tǒng)計數(shù)據(jù)來源的補充渠道,實現(xiàn)原有的統(tǒng)計直報方式和大數(shù)據(jù)方式相結(jié)合,尤其是網(wǎng)絡交易數(shù)據(jù)的重要獲取來源,如利用信息技術(shù)手段整理第三方電子商務平臺交易數(shù)據(jù)以測算地區(qū)網(wǎng)絡零售額;二是成為政府統(tǒng)計數(shù)據(jù)質(zhì)量的評估依據(jù),將獲取的大數(shù)據(jù)作為傳統(tǒng)統(tǒng)計方式獲得數(shù)據(jù)的質(zhì)量評估參考,如國家統(tǒng)計局利用中國銀聯(lián)跨行銀行卡消費數(shù)據(jù)評估社會消費品零售總額數(shù)據(jù)質(zhì)量等。

      大數(shù)據(jù)對政府行業(yè)統(tǒng)計監(jiān)測帶來的機遇和挑戰(zhàn)

      大數(shù)據(jù)在政府行業(yè)統(tǒng)計監(jiān)測中機遇與挑戰(zhàn)并存,機遇大于挑戰(zhàn)。其中,機遇主要表現(xiàn)在數(shù)據(jù)獲取方式更加便利,先進技術(shù)逐步取代人工勞動使得統(tǒng)計效率更高、成本更低;數(shù)據(jù)獲取頻率更加密集,可以實現(xiàn)全天候?qū)崟r監(jiān)測,逐日更新更替數(shù)據(jù)信息;獲取數(shù)據(jù)數(shù)量更加豐富,可以實現(xiàn)多維度、多區(qū)域的數(shù)據(jù)開發(fā)和整理;獲取數(shù)據(jù)質(zhì)量更加精準,尤其針對小而散的網(wǎng)絡零售企業(yè),信息技術(shù)獲取的數(shù)據(jù)更加全面和準確;挑戰(zhàn)主要表現(xiàn)在對政府統(tǒng)計能力和統(tǒng)計理論帶來的挑戰(zhàn),一方面政府統(tǒng)計對大數(shù)據(jù)運用的需要一個漫長的周期,原有統(tǒng)計制度和現(xiàn)行統(tǒng)計方法雙軌運行的模式需要磨合,另一方面政府統(tǒng)計人員對大數(shù)據(jù)的理解和認識需要一個較長的周期,缺少具備大數(shù)據(jù)理論和技能的專業(yè)統(tǒng)計人才。

      大數(shù)據(jù)環(huán)境下政府行業(yè)統(tǒng)計監(jiān)測的發(fā)展原則、內(nèi)容和方向

      電子商務行業(yè)統(tǒng)計監(jiān)測是新形勢下政府行業(yè)管理的一項基礎(chǔ)性、開創(chuàng)性的工作,應在摸索中不斷創(chuàng)新突破,使得電子商務行業(yè)統(tǒng)計監(jiān)測能夠滿足政府行業(yè)管理的需要。

      (一)主要原則

      電子商務領(lǐng)域應用大數(shù)據(jù)開展統(tǒng)計監(jiān)測具有涉及面廣、技術(shù)要求高、公益性明顯、變化性大、安全性要求高等特點,因此在應用過程中應堅持以下原則:一是合法性原則,應用大數(shù)據(jù)技術(shù)進行數(shù)據(jù)采集和整理過程中,要遵守現(xiàn)行的法律法規(guī),在合法的范圍內(nèi)安全使用;二是科學性原則,對數(shù)據(jù)進行過濾和加工時,數(shù)據(jù)模式和方法要科學合理,確保數(shù)據(jù)的權(quán)威性;三是開放性原則,數(shù)據(jù)不僅作為政府決策依據(jù),還應將大部分作為公共資源向全社會共享;四是穩(wěn)定性原則,數(shù)據(jù)來源實現(xiàn)多渠道,技術(shù)手段、數(shù)據(jù)模型等要及時更新,以保證數(shù)據(jù)根據(jù)實際需要實時;五是標準化原則,加快數(shù)據(jù)采集、指標口徑、分類目錄、數(shù)據(jù)交易、安全保密等關(guān)鍵共性標準的制定和實施,充分發(fā)揮標準在數(shù)據(jù)開發(fā)應用中的保障和支撐作用;六是市場性原則,數(shù)據(jù)開發(fā)要與市場需求結(jié)合,以保證數(shù)據(jù)開發(fā)應用的具有持久生命力。

      (二)建設(shè)內(nèi)容

      作為一項系統(tǒng)性的工作,電子商務領(lǐng)域應用大數(shù)據(jù)開展統(tǒng)計監(jiān)測工作過程中要著力構(gòu)建三大系統(tǒng):一是技術(shù)系統(tǒng)。要把先進技術(shù)放在基礎(chǔ)性的地位,包括信息技術(shù)、數(shù)據(jù)模型、智能設(shè)備等,采用的技術(shù)要與行業(yè)最新發(fā)展的趨勢相匹配,同時還要著力打造具有自主知識產(chǎn)權(quán)的技術(shù)和平臺。二是應用系統(tǒng),針對不同市場主體和需求,開發(fā)標準化和個性化的產(chǎn)品和服務,并打造方便用的可視化界面和系統(tǒng),實現(xiàn)需求方和服務方的有效溝通,推動技術(shù)研發(fā)與市場應用的融合互補。三是制度系統(tǒng),建立一套從數(shù)據(jù)采集、存儲、整理、分析、、保密等管理制度,建立相應的數(shù)據(jù)管理組織構(gòu)架和績效評價機制,以保障電子商務大數(shù)據(jù)開發(fā)應用工作的有序進行。

      (三)發(fā)展方向

      未來政府在電子商務領(lǐng)域開展大數(shù)據(jù)應用與開發(fā),個人認為既要遵循電子商務發(fā)展的規(guī)律,也要立足現(xiàn)行的政策條件、技術(shù)條件,并根據(jù)各地實際情況和需求,按照“統(tǒng)計規(guī)劃與行業(yè)管理相結(jié)合、統(tǒng)計成果與產(chǎn)業(yè)應用相結(jié)合、統(tǒng)計手段與先進技術(shù)相結(jié)合、統(tǒng)計水平與國際水準相結(jié)合”等“四個相結(jié)合”的方向,建立健全應用大數(shù)據(jù)開展電子商務統(tǒng)計監(jiān)測工作的體系,為經(jīng)濟社會發(fā)展提供有力的大數(shù)據(jù)支撐。

      統(tǒng)計規(guī)劃與行業(yè)管理相結(jié)合。電子商務大數(shù)據(jù)的開發(fā)應用首先要以服務政府行業(yè)管理工作為出發(fā)點和落腳點,確保大數(shù)據(jù)的開發(fā)應用與行業(yè)管理的熱點、難點、重點領(lǐng)域相吻合,做好以電子商務交易額、網(wǎng)絡零售額、居民網(wǎng)絡消費等為代表的政府考核數(shù)據(jù)的開發(fā),同時不局限于電子商務領(lǐng)域,逐步向旅游、票務、交通、餐飲、住宿、中介、醫(yī)療、文化等經(jīng)濟領(lǐng)域延伸,確保統(tǒng)計工作服務于各領(lǐng)域行業(yè)管理部門的需要。

      統(tǒng)計成果與產(chǎn)業(yè)應用相結(jié)合。數(shù)據(jù)是基礎(chǔ),應用是關(guān)鍵。電子商務大數(shù)據(jù)統(tǒng)計的成果要與政府部門在電子商務領(lǐng)域具體的工程、項目相吻合,使得統(tǒng)計的成果能夠直接應用和服務于電子商務促消費、穩(wěn)增長、調(diào)結(jié)構(gòu)、惠民生等方面的具體工程,為電子商務領(lǐng)域各項重點工程和項目的設(shè)計、監(jiān)測和評估提供數(shù)據(jù)參考,同時也為企業(yè)經(jīng)營決策、個人創(chuàng)業(yè)創(chuàng)新提供數(shù)據(jù)參考,提高數(shù)據(jù)成果落地的實施速度和社會經(jīng)濟效益。

      統(tǒng)計手段與發(fā)展前沿相結(jié)合。在電子商務大數(shù)據(jù)開發(fā)過程中,一方面,創(chuàng)新統(tǒng)計方法, 逐步擴寬通過技術(shù)手段獲取數(shù)據(jù)的范圍,探索建立符合電子商務發(fā)展特點的測算和分析方法,同時與原有的統(tǒng)計方法做好銜接,實現(xiàn)兩條腿走路;另一方面,提升統(tǒng)計技術(shù),充分利用先進智能設(shè)備和前沿獲取技術(shù),使得統(tǒng)計技術(shù)能夠適應電子商務快速發(fā)展和變化莫測的特點,及時、全面的獲取行業(yè)最新業(yè)態(tài)和模式的相關(guān)數(shù)據(jù)。

      統(tǒng)計水平與國際水準相結(jié)合。政府部門在電子商務大數(shù)據(jù)開發(fā)的過程中,一是要加強與阿里巴巴、京東、亞馬遜等第三方電子商務平臺企業(yè)的數(shù)據(jù)共享和交換,二是要加強與高等院校和科研機構(gòu)的理論探討,提升數(shù)據(jù)分析和研究的水平,推動電子商務理論的發(fā)展,三是加強艾瑞咨詢、尼爾森等國內(nèi)國際知名第三方大數(shù)據(jù)公司的合作交流,確保數(shù)據(jù)來源、獲取方法、分析水平等全面科學、引領(lǐng)行業(yè)、接軌國際,提升政府電子商務行業(yè)統(tǒng)計分析的國際水準。

      篇(6)

      【關(guān)鍵詞】計算機技術(shù) 軟件技術(shù) 大數(shù)據(jù)時代 應用分析

      1 引言

      21世紀是科技的時代,計算機應用技術(shù)改變了工作的傳統(tǒng)模式,在市場競爭如此激烈的今天,企業(yè)要想在市場中取得發(fā)展就需要從計算機軟件技術(shù)方面入手,在節(jié)約人力物力的同時實現(xiàn)工作的整體效率,讓企業(yè)的運營模式更加的專業(yè)化、科學化。隨著云時代的到來大數(shù)據(jù)也逐漸被人們所關(guān)注,大數(shù)據(jù)時代給計算機信息處理技術(shù)帶來了好消息,可以說,大數(shù)據(jù)是繼IT行業(yè)在云計算與物聯(lián)網(wǎng)之后的又一次技術(shù)變革,對人們的生活、工作以及學習的影響很大,在企業(yè)的運營過程中數(shù)據(jù)是最為核心的資產(chǎn),在大數(shù)據(jù)時代所有的企業(yè)都將面臨著來自多方面的挑戰(zhàn),但這同時也是一種機遇與資源。就目前形勢來看,大數(shù)據(jù)時代的到來給了計算機處理技術(shù)帶來了機會,也對提高社會經(jīng)濟效益有很大作用,本文就對計算機軟件技術(shù)在大數(shù)據(jù)時代的應用進行具體的分析與研究。

      2 計算機軟件技術(shù)在大數(shù)據(jù)時代的應用

      大數(shù)據(jù)時代最主要的應用核心就是在大量的數(shù)據(jù)中找到規(guī)律,從而找出與用戶的需求相一致的特點來進行設(shè)計、生產(chǎn)以及服務,大數(shù)據(jù)時代的計算機信息處理關(guān)鍵技術(shù)主要包括三個部分:

      (1)虛擬化技術(shù)。該技術(shù)是根據(jù)虛擬的資源來進行管理,同時也能對這些大數(shù)據(jù)資源進行優(yōu)化配置,在提高信息處理效率的同時也能提高靈活程度。

      (2)云存儲技術(shù)。云存儲是由多個存儲單元組成的,它是一種由多種功能聯(lián)合在一起的協(xié)同工作,大數(shù)據(jù)時代下出現(xiàn)的云存儲技術(shù)為更好的解決海量信息提供了方便,同時完成對大量信息數(shù)據(jù)的計算也是在大數(shù)據(jù)時代下數(shù)據(jù)處理必不可少的環(huán)節(jié)。

      (3)信息安全技術(shù)。在大數(shù)據(jù)時代之下,各種數(shù)據(jù)信息是有一定關(guān)聯(lián)的,這種關(guān)系之間的影響對數(shù)據(jù)的安全有一定的威脅,需要調(diào)整整個的數(shù)據(jù)管理系統(tǒng),從而提高數(shù)據(jù)集群的安全水平。在未來的發(fā)展中,如果想要保證大數(shù)據(jù)信息的安全性就需要不斷的推進信息安全技術(shù)的發(fā)展。雖然大數(shù)據(jù)在我國的應用時間很短但是效果卻是很大的,大數(shù)據(jù)已經(jīng)成為了一種發(fā)展趨勢并得到了人們的廣泛應用與支持,在未來的發(fā)展過程中,我國的計算機軟件技術(shù)方面還會遇到更多的挑戰(zhàn),因此就需要各行業(yè)根據(jù)自身的問題制定出最符合自我發(fā)展的方案,讓數(shù)據(jù)處理技術(shù)能夠得到改革與完善,計算機技術(shù)應用于大數(shù)據(jù)時代下讓數(shù)據(jù)有更高的真實性、有效性。

      在計算機軟件技術(shù)發(fā)展的過程中應該主要從三個方面入手:

      (1)信息通信方面。通過利用IBM SPSS預測分析軟件就可以從很大程度上降低客源的流失,還可以從中找到行業(yè)運營過程中的問題,從而提供更快捷、更方便的發(fā)展平臺。例如通訊行業(yè)的發(fā)展就需要一些通信運營商通過計算機軟件技術(shù)來對客戶的相關(guān)資料進行整理,在這些信息中分析出目前的發(fā)展趨勢,然后將這些資料交給企業(yè)促進其經(jīng)濟效益的提升。

      (2)企業(yè)信息解決問題。利用企業(yè)運營管理軟件能夠有效的解決客戶資料獲取、風險分析以及雇員流動等問題,根據(jù)大數(shù)據(jù)時代的特征能夠為企業(yè)提供更好、更新的方法,在數(shù)據(jù)開發(fā)的過程中主要分成五個部分:1.抽樣。所謂抽樣就是在產(chǎn)品生產(chǎn)的過程中選取比較有代表性的作為樣本,樣本容量的選擇可以進行定位,但必須具有一定的代表性這樣更加方便于分析與操作。2.開發(fā)。通過開發(fā)、探索的方式來對數(shù)據(jù)進行分析能夠加深人們對數(shù)據(jù)的進一步認識,在開發(fā)過程中可能會涉及到對數(shù)據(jù)的導入、合并、選擇等步驟。3.修改。人們可以通過創(chuàng)建與選擇來對數(shù)據(jù)集進行修改,在修改的時候可能會涉及到變量的轉(zhuǎn)換、產(chǎn)品的編碼等等,然后再根據(jù)對應的數(shù)據(jù)進行分箱操作。4.模型。利用模型是為了讓預測的結(jié)果更加準確、可靠,同時這一步驟在企業(yè)解決方案的制訂中占有重要地位,也可以推動經(jīng)濟效益的提升。5.評定。評定技術(shù)是先與模型進行對比然后由人員進行仔細的分析,在數(shù)據(jù)挖掘的過程中相關(guān)技術(shù)人員應該開發(fā)出新的方式,對數(shù)據(jù)進行分析與整合才能確保信息的準確性。在可視化的工具中用戶可以將數(shù)據(jù)找出來并以圖形的方式進行表示,人員就可以對數(shù)據(jù)動態(tài)有更加深刻直觀的了解,此外,SAS/EM還有一些特殊的工具,其中包括可以進行流程圖的評分操作的工具以及用于考察執(zhí)行結(jié)果的工具等等。

      3 結(jié)束語

      綜上所述,計算技術(shù)在我國的發(fā)展迅速,我國在數(shù)據(jù)采集、分析以及存儲方面已經(jīng)取得了很大的成效,隨著這些技術(shù)的不斷推進,使得我國相關(guān)部門與企業(yè)的整體效率得到明顯提高,企業(yè)的生產(chǎn)模式基本實現(xiàn)了自動化的運行方式,這是大數(shù)據(jù)時代帶來的優(yōu)點,大數(shù)據(jù)的改革與創(chuàng)新讓計算機處理大量信息變?yōu)榭赡埽@樣一來不僅信息處理的效率提高了,同時也能降低一定的成本,目前已經(jīng)有越多越多的專業(yè)人員投入到了計算機軟件技術(shù)開發(fā)的工作中來,相信在眾多專業(yè)人員的共同努力之下,未來我國計算機軟件技術(shù)將會得到更大的發(fā)展,買上新的歷史階段。

      參考文獻

      [1]吳子紅.計算機軟件技術(shù)在大數(shù)據(jù)時代的應用[J].中小企業(yè)管理與科技,2014(09).

      [2]崔寧.計算機軟件技術(shù)在大型結(jié)構(gòu)實驗及現(xiàn)場檢測數(shù)據(jù)處理中的應用[J].產(chǎn)業(yè)與科技論壇,2013(21).

      [3]劉濤.計算機整編軟件技術(shù)在地下水監(jiān)測資料整編中應用[J].地下水,2013(05).

      [4]劉孔瑜.淺析計算機軟件技術(shù)的發(fā)展與應用[J].企業(yè)導報,2016(08).

      作者簡介

      篇(7)

      【摘要】大數(shù)據(jù)時代已經(jīng)到來,在此時代背景下,各行各業(yè)都面臨著對龐大而復雜的數(shù)據(jù)進行有效管理的巨大挑戰(zhàn),越來越認識到對自身產(chǎn)生和擁有的大數(shù)據(jù)進行有效管理的重要性和迫切性,檔案管理工作也不例外。

      關(guān)鍵詞 大數(shù)據(jù)時代;檔案管理工作;功能作用

      軍隊檔案管理是以保存部隊檔案并提供檔案資料為其他各項工作的一項重要工作,其直接面對著對元數(shù)據(jù)的收集、整理、鑒定、保管、檢索、利用等任務。然而面對當今各類信息、數(shù)據(jù)的大爆炸,傳統(tǒng)檔案管理的方式方法已明顯感覺有些吃力。為了較好的利用這龐大的數(shù)據(jù)為我部隊建設(shè)所用,我們引進當前時代的一個新名詞——大數(shù)據(jù),用新的理念、方法和手段不斷改進、革新檔案管理工作。

      1大數(shù)據(jù)對檔案管理工作的影響

      哈佛大學社會學教授加里金說:“這是一場革命,龐大的數(shù)據(jù)資源使得各個領(lǐng)域開始了量化進程,無論學術(shù)界、商界還是政府,所有領(lǐng)域都將開始這種進程”。大數(shù)據(jù)技術(shù)能實現(xiàn)所有數(shù)據(jù)的融合,減弱了對“因果關(guān)系”的要求,取而代之的是數(shù)據(jù)間的相關(guān)關(guān)系,給人們的生活、工作乃至思維都產(chǎn)生了巨大變革。可見,大數(shù)據(jù)時代的到來,對整個世界都已經(jīng)產(chǎn)生了巨大影響,具體到軍隊檔案管理領(lǐng)域,大數(shù)據(jù)的功能作用以及其對檔案管理工作的影響則主要表現(xiàn)在以下幾點:

      一是分析判斷能力強,方便了電子文件的鑒定和索引。大數(shù)據(jù)時代,電子文件以指數(shù)級的速度增長,給電子文件的管理帶來了前所未有的挑戰(zhàn),雖然我們知道浩瀚的電子文件中蘊藏著巨大的“金礦”,但我們逐漸發(fā)現(xiàn)想要從這些電子文件中“淘金”比紙質(zhì)文件還困難。面對著巨量的電子文件,逐一閱讀每一份電子文件的原文恐怕實在是無能為力。而大數(shù)據(jù)技術(shù)的強大功能作用為上述問題的解決提供了有效的幫助。在普通的硬件上安裝大數(shù)據(jù)轉(zhuǎn)發(fā)器,就能收集數(shù)據(jù)形成的龐大的系統(tǒng)數(shù)據(jù),大數(shù)據(jù)軟件可以為機器生成的海量數(shù)據(jù)建立索引,將其整理成可以搜索的鏈接,這正是檔案工作迫切需要的技術(shù)。除此之外大數(shù)據(jù)技術(shù)還能完成數(shù)據(jù)的分類、數(shù)據(jù)的挖掘,從而使檔案管理擁有應對越來越復雜的數(shù)據(jù)的分析能力。

      二是處理技術(shù)手段高,解決了非結(jié)構(gòu)化數(shù)據(jù)的處理難題。大數(shù)據(jù)類型繁多,包括結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),至2012年末,非結(jié)構(gòu)化數(shù)據(jù)占有比例達到整個數(shù)據(jù)量的75%以上。面對著快速增長的非結(jié)構(gòu)化文件,檔案工作者在進行電子文件管理時困難重重,現(xiàn)在基于大數(shù)據(jù)技術(shù)的數(shù)據(jù)庫,如SQL已經(jīng)既可以做關(guān)系數(shù)據(jù),也可以做空間數(shù)據(jù)、圖像、數(shù)據(jù)流等非結(jié)構(gòu)化數(shù)據(jù),而且基于對象的存儲架構(gòu)可以在一個系統(tǒng)中管理十億級別的文件數(shù)量,還不會像傳統(tǒng)存儲一樣遭遇元數(shù)據(jù)管理的困擾,大數(shù)據(jù)技術(shù)為檔案工作者管理非結(jié)構(gòu)化電子文件的問題提供了解決之道。

      三是數(shù)據(jù)存儲容量大,避免了海量信息和數(shù)據(jù)的丟失。近年以來,在檔案數(shù)據(jù)庫的使用過程中,常常會碰到無法向數(shù)據(jù)庫中增加新的檔案數(shù)據(jù)的情況。要想安全地存儲巨量的檔案數(shù)據(jù),不可能一味的蓋大樓、蓋機房,這就要求我們必須優(yōu)化存儲、提高效率和節(jié)約成本,其實比起其他諸如電信行業(yè)、通信行業(yè)、電子商務等行業(yè)面臨的數(shù)據(jù)存儲空間問題,其實檔案行業(yè)的存儲空間問題只是小巫見大巫,大數(shù)據(jù)在計算機領(lǐng)域已經(jīng)具有相當?shù)某墒於龋@也說明大數(shù)據(jù)技術(shù)對于解決存儲海量數(shù)據(jù)問題的有用性,這些公司使用大數(shù)據(jù)的經(jīng)驗對檔案行業(yè)解決數(shù)據(jù)的存儲問題具有高度的借鑒意義。

      2檔案管理運用大數(shù)據(jù)的策略

      既然大數(shù)據(jù)時代已經(jīng)到來,而且其功能作用對部隊檔案管理工作有著較為深遠的影響,運用得當,大數(shù)據(jù)將給我軍檔案管理工作帶來前所未有的成功,那么如何將大數(shù)據(jù)的理念較好地運用到檔案管理工作中來呢?

      2.1建立檔案資源管理中心

      大數(shù)據(jù)技術(shù)支持龐大數(shù)據(jù)的存儲和處理,使檔案資源的統(tǒng)一管理成為可能。為了維護檔案的安全及對檔案資源的綜合掌控,檔案需要備份,目前檔案館采用的是檔案的電子備份,檔案部門是否可以在全軍范圍內(nèi)建立一個區(qū)域或者檔案備份中心,并且各部隊檔案部門能夠做到資源共享呢?只要通過嚴密驗證和科學規(guī)劃,這一措施是完全可行的。若全軍的檔案數(shù)據(jù)資源能集中起來,那么利用大數(shù)據(jù)進行檔案資源的管理、開發(fā)和利用將指日可待。

      2.2培養(yǎng)大數(shù)據(jù)分析的專業(yè)人才

      外界企業(yè)通過尋求和專門的大數(shù)據(jù)開發(fā)公司合作,較好的運用了大數(shù)據(jù)技術(shù)。而檔案管理牽扯到部隊保密工作,若想引入大數(shù)據(jù),又要有效防止信息數(shù)據(jù)的泄露,就必須加緊健全信息化檔案管理人才隊伍,花大力氣培養(yǎng)大數(shù)據(jù)分析的部隊專業(yè)技術(shù)人才,方能有效避免擁有大量數(shù)據(jù)卻不懂數(shù)據(jù)分析的尷尬。

      2.3開發(fā)大數(shù)據(jù)分析工具

      部隊檔案管理區(qū)別于地方,存在特殊性和敏感性。這就要求我們必須結(jié)合部隊實際及檔案建設(shè)的特點,開發(fā)出一套符合我們自己的大數(shù)據(jù)分析工具。

      3檔案管理運用大數(shù)據(jù)應注意的事項

      盡管大數(shù)據(jù)能給檔案管理工作帶來諸多好處,但是這也不能掩蓋大數(shù)據(jù)背后存在的風險和隱患。一是失泄密問題。檔案信息資源的開發(fā)和利用會涉及到檔案信息的泄密、檔案信息的丟失和篡改等問題,如果這些數(shù)據(jù)信息被敵特分子竊取,將給我們國家安全造成強烈的影響。二是預測分析錯誤問題。畢竟,大數(shù)據(jù)的核心思想就是用規(guī)模劇增來改變現(xiàn)狀,其打破我們傳統(tǒng)思維模式,將重點關(guān)注在“相關(guān)關(guān)系”上,所有預測分析都會有失誤的時候,運用大數(shù)據(jù)預測來判斷和懲罰官兵的潛在行為,這是對公平公正以及自由意志的一種褻瀆,同時也輕視了決策過程中深思熟慮的重要性。三是濫用職權(quán)的工具。如果我們冒險把部隊事故案件的防范交到數(shù)據(jù)手中,這實際上是一種濫用。應用得當,大數(shù)據(jù)會是我們合理決策過程中的有力武器;倘若運用不當,它就可能會變成部分人員濫用職權(quán)的工具,輕則傷害官兵的利益,重則損害官兵的人身安全,所冒的風險比想象中要大很多。

      大數(shù)據(jù)時代的來臨,對檔案管理工作來說既是機遇也是挑戰(zhàn),檔案工作者需要努力抓住這個機遇,同時也要嚴肅對待風險與挑戰(zhàn),隨著大數(shù)據(jù)技術(shù)的發(fā)展和完善,大數(shù)據(jù)必有廣闊的應用前景,檔案管理在大數(shù)據(jù)時代將獲得巨大的突破,檔案信息資源中蘊藏著的巨大知識寶藏將會真正得以開發(fā)和利用。

      篇(8)

      二、大數(shù)據(jù)管理工程檔案與工程管理模型

      大數(shù)據(jù)管理工程檔案也是一個信息的整理的過程,本文在整合管理工程檔案現(xiàn)有模型研究的基礎(chǔ)上,結(jié)合大數(shù)據(jù)時代的來臨給管理工程檔案的實施帶來的挑戰(zhàn)和機遇,通過大數(shù)據(jù)管理工程檔案來促進工程的發(fā)展,分析了的大數(shù)據(jù)時代來臨下針對管理工程檔案的雙向決策模型,分別從工程評估與預測及工程監(jiān)測與預警兩個維度構(gòu)建了針對大數(shù)據(jù)管理工程檔案的方案[6]。因此,在本文中,針對大數(shù)據(jù)管理工程檔案構(gòu)建了兩種工程檔案管理的模型,第一個模型是數(shù)據(jù)驅(qū)動下的的工程監(jiān)測和預警的模型,采用的技術(shù)是跟蹤以及聚類;第二個模型是目標驅(qū)動的工程評估與預警模型采用的技術(shù)是推送以及表征,如下圖1所示。1.工程內(nèi)部集成檔案數(shù)據(jù)目標驅(qū)動管理的工程評估與預測模型。工程評估與預測模型的是目標驅(qū)動的一個模型,也即在工程內(nèi)部的目標驅(qū)動下的模型,也就是說在這一模型中,工程的決策者需求清楚的界定自己目標需求,根據(jù)自己的目標尋求實現(xiàn)目標的路徑。可以使用普通的數(shù)據(jù)挖掘和收集的方法,利用工程信息系統(tǒng)中關(guān)于工程檔案數(shù)據(jù)收集、整理以及分析計算等方法來達到,通過收集的數(shù)據(jù)表征、檢索、可視化以及推送等技術(shù)實現(xiàn)工程檔案大數(shù)據(jù)開展有針對性目標的挖掘,從而把這些收集整理的數(shù)據(jù)轉(zhuǎn)化為可以為工程決策目標所利用的信息及建議。此外,工程評估與預測模型是于傳統(tǒng)的數(shù)據(jù)挖掘和收集的方法上發(fā)展的,結(jié)合計量學學科中的相關(guān)技術(shù)方法應用于工程檔案管理工作中,在目標驅(qū)動下對大數(shù)據(jù)時代來臨時工程的策劃、工程的實施以及工程的評估等工程檔案數(shù)據(jù)中的海量信息進行有效整理和探析,以達致管理工程檔案的效用,從而有效評估工程的發(fā)展情況,有效及時的對工程發(fā)展的最終目的進行預測。2.工程外部網(wǎng)絡信息建檔數(shù)據(jù)驅(qū)動管理的工程監(jiān)測與預警模型。大數(shù)據(jù)時代來臨時工程外部網(wǎng)絡中有著海量的有用信息,這些信息對于工程建設(shè)中的新思維、新想法能起著啟發(fā)或促進作用,大數(shù)據(jù)管理工程檔案可以通過實時建檔對這些有效核心數(shù)據(jù)加以收集和利用,在工程實施過程中,可以通過大數(shù)據(jù)收集對工程發(fā)展有積極作用的新信息和新技術(shù),同時對于工程的不利影響因素和工程競爭對手的一些相關(guān)技術(shù)進行監(jiān)測,在監(jiān)測后針對所有會發(fā)生的情況進行分析,最終建立起工程的預警和監(jiān)測檔案數(shù)據(jù)庫,從另一個角度說,這也是建立工程監(jiān)測與預警模型的最終目標。與工程評估與預測模型的目標驅(qū)動不同的是,工程評估與預測模型通過預先定下的目標,來根據(jù)目標收集和整理相關(guān)數(shù)據(jù),而工程監(jiān)測與預警模型則不同,其更為重視通過數(shù)據(jù)系統(tǒng)自主分析來對網(wǎng)絡輿情進行研究,大數(shù)據(jù)時代來臨時的輿情分析系統(tǒng)有聚類、熱點主題檢測等相關(guān)的計算機文本信息的內(nèi)容識別技術(shù)。3.工程管理檔案大數(shù)據(jù)安全戰(zhàn)略體系構(gòu)建。以檔案大數(shù)據(jù)的方式來對工程的實施進行管理有著安全的風險,這也是大數(shù)據(jù)管理工程檔案的存儲存在的新安全問題,一般來說,工程檔案數(shù)據(jù)的數(shù)量以及質(zhì)量會對安全存儲系統(tǒng)的運行狀況帶來影響,大數(shù)據(jù)管理工程檔案中的安全存儲技術(shù)的升級速度較之數(shù)據(jù)增長的速度慢,因此,相應的面臨的大數(shù)據(jù)安全防護預警風險也大。

      篇(9)

      2大數(shù)據(jù)驅(qū)動下的教學模式探索

      大數(shù)據(jù)在為軟件行業(yè)的發(fā)展帶來機遇的同時,也帶來了挑戰(zhàn)。從軟件工程教學的視角,我們分析大數(shù)據(jù)時代對于軟件工程教學的影響,提出運用大數(shù)據(jù)服務軟件工程教育、提升學生素質(zhì)。

      (1)理論與實踐并重。

      軟件工程是一門兼顧理論與實踐的課程,為了實現(xiàn)培養(yǎng)應用型人才的目標,在實際教學活動中,往往圍繞著能力培養(yǎng)開展教學,重視培養(yǎng)學生的工程實踐能力,卻忽視以知識為中心的教學模式。我們并非提倡以講授軟件開發(fā)過程中的理論知識為中心,而是要求不但注重學生實踐能力的培養(yǎng),還要重視強化學生的理論基礎(chǔ)。重視軟件工程前導課程知識的銜接,例如數(shù)據(jù)結(jié)構(gòu)、算法設(shè)計與分析,還要將軟件行業(yè)發(fā)展的最新研究成果和熱點內(nèi)容,例如大數(shù)據(jù)下的軟件工程思維,及時地安排到課程教學中。通過將工程實踐的新技術(shù)與新方法融入到軟件工程的理論教學中,促使學生在掌握扎實的基礎(chǔ)理論知識的同時,引導學生自我構(gòu)建與現(xiàn)代軟件工程發(fā)展相適應的知識框架。

      (2)協(xié)同開發(fā)。

      當前軟件工程面臨的主要挑戰(zhàn)是合理分工,如何明確軟件企業(yè)內(nèi)部的職能分工、各技術(shù)崗位的職能范圍、權(quán)責和工作內(nèi)容。大數(shù)據(jù)環(huán)境下,軟件工程方法由邏輯驅(qū)動轉(zhuǎn)變?yōu)橛蓴?shù)據(jù)驅(qū)動。由于主要面向分布型應用和程序,軟件開發(fā)從封閉走向開放,開發(fā)人員通過分享和交互進行開發(fā)。在此過程中,應重視協(xié)同開發(fā)。采用團隊協(xié)同模式開發(fā)軟件項目過程中,根據(jù)學生的知識和能力進行組隊,不僅要明確團隊成員的職能范圍和工作內(nèi)容,還要明確需求分析、系統(tǒng)設(shè)計、代碼編寫、系統(tǒng)測試人員之間的權(quán)責。此外,在參與大型軟件的開發(fā)實訓中,還有細分相同角色人員的具體分工。在協(xié)同開發(fā)教學過程中,我們要避免學生自由組隊造成的“馬太效應”。根據(jù)教學實訓發(fā)現(xiàn),學生自由組隊,容易造成強強聯(lián)合。編程能力強的學生組隊,能夠較好的完成實訓項目,但是弱弱組隊卻無法順利的完成實訓任務。為了在協(xié)同開發(fā)中,培養(yǎng)學生的溝通表達能力、團隊合作能力,我們在教師的引導下,引進團隊制約機制。每個開發(fā)團隊通過強弱聯(lián)合組隊,每個團隊既是軟件開發(fā)者,同時也是軟件需求者。作為軟件開發(fā)者時,需要和軟件需求方討論需求分析、系統(tǒng)設(shè)計;作為軟件需求者時,需要提出自己的軟件應用要求。開發(fā)者和需求者的雙重身份,保證團隊之間只有經(jīng)過充分的溝通,才能完成軟件的開發(fā)。團隊制約機制使得學生在較短的時間內(nèi),能夠扮演多種開發(fā)角色,熟悉軟件企業(yè)的業(yè)務流程。

      (3)合作創(chuàng)新。

      大數(shù)據(jù)時代,面向服務的軟件工程、群體軟件工程得到了廣泛的應用和發(fā)展。在開放環(huán)境下,面向分布式應用和分布式的開發(fā)模式,需要充分利用網(wǎng)絡進行任務分配、創(chuàng)新解決方案。作為實踐性較強的學科,在實踐中研究以數(shù)據(jù)為驅(qū)動的軟件設(shè)計模式,有利于增強學生的創(chuàng)新意識。學校重視在軟件工程的實訓中培養(yǎng)學生的創(chuàng)新能力,積極鼓勵學生利用學校軟硬件平臺,申請學校科技創(chuàng)新課題,或者參加教師的軟件設(shè)計相關(guān)的科研項目。依托校企合建的軟件工程創(chuàng)新實驗室,通過完成“基于計算機視覺的胡蘿卜智能分級系統(tǒng)”、“基于MVC的上機考試與在線練習系統(tǒng)”等科技創(chuàng)新課題,激發(fā)學生的合作溝通技巧,提高學生軟件工程的創(chuàng)新能力。通過參與教師的“基于計算機視覺的花生品質(zhì)品種自動檢測系統(tǒng)”、“茶樹病蟲害遠程專家系統(tǒng)”等應用項目開發(fā),在實際的項目研發(fā)中促進學生解決問題能力、創(chuàng)新能力的提高。通過分析當前的校企合作辦學模式存在的問題,以及大數(shù)據(jù)時代的產(chǎn)業(yè)需求,學校與軟件企業(yè)在教材建設(shè)、教師培訓、實訓平臺、企業(yè)服務等方面建立合作關(guān)系,充分利用企業(yè)的技術(shù)優(yōu)勢,以培養(yǎng)應用型人才為共同目標的基礎(chǔ)上,實現(xiàn)學校、企業(yè)各自創(chuàng)新活動。出版了《設(shè)計模式(Java版)》等應用型教材,從理論、應用和實例三方面出發(fā),幫助學生了解軟件工程的最新模式,提高學生的實際動手能力和創(chuàng)新能力。在軟件企業(yè)實訓基地,通過定制的實訓解決方案和軟件企業(yè)提供的實訓服務,學生在企業(yè)技術(shù)人員的指導下,重新開發(fā)“海爾OEC日志管理系統(tǒng)”等大型軟件。不但鍛煉了學生的團隊合作精神、增強了自身的創(chuàng)新意識,而且在工程實訓中個人能力和素質(zhì)也得到鍛煉和提升。

      篇(10)

      隨著信息技術(shù)的廣泛應用,人們逐漸步入到大數(shù)據(jù)時代,大數(shù)據(jù)時代讓人們的生產(chǎn)生活方式都發(fā)生了改變,讓人們的生活變得更加便捷,同時也為企業(yè)提供了發(fā)展的條件,促使企業(yè)在新時代背景下得到更好的發(fā)展,但在便捷的同時也為人們帶來了新的挑戰(zhàn)和機遇,尤其是軟件工程的發(fā)展,相關(guān)研究技術(shù)人員要在掌握軟件工程技術(shù)的基礎(chǔ)上,加強對軟件工程技術(shù)應用的創(chuàng)新和改革,為軟件工程技術(shù)提供更多的發(fā)展條件。

      一、大數(shù)據(jù)和軟件工程技術(shù)的發(fā)展方向

      (一)大數(shù)據(jù)和軟件工程技術(shù)的開放式發(fā)展隨著科學技術(shù)的快速發(fā)展,互聯(lián)網(wǎng)技術(shù)逐漸應用到各個領(lǐng)域的發(fā)展中,隨之隨著互聯(lián)網(wǎng)技術(shù)的廣泛應用,人們逐漸進入到大數(shù)據(jù)時代,大數(shù)據(jù)的到來讓計算機技術(shù)得到了改革。大數(shù)據(jù)要想得到更好的發(fā)展,就必須要開發(fā)和尋求發(fā)展的途徑,在產(chǎn)生大量數(shù)據(jù)流的基礎(chǔ)上,不斷的創(chuàng)新優(yōu)化技術(shù)。計算機軟件工程技術(shù)要想得到更好的發(fā)展,就要加強建設(shè)計算機網(wǎng)絡的開發(fā)環(huán)境,讓計算機在開發(fā)的環(huán)境中實現(xiàn)相互通信、資源共享,提升軟件的利用率。此外,網(wǎng)絡在運行的過程中可以增加利潤,讓不同用戶都能滿足需求,從而節(jié)約資源,提高資源的利用率。

      (二)大數(shù)據(jù)和軟件工程技術(shù)應用到其他領(lǐng)域隨著大數(shù)據(jù)時代的到來,對計算機軟件工程技術(shù)又提出了新的要求,要將計算機軟件工程技術(shù)和大數(shù)據(jù)技術(shù)進行有效的融合,從而更好的服務于社會。目前,軟件工程技術(shù)已經(jīng)得到了各行各業(yè)的廣泛應用,由于軟件工程技術(shù)對各領(lǐng)域都起著推動作用,讓各個應用程序都能得到有效的運行,同時還可以對相關(guān)平臺的數(shù)據(jù)信息進行收集并整理分析。如:用戶在購買股票對大數(shù)據(jù)進行分析時,可以利用軟件工程技術(shù)對大數(shù)據(jù)信息進行構(gòu)建數(shù)據(jù)模型,利用數(shù)據(jù)模型,預測股票的變化形勢。

      二、大數(shù)據(jù)時代下軟件工程技術(shù)的應用

      (一)安全信息技術(shù)的應用在大數(shù)據(jù)時代背景下,其產(chǎn)生的大量數(shù)據(jù)流之間會有一定的聯(lián)系,但數(shù)據(jù)也會因此產(chǎn)生不同程度的影響,所以,要想提高數(shù)據(jù)的實效性和安全性,就必須要科學、合理的管理數(shù)據(jù)系統(tǒng)。在一般情況下,大型的數(shù)據(jù)信息平臺都是開放式的,隨著互聯(lián)網(wǎng)信息技術(shù)的快速發(fā)展,互聯(lián)網(wǎng)信息技術(shù)逐漸應用到各個領(lǐng)域中,它讓人們的生活更加的便捷,但在便捷的同時也存在一定的風險,隨著時代的發(fā)展,人們逐漸進入到大數(shù)據(jù)時代,在大時代背景下出現(xiàn)了較多的黑客,這些黑客利用大數(shù)據(jù)的漏洞進行違法操作,這對數(shù)據(jù)的儲存和分析產(chǎn)生嚴重的影響,因此,在大數(shù)據(jù)背景下,要加強軟件工程技術(shù)的應用和建設(shè),為數(shù)據(jù)的實效性和安全性提供有效的保障。

      (二)進行數(shù)據(jù)信息采集大數(shù)據(jù)的發(fā)展依據(jù)是對數(shù)據(jù)信息進行采集整理分析,在軟件工程技術(shù)中對數(shù)據(jù)信息進行采集整理分析也是非常重要的部分,因此,在大數(shù)據(jù)時代背景下,可以通過軟件工程技術(shù)的應用,對相關(guān)數(shù)據(jù)信息進行采集整理分析,同時還要提升各個軟件之間的協(xié)作能力,擴大數(shù)據(jù)信息的儲存空間。此外,用戶在運行軟件工程技術(shù)過程時,可以根據(jù)用戶的需求,對相關(guān)對數(shù)據(jù)信息進行采集整理分析,同時還要將多余的數(shù)據(jù)進行刪改,從而降低大數(shù)據(jù)的數(shù)據(jù)采集成本,讓用戶在對大數(shù)據(jù)進行進行采集整理分析時,提升處理效率,以此來為軟件工程技術(shù)的提供更好的發(fā)展和應用條件。

      (三)進行數(shù)據(jù)信息儲存隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)信息逐漸從G和T轉(zhuǎn)變成ZB,且數(shù)據(jù)信息在進行儲存時,儲存在內(nèi)容不再單一的文字了,其內(nèi)容包含圖形、文字、視頻等形式,由此可見,在大數(shù)據(jù)時代背景下,對計算機的性能和儲存空間又提出了新的要求和挑戰(zhàn),要求在大時代背景下進行數(shù)據(jù)儲存時,避免出現(xiàn)數(shù)據(jù)信息缺失的現(xiàn)象,而軟件工程技術(shù)可以有效的解決這一問題,它不僅可以提升數(shù)據(jù)信息的儲存空間,而且還能提升儲存數(shù)據(jù)信息安全性能,可以有效的防止儲存的數(shù)據(jù)信息缺失。除此之外,在大數(shù)據(jù)時代下應用軟件工程技術(shù),可以通過利用軟件工程技術(shù)中的云技術(shù),將數(shù)據(jù)信息進行云端儲存,提升計算機的儲存空間,以此來提升計算機儲存空間的利用率。

      篇(11)

      從解決實際問題出發(fā),不論是需要作出重大決策還是改變小小的設(shè)計,騰訊在利用大數(shù)據(jù)的時候有其自身的優(yōu)勢,那就是騰訊擁有海量的數(shù)據(jù)。業(yè)界有一種聲音是忽略大數(shù)據(jù)的“大”,關(guān)注數(shù)據(jù)本身的價值,而在騰訊這里,“大”甚至無法回避。比如,根據(jù)騰訊云分析《2014年第二季度移動行業(yè)數(shù)據(jù)報告》的數(shù)據(jù),接入騰訊云分析的APP覆蓋設(shè)備超過15億。

      如果單個數(shù)字不足以說明什么,那么還有以下這幾個數(shù)字:

      即時通信QQ活躍帳戶數(shù)達到8.29億;

      QQ智能終端月活躍帳戶數(shù)5.21億;

      即時通信QQ最高同時在線帳戶數(shù)達到2.06億;

      “微信和WeChat”合并月活躍帳戶數(shù)達到4.38億;

      “QQ空間”月活躍帳戶數(shù)達到6.45億;

      QQ空間智能終端月活躍帳戶數(shù)4.97億;

      (數(shù)據(jù)來源于網(wǎng)絡)

      探尋大數(shù)據(jù)先行者的足跡,騰訊是國內(nèi)最具代表性的企業(yè)之一,而其對“大數(shù)據(jù)、小場景”的認知,更是在大數(shù)據(jù)的實際應用中走到了前列。

      從一個小小的按鈕說起

      很多人無法將大數(shù)據(jù)概念和具體實踐聯(lián)系起來,是由于對大數(shù)據(jù)這一概念的“仰望”,好像大數(shù)據(jù)是突然有一天憑空生出來的一樣。而事實上,“在大數(shù)據(jù)這個概念被包裝出來之前,互聯(lián)網(wǎng)公司就已經(jīng)很認真地在使用相關(guān)的方法和技術(shù),” 陳磊表示,“這些方法和技術(shù)實際上是一直應用在我們?nèi)粘9ぷ鳟斨械摹!?/p>

      陳磊講到騰訊在設(shè)計產(chǎn)品時的一個場景:“我們界面的設(shè)計都是在測試用戶行為的基礎(chǔ)之上進行的,我們很少憑空去想用戶會喜歡什么樣的設(shè)計。”比如在設(shè)計一個按鈕時,其擺放的位置、包含的文字,包括顏色、形狀這些都會做各種各樣的嘗試,而最后采用哪一個選擇,要看用戶在實際使用中對這個按鈕的點擊率。可以說,除了要在整體的風格上保持一致,很多設(shè)計都是以最終用戶的行為作為依據(jù)的。

      互聯(lián)網(wǎng)是大數(shù)據(jù)最先改變的產(chǎn)業(yè),這與互聯(lián)網(wǎng)企業(yè)的文化也有關(guān)系。陳磊表示,互聯(lián)網(wǎng)企業(yè)不認為通過自己的想法能夠很準確地把握用戶需求,而讓用戶去試的時候,用戶會用他的行為投票。“所以互聯(lián)網(wǎng)公司講究摸著石頭過河,最主要的原因是希望在不斷嘗試的過程當中,發(fā)現(xiàn)用戶真正的需求而更好地滿足它。”他說。

      通過大數(shù)據(jù)的方法來準確地把握用戶需求,來指導一個按鈕的設(shè)計,騰訊就是這樣將大數(shù)據(jù)應用到這些小的場景中。實際上,騰訊對產(chǎn)品的每一個功能都會去做AB測試。

      動態(tài)運營,將決策權(quán)交給用戶

      騰訊的很多產(chǎn)品版本更新非常快,由于每次新版本下發(fā)都需要用戶去下載安裝才能更新。這需要對每個產(chǎn)品都進行用戶管理的研究:從用戶開始使用這個產(chǎn)品,到這個產(chǎn)品的使用達到一個高峰,再到最后一些用戶選擇棄用,騰訊將這些環(huán)節(jié)叫做拉新、留存和流失。陳磊表示:“我們會分析流失客戶的特征是什么。他在使用這個產(chǎn)品的時候,和在流失之前行為發(fā)生了哪些改變。通過用戶使用產(chǎn)品的數(shù)據(jù)做了這樣的分析之后,我們大致就能夠理解某一類用戶離開這個產(chǎn)品的主要原因,進而在產(chǎn)品上做一些改造,讓這類用戶對我們的產(chǎn)品更有黏性。這些都離不開數(shù)據(jù)和數(shù)據(jù)分析。”

      產(chǎn)品在研發(fā)過程當中根據(jù)用戶的使用習慣不停的調(diào)節(jié),這個過程叫作“動態(tài)運營”。所謂動態(tài)運營的理念,將每一件事情都看作是一個小小的實驗,或者將大項目分解為很多小的產(chǎn)品步驟,每一步都很小,這樣每一步走對了或走錯了,能夠快速得到反饋。

      陳磊說,過去很多企業(yè)運營的方法是先制訂戰(zhàn)略,然后根據(jù)戰(zhàn)略去分解執(zhí)行,半年之后總結(jié)執(zhí)行情況。在今天,這種緩慢的應變機制是行不通的。

      動態(tài)運營將產(chǎn)品更新的決策權(quán)交到用戶手中,這就是業(yè)務前線化(FOT)中后段決策讓位于分布式前端一線決策的例證。大數(shù)據(jù)為動態(tài)運營提供了有力支撐。

      讓廣點通脫胎換骨

      大數(shù)據(jù)對廣點通影響可謂脫胎換骨,關(guān)鍵的一件事情就是對數(shù)據(jù)的實時處理和采用。據(jù)陳磊介紹,過去廣點通只能將前一天的用戶點擊行為進行數(shù)據(jù)分析,在第二天來使用,顯然無法滿足廣告業(yè)務的要求。在大數(shù)據(jù)的支撐下,騰訊逐步將分析方法變成相隔一個小時,15分鐘,到最后做成只差幾秒,數(shù)據(jù)就能夠回流,并且能夠在下一次給用戶展示廣告的時候去使用。

      據(jù)悉,廣點通不僅對數(shù)據(jù)的實時性要求非常高,對數(shù)據(jù)的準確性要求也一樣。例如,一些用戶填寫的數(shù)據(jù)未必是真實的,在數(shù)據(jù)的采集和流轉(zhuǎn)的過程中,對海量數(shù)據(jù)的保真提出了挑戰(zhàn)。騰訊在應對數(shù)據(jù)的海量、精準和實時的挑戰(zhàn)過程中研發(fā)了大量的產(chǎn)品。

      為不同的用戶做精準推薦

      騰訊與小米曾有過兩次合作,第一次是紅米手機,在90秒鐘訂出十萬部手機,第二次是紅米Note開售,在第一秒的時間有41.9萬次點擊。從最后的結(jié)果上看,這兩次活動做得非常成功,其背后除了小米營銷策略的功勞之外,騰訊利用大數(shù)據(jù)找到對紅米手機有潛在需求的用戶并精準推薦也是原因之一。

      另外一個案例是騰訊通過大數(shù)據(jù)的手段去運營《穿越火線》這款游戲。在這個游戲的熱度開始下滑的時候,騰訊利用大數(shù)據(jù)做了大量的留存活動,這些活動是針對玩家喜歡這個游戲的原因去做的。陳磊介紹說:“比如一些玩家是因為有幾個比較好的朋友經(jīng)常組隊去打游戲,那么我們通過好友邀請他,重溫一下過去打游戲的好時光,讓他再回來使用這個游戲;有一些用戶把某一類武器玩得非常好,但是這個武器已經(jīng)打到極致了,這時候我們就會創(chuàng)造新的武器。通過這樣的方式來讓用戶持續(xù)玩這個游戲,要對這個用戶的特點有很清楚的認知。”

      精準推薦的前提是用戶畫像,在游戲領(lǐng)域的應用著實超出想象。據(jù)悉,騰訊微博建立SocialData體系挖掘社交大數(shù)據(jù)為用戶畫像。

      騰訊的大數(shù)據(jù)服務

      大數(shù)據(jù)的實現(xiàn)需要IT基礎(chǔ)設(shè)施和工具的支撐,這里涉及很多技術(shù)方面的問題,騰訊很多的系統(tǒng)都是自主研發(fā),比如數(shù)據(jù)采集的系統(tǒng)和任務調(diào)度的系統(tǒng)。至于其中的技術(shù),并不是我們這次要探尋的重點,但這里還是要介紹騰訊的三類大數(shù)據(jù)服務,它們是騰訊在自身利用大數(shù)據(jù)以及用大數(shù)據(jù)服務客戶過程中留下的堅實的足跡。

      目前,騰訊通過騰訊云給客戶提供三類免費的大數(shù)據(jù)服務:

      TOD Tencent Open Data

      Tencent Open Data是基于騰訊的大規(guī)模計算集群,提供數(shù)據(jù)采集、自助加工、任務調(diào)度等能力的云端大數(shù)據(jù)解決方案。其優(yōu)勢在于:不用采購任何物理設(shè)備,即開即用;不用擔心數(shù)據(jù)量膨脹的時候無法擴展;只需要開發(fā)業(yè)務邏輯,其他部署、運行、監(jiān)控都交給TOD。

      例如,你可以用TOD分析apache訪問日志,定義一個每天都執(zhí)行的任務收集訪問日志的有用信息,然后定義一個每周運行的任務匯總加工訪問信息,最后定義一個數(shù)據(jù)導出任務將數(shù)據(jù)導出生成周報。TOD能夠處理真實數(shù)據(jù)加工中各種不確定性因素。只要你設(shè)定了運行規(guī)則,TOD就可以確保任務流按照設(shè)定的規(guī)則運行。

      信鴿

      信鴿,是一款移動APP推送平臺,支持億級的通知/消息,能在Android/iOS平臺進行各類高級自定義的推送操作,秒級觸達移動終端用戶。開發(fā)者可以方便地嵌入SDK,通過API調(diào)用可或視化操作界面,實現(xiàn)對特定用戶發(fā)送通知/消息,提升用戶活躍度,激活沉睡用戶,并實時查看推送效果。

      信鴿可為應用用戶設(shè)置多種標簽,包括地理位置、應用版本號、活躍度,更可結(jié)合行為的記錄自定義為“在深圳喜愛川菜的女白領(lǐng)”,“超過7天未登錄游戲的大學生”、“有高消費潛力的土豪”等。根據(jù)業(yè)務、用戶行為等圈定不同用戶群體并將其賬號保存成號碼包文件,通過信鴿前臺上傳,做特定的運營推廣活動,達到精準觸達用戶的目的。

      信鴿pro高級標簽,可基于騰訊大數(shù)據(jù)優(yōu)勢,基于玩家的在線時長,使用頻率,付費、登錄行為,游戲關(guān)卡的失敗率、道具使用購買統(tǒng)計等因子,建立流失用戶預測模型與付費用戶預測模型。模型可精準預測潛在流失與付費用戶,預測覆蓋率超過85%,準確率超過91%。利用信鴿對潛在流失用戶群推送針對性的營銷活動,回流率比隨機推送提升120%。

      MTA 騰訊云分析

      騰訊云分析是專業(yè)的移動應用數(shù)據(jù)運營平臺,支持iOS和Android。開發(fā)者可以方便地通過嵌入統(tǒng)計SDK,實現(xiàn)對移動應用的全面監(jiān)測,實時掌握產(chǎn)品表現(xiàn),準確洞察用戶行為。前面我們已經(jīng)提到,2014年第二季度報告中,接入騰訊云分析的APP覆蓋設(shè)備超過15億。

      騰訊云分析的功能及優(yōu)勢包括:

      (1)APP數(shù)據(jù)的收集:比如新增、活躍、留存、用戶畫像、渠道數(shù)據(jù)等等;

      (2)行為分析:用戶在使用APP的時候其實是一系列的過程,尤其像支付購買這樣的操作,到底是中間那個環(huán)節(jié)導致用戶流失,通過行為分析中的路徑分析、頁面來源就可以清楚的了解到,其次像用戶在頁面的停留時長、打開次數(shù)也會有統(tǒng)計;

      (3)自定義事件和漏斗模型:幫助用戶自主的去統(tǒng)計小到按鈕的點擊行為,完全可以自主控制,還可以將用戶行為串聯(lián)起來形成一條自主路徑,觀察用戶的行為;

      (4)錯誤管理:幫助開發(fā)者管理應用錯誤,找到錯誤根源,同時對于應用數(shù)據(jù)的突變支持通過微信服務號告警;

      (5)專門的游戲分析:針對游戲應用這個龐大的群體,云分析推出專門的游戲分析,可以細致的分析到玩家在關(guān)卡、對戰(zhàn)中的行為,充值、購買道具的行為。

      騰訊云分析對開發(fā)者的作用主要有兩方面:一是開發(fā)者可以通過自己的數(shù)據(jù)波動找到產(chǎn)品優(yōu)化的方向,比如一款游戲,如果發(fā)現(xiàn)某個關(guān)卡用戶流失嚴重,那是不是要優(yōu)化關(guān)卡,或者推出游戲攻略、關(guān)卡獎勵等活動;二是開發(fā)者可以通過數(shù)據(jù)知道自己運營效果,比如一款應用,在相關(guān)媒體網(wǎng)站上發(fā)送文章,引來一部分用戶,引流的量是多少,是否和之前的的預期一樣,效果會持續(xù)多久,這樣就可以預估活動的頻率和范圍。

      主站蜘蛛池模板: 九九精品在线视频| 伊人久久精品影院| 亚洲欧美日韩国产一区二区三区精品 | 久久国产精品99久久久久久老狼| 久久精品一本到99热免费| 精品久久久久中文字幕日本| 国产成人精品怡红院在线观看| AAA级久久久精品无码片| 国产精品亚洲高清一区二区| 国产精品91av| 乱色精品无码一区二区国产盗| 91精品国产9l久久久久| 曰韩精品无码一区二区三区| 国产精品极品| 无码精品一区二区三区免费视频| 精品人妻V?出轨中文字幕| 99re8这里有精品热视频免费| 国产偷窥熟女高潮精品视频| 欧美国产日本精品一区二区三区| 国产亚洲精品a在线观看| 中文字幕精品一区影音先锋| 国产精品欧美亚洲韩国日本| 国产精品美女一区二区视频 | 亚洲精品无码激情AV| 国产精品无码专区在线观看| 亚洲精品欧美综合| 国产精品福利一区二区久久| 99热精品在线| 国产精品视频一区国模私拍| 国产成人精品男人的天堂538| 久久久久久无码国产精品中文字幕 | 婷婷成人国产精品| 精品无码综合一区| 国产在线精品一区免费香蕉 | 国产成人亚洲精品影院| 日韩精品一区二区三区大桥未久| 人妻无码久久精品| 国内精品视频在线观看| 国产精品免费久久久久电影网| 99精品国产在热久久无毒不卡| 国语自产精品视频|