大數據論文范文第1篇
〔關鍵詞〕大數據;共詞分析法;聚類分析;多維尺度分析;可視化
DOI:10.3969/j.issn.1008-0821.2013.09.026
〔中圖分類號〕TP391;G250.252〔文獻標識碼〕A〔文章編號〕1008-0821(2013)09-0129-06
2011年5月,麥肯錫全球研究院(McKinsey Global Institute)了研究報告《大數據:創新、競爭和生產力的下一個前沿領域》(Big data,The next frontier for innovation,competition,and productivity)[1]。2012年1月在瑞士達沃斯舉行的世界經濟論壇上,“大數據”是討論的主題之一,論壇上的題為《大數據,大影響》(Big Data,Big Impact)的報告中提出,“數據已經成為一種新的經濟資產類別,就像貨幣或黃金一樣。[2]”2012年3月29日,美國政府在白宮網站上了《大數據研究和發展倡議》(Big Data Research and Development Initiative),該倡議涉及聯邦政府的6個部門,這些部門承諾將投資超過兩億美元,來大力推動和改善大數據的提取、存儲、分析、共享和可視化。
無論是美國政府的倡議,麥肯錫的研究報告,還是世界經濟論壇的議題,都預示著人們,大數據時代已經到來。大數據正在撬動全世界的神經,大到一個國家、企業,小到每一個獨立存在的個人,都將成為大數據時代的貢獻者和受益者。那么,大數據究竟是什么?維基百科將大數據解釋為“是指無法在一定時間內用通常的軟件工具進行捕獲、管理的數據集合”[3]。關于數據量究竟要達到多少才可以被稱之為大數據,目前尚無統一說法。一般認為,大數據的數量級應該是“太字節”,即240。大數據之“大”,并不僅僅在于其“容量之大”,更多的意義在于,人們可以“分析和使用”的數據在大量增加,通過這些數據的交換、整合和分析,人類可以發現新的知識,創造新的價值,帶來“大知識”、“大科技”、“大利潤”和“大發展”[4]。
目前國內學者中,楊繹以國內文獻為研究基礎,以關鍵詞分析為主要方法,對目前國內期刊和報紙上有關“大數據”的文獻進行了研究[5]。韓芳芳等以CNKI為數據源,從文獻、作者、關鍵詞3個角度分析我國大數據領域的相關文獻。筆者認為很有必要對國際大數據領域文的獻進行分析,從而把握國際大數據領域的研究現狀與熱點,以供國內學者參考借鑒。
1數據來源與研究方法
Web of Science(簡稱WOS)是美國湯姆森集團開發的產品,是大型綜合性、多學科期刊引文索引數據庫。WOS收錄了世界上經過同行專家評審的有影響力的文獻,選用WOS作為數據源進行研究可以保證研究資料的權威性。本文選取WOS數據庫下3個子庫Science Citation Index Expanded(SCI-EXPANDED,科學引文索引擴展版)、Social Sciences Citation Index(SSCI,社會科學引文索引)、Arts & Humanities Citation Index(A&HCI,人文藝術科學引文索引),檢索年限為“所有年份”,數據庫更新日期為2013年4月5日,以“big data”為檢索詞進行“主題”檢索,共檢得171篇大數據領域的相關文獻(檢索日期:2013年4月10日)。
本文借助SPSS 190軟件,采用共詞分析法對國際大數據的研究熱點進行分析。共詞分析法(Co-term Analysis)最早是在20世紀70年代中后期由法國文獻計量學家提出的,其思想來源于文獻計量學中的引文耦合與共被引的概念。共詞分析法的基本原理是,統計一組詞(關鍵詞或者主題詞)兩兩在同一篇文獻中出現的次數,以此作為基礎進行聚類分析,從而得出這些詞語之前的親疏遠近的關系,進而分析出這些詞語所代表的學科或者主題的結構變化情況[7]。共詞分析法研究的是某一學科領域中當前的學術文獻所集中關注的主題,很適合于分析某一學科的研究熱點和知識結構[8]。
2013年9月1第33卷第9期1現?代?情?報1Journal of Modern Information1Sep,20131Vol.33No92013年9月1第33卷第9期1國際大數據研究論文的計量分析1Sep,20131Vol.33No92文獻計量分析
2.1年代分析
通過對文獻發表時間的分析,可以勾勒出國際大數據研究領域的發展軌跡,揭示其發展的總體趨勢。將在數據庫中檢索得到的論文按照年度進行歸類,如表1所示。
大數據論文范文第2篇
只有在同一時間同一地區大量采集樣本,才有可能滿足RCT隨機對照實驗的樣本要求。RCT樣本問題可望在大數據時代得到解決,隨著泛在隨時采集樣本的大數據時代的到來,以及不間斷采集醫療數據的可佩戴設備出現,樣本數據的稀缺等問題將隨巨量數據消失。而隨著新型大數據分析挖掘工具的出現,特別是深度學習技術的不斷發展和應用,證據及其結論的準確可信性必將大大提高。目前,深度學習識別5749個人臉的精度已達99.15%,其準確程度已經超過人眼和大腦。因此,深度學習必將為循證醫學帶來一場新的革命。本文將分析循證醫學在數據證據獲取、分析、制作等方面所面臨的挑戰,介紹醫療大數據時代的數據采集、整合、分析和處理方法,介紹面向醫療大數據的深度學習技術自動提取疾病特征的原理和方法,以及醫療大數據及基于云計算的深度學習對循證醫學所帶來的各種變革。面向大數據的深度學習將特征提取與決策分析過程合二為一,大大降低了醫生在臨床及醫學研究中應用循證醫學的勞動強度。結合醫療大數據、云計算和深度學習的循證醫學,將克服過去數據證據稀少、偏頗、失信、不公、過時等不足,將具有更加廣闊的推廣應用前景和發展動力。
1循證醫學與數據證據
循證醫學,簡之就是“遵循證據的醫學”,又被稱為實證醫學。循證醫學重視醫生的臨床經驗,即傳統意義上的經驗醫學,同時又強調診斷、治療等決策應在臨床證據最為符合病癥的基礎上作出[1]。在循證醫學的創立、發展與傳播方面,英國的科克倫(ArchiebaldL.Cochrane)、美國的費恩斯坦(AlvanR.Feinstein)以及薩克特(DavidL.Sackett)做出了重大貢獻,成為循證醫學的奠基人。科克倫強調大規模隨機臨床試驗的重要性。他認為只有在大規模臨床試驗中使用隨機分組策略,才能避免因樣本分組而產生的選擇性偏差,保持對照組和試驗組樣本的背景因素平衡,從而才能做出最終正確的比較與評價。他建議及時將切實醫學證據傳播給使用者,接受專家評估并對可信度進行適當分級,以使醫學證據能被及時整理、歸納與更新。費恩斯坦奠定了現代流行病學的數理統計與邏輯基礎。從1970年到1981年,他在美國《臨床藥理學與治療學》雜志(ClinicalPharmacologyandTherapeutics)上,以“臨床生物統計學”(ClinicalBiostatistics)為題連續發表了57篇論文,將數理統計學和邏輯學導入到臨床流行病學,科學系統地建立了臨床流行病學的有關理論體系。薩科特則為循證醫學的傳播與發展做出了巨大貢獻。他發起并主編了與循證醫學有關的兩本著名雜志:《美國內科醫師學會雜志俱樂部》和《循證醫學》。
1997年,他還主編出版了《循證醫學》一書,該書被譯為多種文字并在世界上廣為傳播。正是在《美國內科醫師學會雜志俱樂部》上,加拿大蓋亞特(rdonH.Guyatt)于1991年首次提出了循證醫學一詞[3]。從循證醫學與數理統計和邏輯學的淵源,便可以看出循證醫學注重證據的內涵。它是一門非常強調證據制作的學科,同時又非常重視醫學證據的傳播和評估,這正是它區別于以往醫學的特點。通過評估產生可信證據,通過傳播發揮證據價值。醫生在診斷與治療過程中,不僅基于經驗直觀判斷,而且結合證據科學決策,更加客觀地進行診斷與治療。短短十多年的時間,在世界各國醫學研究與臨床實踐中,循證醫學得到了廣泛深入的應用。科克倫最初創建的世界循證醫學協作網已經包括約50個專業協作小組,所收集的醫療證據幾乎覆蓋所有臨床醫學領域。1996年,我國華西醫科大學建立了中國循證醫學中心,并于1999年正式加入世界循證醫學協作網;2001年,中國循證醫學中心創辦了《循證醫學》雜志,發表在各類雜志的循證研究論文達45842篇。但是,循證醫學也有其面臨的問題,如對證據進行科學評價等問題。臨床證據目前還沒有完整、科學的定義,證據評價標準及推薦級別尚未完全統一,不同國家不同疾病的證據質量分級不盡相同。而且,隨著人類對疾病認識的加深以及診療手段的革新,評價標準還會隨這些因素的變化而變化。
循證醫學的基礎是數理統計學,要求RCT的實驗樣本及環境一致,以便排除個體差異及環境干擾,但這在現有條件下近乎不可能實現。號稱大規模隨機對照實驗的樣本偏少,對照組和試驗組難有條件一致的個體,環境隨時間空間變化造成實驗對照控制困難。目前,大規模的醫學樣本采集困難,幾百個樣本已經算是比較大的樣本了;而根據統計理論如要達到90%的敏感度,至少需要約1300個的數據樣本。為了克服RCT樣本不足的問題,Meta分析方法得到了廣泛應用:通過綜合已有研究多個樣本集的結果,可以推得大規模樣本集的綜合結果。Meta分析取得了很多有價值的研究成果,但是,Meta分析的基礎也是數理統計學,其運用的前提是樣本及實驗環境一致,正是在這一點上它備受質疑。首先,不同樣本集的權重控制難于完全公正,因為其實驗環境難于恰當評價和把控,實驗結果難免有過度包裝和偏頗之嫌。Meta分析存在的另一個問題是:它所依賴的數據往往不是最新的即時案例,制作的證據可能因環境與氣候的變化而失去應用價值。總之,循證醫學所面臨的問題包括:證據的稀缺性、偏倚性、可靠性、及時性、公正性,以及環境的一致性等方面的問題。由于證據的一致性和及時性存在問題,基于歷史數據進行Meta分析備受質疑。2014年,《英國醫學雜志》在名為《循證醫學瀕臨破產》的文章中指出[5]:循證醫學的證據屬于間接證據,基礎建立在已經發表的研究文獻上,利益沖突容易影響證據的公正性,證據環境與臨床決策環境存在距離;循證醫學助長了過度診斷、過度治療,并可能存在淪落為利益集團代言人的危險。
2大數據對循證醫學的影響
大數據(Bigdata)又稱巨量或海量數據,是指數據規模巨大以至在合理時間內,無法通過當前主流軟件工具,獲取、處理、分析以便決策的結構復雜的數據[6]。大數據如下具有4V特點:Volume(巨量)、Velocity(瞬速)、Variety(多樣)、Value(價值)。巨量是指已經不能再用GB(即1024MB)和TB(即1024GB)為單位,來衡量大數據的存儲容量或規模,而要以PB(即1024TB)、EB(即1024PB)乃至ZB(即1024EB)為單位來計量數據容量。在巨量的醫療大數據中,各種條件的樣本都會存在,因此,證據的稀缺已經不是問題。瞬速是指兼具方向的快速變化,即數據隨時間和空間快速變化。大數據中的樣本通常是全空間的、多維度的、全時間的及瞬時變化的。由于大數據地域環境廣,數據樣本量巨大、正反樣本齊全,證據的“制作”已不再必要,而是隨時隨地客觀地存在。瞬速性通過可佩戴健康監測設備體現,這為及時獲取病患信息提供了極大便利。多樣是指數據的種類繁多、結構復雜、因果并存、甚至同一數據表現出不同形式。數據的多樣性對數據的理解和分析是一個巨大挑戰,但同時也為樣本分析結果的驗證帶來便利。因此,在醫療大數據環境下,不僅隨時可以采集樣本進行分析處理,還能對分析得到的結果馬上進行驗證,從而能夠保證醫學證據的可靠與可信。
價值是指相比小規模、歷史數據而言,大數據具有更高的研究和使用價值。由于任意時刻任意地點都有大量樣本,樣本的稀缺性和及時性已經不是問題,這為醫學研究掃清了采樣障礙;同時由于樣本豐富冗余多樣,也為研究結果的驗證提供了便利;大數據除具有巨量歷史數據外,還有不同地域環境的巨量即時數據,這使循證決策更具應用價值和時效性。大數據將首先改變醫學數據的采集方式。大數據的形成往往依靠自動采集技術,隨著可佩戴監測設備如iWatch等的出現,醫學數據的采集及積累速度將出現爆炸性的增長。以往的數據同大數據相比,如同滄海之一粟。且以往的數據往往靠手工采集完成,普遍存在稀缺、偏倚、可靠、及時、公正等問題,這樣采集的證據必然會影響醫學研究的結論。基于手工證據進行決策,其結論未必準確及時公正可靠。醫療大數據不間斷地在不同地點同時采集,不僅包含歷史數據以及即時數據,甚至還可能包含未來需求信息,例如,ogle就是通過人們對感冒藥品的搜索來預測流感的。大數據的出現將改變醫學數據的管理方式。在網絡數字化高度發達的今天,盡管已經出現了電子病歷,但紙張病歷在數據管理中仍然重要。然而,紙張病歷有其固有缺陷,如容易破損或丟失、整理歸檔的周期過長、借閱的時間成本極高、研究采樣的工作量巨大等等。伴隨大數據出現的數據融合技術能將不同醫院的電子病歷整合在一起,并同可佩戴健康監測設備的數據及時集成,大大減少了電子病歷的整理、借閱和數據采集時間,這不僅對病人的疾病診斷和預警監控更加有利,同時也對醫生的臨床及醫學研究更有幫助。通過語音和可視眼鏡等現代化的數據瀏覽設備,醫生在查房間隙就能獲知下一病人既往病情,從而能大大減少醫生的勞動強度,使醫生有更多時間治療病人,有更多的時間進行醫學研究。
大數據的出現將改變醫學數據的分析方式。以往在收集樣本數據以后,通常使用SAS或SPSS等軟件,對采集的數據進行統計分析,發現相關病因或建立決策模型。這些軟件受計算能力及內存容量的限制,只能處理樣本量不大的數據,并且處理的數據維數有限,例如,SPSS不能超過40維,而醫療大數據的維數成千上萬。通過手工或統計軟件的計算方法,將無法滿足醫療大數據的分析需要。
當維數超過30個致病因素時,可能要考慮230種因素組合,普通統計軟件已無法計算和處理,必須依靠內存及速度“無限”的云計算。必須研究與開發基于大數據和云計算的分析與挖掘技術如深度學習技術,使其能夠自動完成高維病因數據的分析與主要病因的提取。總之,醫療大數據的采集、整合、分析、處理、研究完全靠人工完成已極其困難,沒有利用云計算的統計分析軟件也難于完成醫療大數據的分析和處理。在大數據時代,必須借助深度學習等技術完成醫療大數據的分析和挖掘。雖然醫療大數據能夠彌補數據樣本的不足和不公,但只有借助更為先進的分析工具和軟件,才能為循證醫學帶來進一步的變革和發展。
3大數據對循證醫學的變革
證據制作是循證醫學的核心,證據能為醫生的診治提供參照,因此,循證醫學得到了快速發展。但是,矛盾、偏頗、過時的證據也使循證醫學備受質疑。首先是證據及其結論存在大量的矛盾,使人們對循證醫治的結果產生懷疑;其次是證據偏頗使其成為利益代言人的工具;其三是證據時過境遷使醫治達不到預期效果。而醫療大數據的出現恰好能夠彌補以往證據采集與制作的不足。首先,醫療大數據使證據的稀缺問題得到解決;其次,隨大數據廣泛匯集的醫生及病人評價,可有效避免證據成為利益代言人的工具;其三,可穿戴等自動采集設備可保證證據的時效性。這將有助于循證醫學同中醫的結合。中醫的治療過程通常比西醫長,其證據采集及療效評估存在很大問題,而隨著可穿戴健康監測設備等技術的發展,長期持續采集治療證據及療效將不再困難,從而有助于循證醫學在中醫等領域發展壯大。此外,隨大數據興起的先進數據分析與挖掘技術,將對循證醫學起到巨大的推進作用。臨床決策分析評價是確定循證治療方案的關鍵步驟,現有的決策分析評價模型包括決策樹、Markov過程等一系列模型,這些模型在面臨高維大數據時力不從心,難于繼續提供較高的決策精度,使醫生對醫治方案是否有效失去信心。隨著大數據深度學習技術的出現,病因的分析和提取已完全自動化,且大大降低了建立決策分析模型的工作量,提高了治療方案的決策精度。對于任何疾病診治方案,考慮的疾病致病因素越多,即證據或特征維數越多,得到的參考信息就越多,診治的準確性就會相應提高。但是,醫生在遇到大量高維的證據數據時,往往面臨從中選擇少數有效證據的難題。例如,假定要考慮30個致病因素或檢驗指標,建立決策模型就要考慮230種因素組合,從中篩選一個最優因素組合作為模型輸入的工作量是巨大的。因此,要得到由若干最優證據構建的最佳決策分析模型,醫生們所投入的研究精力可想而知。
篩選最優因素組合是醫生們最費精力的工作,目前這項工作可以被深度學習自動完成了。深度學習最早由Hinton等人在2006年提出,它是一種無監督的特征學習和提取技術,它通過低層特征的組合構建更加抽象的高層特征。2012年,Lecun等人利用卷積神經網絡真正實現了高效的多層深度學習。傳統的神經網絡學習只有單向認知過程,通常只包含一個隱含層,因層數較少而被稱為淺層學習。深度學習則包含認知和生成兩個過程,并且每個過程都包含多個隱含層,其模型的總體框架如圖1的虛框部分所示。如圖1所示,深度學習的“輸入層”可以理解為各種致病因素以及各種檢查化驗結果,例如遺傳環境因素以及肝功全套指標等;自底向上的箭頭表示認知過程,自頂向下的箭頭表示生成過程,即深度學習由兩個互逆的過程構成;認知權重向量WnT和生成權重向量Wn表示深度模型的知識。原始“輸入層”經“隱含層H0”認知得到輸出,輸出又經“隱含層h0”生成得到新“輸入層”,如果原始“輸入層”和生成的“輸入層”完全一致,則說明認知產生的輸出是完全正確的。根據信息論的有關理論,學是會產生損失,新舊輸入不可能完全一致。因此,只要兩者近乎一致就可以了。認知和生成權重同隱含層的每個輸出相關聯,wake-sleep深度學習算法用于雙向調節權重:(1)利用下層輸入和認知權重向量WiT產生輸出表示,然后使用梯度下降法調節生成權重向量Wi;(2)利用輸出表示和生成權重向量Wi產生輸入表示,然后使用梯度下降法調節認知權重向量WiT。通過逐層學習最終得到頂層的認知和生成權重向量WnT、Wn。在深度學習完成后,如果要建立決策分析模型,只需將頂層輸出即自動提取的特征,作為分類模型如支持向量機的輸入,并用類別標記如肝硬化分級訓練支持向量機,就可以得到用于決策分析的精確分類模型,分類模型如圖1的虛框外部所示。2014年,香港中文大學湯曉鷗教授領導計算機視覺研究組(mmlab.ie.cuhk.edu.hk),開發了一個名為DeepID的深度學習模型,在LFW數據庫上識別5749個人臉的準確率已達99.15%,其精細和準確程度已經超過了人眼和大腦。醫療大數據及深度學習必將為循證醫學帶來一場新的革命。不僅數據缺失、偏頗以及過時等問題會被迎刃而解,而且證據收集、制作以及診治方案的決策都將會自動化,這將擴大循證醫學在所有領域包括中醫等領域的應用范圍,大大降低醫生在證據制作、治療方案決策與療效評估等方面所付出的精力,推動循證醫學向更深更廣更加現代化的方向發展。
4總結
醫療大數據帶來的變革將是全方位的,它不僅為醫學研究和證據制作帶來便利,同時也將促進中醫等替代和補充醫學的發展。作為大數據采集的一項關鍵技術——便攜式/可佩戴健康數據自動采集技術,將大大提高醫療數據采集以及證據制作的效率,解決中醫等療效數據需要長期采集觀測的難題,彌補循證醫學存在的證據偏頗、不公、過時等缺陷,促進循證醫學更加客觀、公正、可靠地在臨床治療中應用。在循證醫學的證據評估以及利用方面,伴隨大數據出現的云計算能夠提高證據分析與處理的效率,大大節省醫生臨床應用和醫學研究所需要花費的時間;面向大數據的深度學習能夠從浩瀚的高維醫療數據中,自動完成疾病致病因素及環境因素等的篩選與提取工作,并能建立精度遠遠超過人腦的決策分析模型,從而大大提升醫生建立和應用循證治療方案的信心,有助于循證醫學被各科醫生更加廣泛地接受和應用。盡管深度模型包含更多的隱含層,其學習時間要遠遠長于淺層學習,但兩種模型的決策時間相差不大,因此,這并不妨害深度模型的有效應用。特別值得一提的是,深度學習將證據提取與決策分析兩個過程合二為一,大大降低了醫生在臨床及醫學研究中應用循證醫學的勞動強度。基于大數據、云計算和深度學習的循證醫學,由于能夠降低勞動強度、提升工作效率、提高決策精度,因而將具有更加廣闊的應用前景和發展方向。
5展望
大數據和云計算時代的到來,將推進循證醫學的研究和發展,并為其提供深度學習等先進手段。醫療大數據將不再稀少、偏頗、過時以及不公,將避免循證醫學成為利益代言人的工具;便攜式/可佩戴健康設備作為大數據自動采集數據的工具,將有助于解決循證醫學證據采集的難題,促進循證醫學在包括中醫在內的更廣領域推廣應用;自動整理大數據的數據融合技術、以及自動提取證據并建立決策模型的深度學習技術,將大大提高醫學證據提取及醫治方案決策分析的效率,推動循證醫學被臨床醫生及研究者更加廣泛地接受和應用。總之,大數據/云計算和深度學習將為循證醫學帶來一個嶄新的春天。
大數據論文范文第3篇
1、對大學教育的影響
大學教育是第二次產業革命時為了適應工業所需的大量的技術人員的產物。當今,學生知識的來源不再局限于課堂,不再拘泥于某一個專業,他們可通過互聯網、微信、微博等信息平臺來獲取文本的、圖像的甚至是視頻的各種知識。學生的知識面將比以往的任何朝代更加寬范,對校園以外世界的了解將更加深入。比如現在的在線教育平臺edX和Mooc,上面有世界著名學府的各種課程,包括我國清華和北大的優秀課程。學生只要通過互聯網,就可以接受到名校的教育,在學習過程中,通過鼠標點擊的記錄,可以研究學習者的活動軌跡,發現不同的人對不同的知識點有何不同的反應,用了多少時間,哪些知識點需要重復或強調,哪種陳述方式或學習工具最有效。通過分析這種秩序和規律,在線學習平臺也在逐漸彌補沒有老師面對面交流指導的不足。同時現在的教育平臺還能通過虛擬現實進行實踐輔導。以麻省理工開放的電子電路課程為例,注冊這一門課的人比整個麻省理工所有在世校友總數還多。由此可見,許多學生已經把注意力放到了課堂之外。
2、如何積極應對
對于學校:在學生從課堂走到互聯網時,未來的學校存在的意義在哪兒,是學校更應該關注與關心的。學生可以在宿舍甚至在家就完成了各種課程的學習和同學之間的交流,那么對學生的考核和效果的評定也不再局限于某一個固定場所來進行。學校更應該重視圖書館電子資源的建設和開放,更應該重視實踐實驗室的建設,提供更多方便學生來進行實習和實踐訓練的場所和項目。對于教師:在大數據時代,教師的教與授又該體現在哪兒呢?我們更應該深刻思考,改變傳統的課堂教學的思維模式。我們可以將教的過程放在網絡平臺上,放在課前來進行,課堂中以學生做作業、教師指導和答疑為目的。這只是改變了傳統的教學模式,對于教師自身我們又該如何作呢?在面對豐繁復雜龐大的數據時,我們應積極跟進發展自我,重新進行定位。一類應加強自己的實踐操作能力,專業從事實踐輔導和教學;另外一類專業從事研究;另外一類抓住大數據所給予的機遇,發展自己,跟上時代步伐,成為專業化極強的教師,對專業進行解惑和學習方向的指導。對于學生:知識和信息量極大豐富,我們如何從中甄別出有利于自己的知識,對自己進行特色化的教育,需要自己的判斷力和教師、家長的指導。我們要關于利用已有的學習平臺和學習媒介,不斷提高自己的自學能力,發展自己的創造性和創新性的能力。
二、小結
大數據和大數據時代,數據量的指數級的增長,給我們帶來了無限的機遇,同時信息的準確和真實性也是需要我們不斷地發掘方法和技術進行改進的。高等學校的教師和學生如何應對這個新的時代,跟上時代的步伐是我們每一個都應該深思的問題。
大數據論文范文第4篇
(一)反饋信息電子化物流信息化、電子化是電子商務物流的基本要求,是以電子計算機為主、以各種電子設備為輔助工具的物流信息形成、傳遞、儲存的管理方式,不同于計算機誕生之前物流信息反饋主要通過書面、口頭形式進行傳遞和儲存。物流信息作為企業信息化的重要組成部分,物流信息電子化減少了企業組織的差旅費用、提高了工作效率、降低了勞動強度、減少了污染和擁擠等等。但是,電子化的信息出現了泛濫、甄別困難等問題,同時計算設備的損壞可能導致大量信息的損失等。在電子商務時代,要提供最佳的服務,物流系統必須要有良好的信息處理和傳輸系統。
(二)反饋內容全面化云計算的出現,為處理大量不規則的“非結構數據”提供了技術方法。以云計算為基礎的物流技術,可以便宜而有效地將物流活動中大量、全面、多變的數據內容存儲下來,并隨時進行分析和計算。這些技術主要有數據采集技術、數據存儲技術、數據交換技術、數據處理技術等。采集技術有傳感器、掃描儀等,在物流中移動數據采集器(MDE)經常用于對倉庫庫存的盤點或者貨架上預訂數據采集,該技術在運輸部門或者外部服務也有重要的價值。另外,電子數據載體如芯片、程序化數據載體(PDP)、移動數據存儲器(MDS)及衛星接收發送裝置,可以超越數米的距離進行讀取、編輯和存儲;電子數據交換(EDI)可以節省時間、提高質量和降低成本。物流信息技術是物流現代化的重要標志。
(三)反饋速度迅捷化電商物流服務業不同于傳統物流服務業,快速反應是電商物流企業的核心競爭力。電子商務物流重在提供及時的服務、信息和決策反饋。目前,在大型的配送公司里,ECR和JIT系統使得顧客化服務得以快速響應。ECR即有效客戶信息反饋,據此可做到客戶要什么就生產什么,而不是生產出東西等顧客來買。物流企業快速反應的影響因素主要有信息系統、顧客服務、時間管理、成本控制、物流硬件、協調控制和物流人才等。
(四)反饋信息社會化在我國,企業甚至是上市公司信息披露不足,而數據、信息共享是電商時代的趨勢和必然。因此,如何建立信息處理系統,及時獲得必要的信息,對電子商務物流企業來講,是個時代的考驗,更是個難題。在將來的物流系統中,“24小時送達”成為物流配送的極致追求,搭建社會化物流平臺成為電商企業共同的事業。阿里巴巴從2011年開始規劃的天網地網,就是要做一個信息平臺,向物流合作伙伴開放相關信息接口以分享數據。數據服務是阿里巴巴物流戰略核心,更是未來大物流系統的支撐。未來物流系統的輸出內容———信息,可以當作獨立的商品或者作為商品成分進行出售。
二、電子商務物流服務業的反饋機理
反饋是大數據時代物流組織受社會需求推動,為了滿足企業和消費者的個性化需求,運用收集、存儲和融合信息的技術方法,引發的以數據化為核心的物流管理變革。隨著互聯網在經濟與社會活動中的廣泛滲透,將電子商務物流產業發展推向新的高度,其發展日益受到政府、企業、消費者和環保主義者的廣泛關注。企業和消費者的滿意度,取決于快速響應的物流管理系統。
(一)電子商務物流服務流程電子商務物流服務流程,可以用圖直觀表示,通過流程圖可以窺見電子商務物流的反饋流程和反饋形式。圖1融合了B2B、B2C、C2C交易的物流服務流程,不同的電子商務模式交易特點不同,但都具備總物流量大、服務范圍廣的特點,服務內容和服務特點基本相同,物流服務一般都采用第三方物流。B2B和B2C電子商務物流關鍵在遠程運輸,而C2C的關注點在末端配送。
(二)電子商務物流反饋內容電子商務物流服務內容涵蓋了訂單管理和數據分析、倉儲與分揀、運輸配送與交付、逆向物流服務、回收物流服務和客戶服務。可以講,電子商務物流服務內容有多廣,物流系統反饋的信息內容就有多豐富。物流系統會對顧客提交的訂單相關數據進行分析,透過分析報告可以幫助制造商以及經銷商及時了解市場,便于隨時調整市場推廣方法;電子商務物流系統可以對倉儲和分揀中心進行監測,提供有效的庫存管理信息,使制造商或者經銷商保持合理的庫存;電子商務物流系統通過網絡將供應鏈節點信息進行集成、整合,將實物庫存信息化作為虛擬庫存;運輸配送與交付環節,通過融合多種終端技術采集物流信息并進行綜合處理,增強了物流企業對物流配送過程的可控性,消費者則通過互聯網對配送企業和商品“寶貝”信息流動實時狀態了如指掌;電子商務的逆向物流反饋服務關鍵在提高顧客滿意度。當然,隨著環境保護的加強,廢棄物處置問題不斷受到關注,物流系統必須提供回收服務物流服務,這有利于提高物流企業在電子商務市場上的低碳競爭力。追求客戶滿意,挖掘潛在需求是電子商務物流企業不斷創新的動力。
(三)電子商務物流反饋技術物流技術指物流活動中所采用的自然科學與社會科學方面的理論、方法,以及設施、設備裝置與工藝的綜合。而電子商務物流反饋技術,主要指物流服務流程中物資信息的收集、存儲和融合方法。先進的信息融合技術提高了物流系統的信息處理與控制能力,使物流配送信息的交互和處理跨越時空限制,通過終端物流信息反饋與融合,實現信息到實際操作的高速轉換,為物流企業決策層提供信息支持,從而不斷提高物流企業的服務能力。常用的物流信息反饋設備有:各種傳感器、GPS定位設備、射頻識別設備、掃描器等;信息融合方法有:嵌入約束法、證據組合法、人工神經網絡法等;信息傳輸交換技術有:計算機網絡技術、電子數據交換技術等。
三、對大數據時代電子商務物流行業發展的建議
大數據作為信息革命的第二個高潮,為電子商務物流行業的發展提供了廣闊的空間。電子商務物流行業必須樹立并強化數據優化行業的理念,以大數據的眼光,加強大數據研究,為客戶提供更先進、增值性的服務。
(一)樹立并強化大數據理念現代物流的發展趨勢是全球化、信息化、系統化、標準化和多功能化,而數據化則是現代物流的核心。當前電子商務物流體系雖然在業務經營中加強了對數據的分析和應用,但缺乏對大數據應用的戰略性思考和主動挖掘意識。信息采集較多,但深度加工挖掘較少,導致大量的數據信息成為“睡眠數據”而不能發揮其應有的價值。客戶細分不夠精準,沒有在業務營銷和客戶關系管理活動中運用科學模型,缺乏對客戶服務需求的偏好判斷和消費行為習慣的細分。在大數據時代電子商務物流的發展必須要有效整合大量的數據,通過各種分析模型,將數據轉化為信息資源,只有這樣才能將大數據作為戰略性資產,為行業管理和決策提供強有力依據。
(二)開拓新的數據服務市場目前,電商業、物流業的發展呈現跨界競爭,電子商務企業進軍物流行業,物流企業開發電子商務,行業間呈現交叉融合發展。當大家的目光還停留在究竟是做電商賺錢還是搞物流賺錢時,我們可將大數據看成一個大市場,聯合電商業、物流業、銀行業乃至通訊業合作,通過各大行業間的數據存儲、加工、分析、融合,形成大數據產品,提供大數據服務,開辟數據服務市場。
(三)構建大數據物流體系構建大數據物流體系,就是電子商務企業和物流行業都要樹立數據觀念,從經營管理理念上重視大數據,在人才隊伍建設上吸納數據分析人才,從供應鏈條上強化數據信息的收集、存儲和處理技術,對物流、商流、信息流、資金流進行計劃和控制,也就是采用信息數據處理和融合技術對電子商務物流服務進行優化整合,打造準確及時精細的高端物流服務體系。
大數據論文范文第5篇
(一)物流配送的服務水平直接影響著電商的服務水平作為電子商務的末端環節,物流配送是電子商務里面唯一面對面接近消費者的環節,在消費者看來,無論物流企業是否是電商本身,物流企業的服務水平都代表了電商的服務水平。京東商城作為電商里面的佼佼者,得到了消費者的普遍認可,其高效的配送起到了至關重要的作用。凡客誠品的如風達,也曾經給凡客帶來了比較高的顧客認可度。
(二)良好的物流配送能夠增加電商的顧客忠誠度隨著電子商務的發展,人們的信息化水平已經遠遠超過了過去,獲取信息的渠道也更加的多樣化,與之相對應的是,消費者的忠誠度也大大降低,消費者可能今天鐘情于這個網站,明天又會認可那個網站。能夠在消費者的的心目中形成良好的品牌效用,穩定有效的物流配送極其重要。
(三)物流配送的成本直接影響了電商的盈利狀況中國目前的電商發展勢頭良好,雙11每年的數據刷新都讓人眼前一亮,這樣的數字在一定程度上反映了消費者的消費理念已經發生了巨大的變化,以前是在網下買東西,現在是網上網下對比著賣東西。但是,在這樣良好的勢頭下,有一個問題也引起了人們的思考,就是電商的盈利問題。物流配送是電子商務的瓶頸,指的不僅僅是物流配送的速度約束著電子商務實現的速度,還指的是物流配送的成本是傳統商務所沒有的,電商的競爭優勢很大是由于價格優勢,而如果包郵以后依然有這樣的優勢,電商的利潤究竟在哪里?數據對物流從產生了巨大的沖擊,迫使電商物流迅速的適應信息化和數據化的浪潮,同時,也給電商物流配送帶來了巨大的機會,將其配送過程中產生的大量數據整合,用于配送計劃的安排、電商服務的優化,更好的為賣家和賣家服務。
二、大數據時代電子商務物流配送存在的問題
雖然電子商務物流配送已經成為電商的重要利潤源泉,也成為一些大型的B2C商家的主要盈利點之一,京東商城就將自己的物流配送優勢作為自己的主要競爭優勢之一[2],但是電子商務物流依然存在著一些的問題,主要有以下幾個方面:
(一)相比于電子商務的發展,物流配送的發展依然滯后。電子商務主要包含信息流、資金流和物流。其中信息流和資金流在點擊之間就可以實現,不受時間和空間的限制,物流就受到時間和空間的限制。隨著物流信息化和網絡化的發展,現在物流已經有了很大的進步,近幾年的發展也可以用日新月異來形容,但是相對于電子商務的發展來說,物流的發展還是相對滯后。
(二)分散的物流配送造成了社會資源的重復配置,物流企業競爭力低下。我們國家2014年的第三方物流企業數目眾多,但是,大多數是中小型物流企業,競爭優勢不明顯。2014年,天貓在B2C領域的市場份額為57%,第二位的京東為21%,二者就占到了B2C的78%。但是在物流領域,民營快遞前十名的市場分額占到了80%。大部分物流企業小而分散,網點重復建設,浪費了大量的社會資源。
(三)O2O的發展對電商的配送水平提出了更高的要求。隨著移動商務的發展,O2O成為電商發展的必爭之地,但是,O2O對配送的要求更高的迅速、快捷、準確。某配送小區提出了線上線下一體化、閃配(60分鐘配送)、增值服務(代收、代繳)的服務理念,這些理念對配送提出了更高的要求,如何均衡配送的成本和服務,成為O2O電子商務發展的一個重要課題。該圖表來源于物流沙龍通過上述圖表我們可以看到,O2O的配送成本是非常高的,假設平均每單的價格為50元,利潤率為30%,則利潤為15元,扣除配送成本11.25元,利潤變為3.25元,利潤率變為6.5%。由此可見,配送導致了利潤率的降低。4、大數據本身對電商物流配送造成了更大的沖擊。大量數據的歸集和挖掘使電商物流配送越來越透明,電子商務企業對于物流的要求也越來越高,這樣就迫使物流配送企業競爭更加激烈,并且有傳統的價格競爭向更高的服務層次的競爭轉化。
三、電子商務與物流配送的發展的新特點
國務院2014年9月12日印發的《物流業中長期規劃(2014-2020年)》中指出,物流行業的重點工程之一就是電子商務物流工程,建成一批區域性倉儲配送基地,吸引制造商、電商、快遞和零擔物流公司、第三方服務公司入駐,提高物流配送效率和專業化服務水平。[3]隨著電子商務的飛速發展,信息化對各行各業的影響越來越顯著。作為與電子商務有著親密接觸的物流業,更是受到信息化和網絡化的深刻影響,不能適應信息化的物流配送企業幾乎不能在大數據時代的競爭中獲得一席之地。電子商務和物流配送的關系也隨著時代的發展表現出了很多新的特點,主要由以下幾個方面:
(一)物流配送企業自身的網絡化、信息化。物流企業不同于生產企業,其業務不僅僅局限于本地,因此,通過傳統的口碑、人脈宣傳是遠遠不夠的,隨著網絡化的發展,物流的宣傳也必須通過網絡來進行,物流企業大部分都建立了自己的官網,來宣傳自己的企業。物流配送設計的面比較廣,一個物流配送企業在各地有多個倉庫,如何實現倉庫之間的合理調配、倉庫內部的有效管理、運輸過程的快速準確,僅僅通過傳統的管理方式是遠遠不夠的,目前,有很多的管理系統的出現應用于物流企業。TMS、WMS、LMS、SCM、CRM、OA都是信息化與物流相結合的產物,提高了物流配送的效率,更好的提高了物流配送的服務水平。隨著移動商務的發展,物流APP也逐漸投入使用,很多的物流APP開始應用于運輸領域和配送領域,豐富了物流配送的形式。2014年5月起,越來越多的快遞面單變成熱敏標簽面單,新面單是由菜鳥網絡聯合各快遞企業共同成立的“電子面臺”出品。這種電子面單面向60多款主流配送軟件,使用軟件的可免費使用電子面單,節省了紙張,提高了打印速度,節省了人力資源。電商物流配送的信息化深入到配送的各個環節和領域。
(二)物流資源的共享成為物流發展的必然趨勢。2013年5月28日,阿里旗下天貓、銀泰集團聯合復興集團、富春集團在深圳成立了“菜鳥網絡科技有限公司”,此外,馬云邀請三通一達和順豐加入,這幾家民營快遞各投入了5000萬,占股1%。以上資料顯示,民營快遞正通過自己的方式謀求資源的共享,中國郵政也表示要與阿里巴巴合作,將自己的網點對民營快遞開放。電子商務物流配送企業雖然是競爭關系,但是,在配送的過程中,網點的重復建設大大的耗費了社會資源,也占用了大量的社會資金,各個快遞公司之間實現資源的共享既能夠提高配送的服務水平,也能夠大量的節省資金,降低道路的擁堵程度,提高配送的經濟效益和社會效益。
(三)數據、資源的整合成為大數據時代電商物流配送發展的大勢所趨。[4]隨著物流企業應用大數據的不斷深入,數據被不斷的分析和挖掘,將賣家、賣家、物流企業所有的資訊有效的連接在一起,最終實現資源與數據的有效結合,所有的物流資源在數據的牽引下共同服務于電子商務平臺的賣方和買方,既降低了成本也提高了整個電商配送領域的服務水平。舉例說明,當客戶選擇所想要的快遞組合類型后,大數據平臺會根據以往的快遞公司的表現、各個分段的報價、即時運力資源情況、該流向的即時件量等信息,甚至可以加上天氣預測、交通預測等數據,進行相關的“大數據”分析,從而得到優化線路選項,以供客戶選擇。之后,系統會將訂單數據發送到各個環節,由相應的物流公司完成。
大數據論文范文第6篇
在大數據時代,優質教育資源共享的主體包括共享的雙方,也就是資源需方和資源供方。隨著時代的發展,優質教育資源的供方不僅包括各級各類學校、教育職能部門、公益組織和科研機構等非營利機構,也可以囊括教育資源提供商,甚至個體也可以成為優質教育資源的供方。要促進優質資源的共享,就要充分發揮互聯網的共享性、平等性、開放性特點,全面拓展優質教育資源供方的來源。優質教育資源的供需雙方并非一成不變的,在大數據時代,要積極促進優質教育資源供需雙方的相互轉化,盡量做到各取所需、各盡其能,使優質教育資源的供需雙方能夠互相交叉和重疊。
二、大數據時代優質教育資源共享的運行系統
要提高優質教育資源共享的效率,促進我國高中教育的不斷發展,就必須重視優質教育資源共享的運行系統建設,要使共享的優質教育資源能夠滿足我國高中教育教學的需要,從而使優質教育資源的利用效率得到提高。
1.優質教育資源共享的建設系統
優質教育資源共享運行系統的第一個環節就是建設系統,進行優質教育資源的匯集和開發工作。建設系統要將教育資源分為非數字化教育資源和數字化教育資源兩種,對于數字化教育資源主要是直接匯集和開發,對于非數字化教育資源還要進行數字化加工和制作,使其符合媒體文件的載體和格式。建設系統還要將已有的教育資源進行匯集和整合,使其匯聚起來,能夠進行推廣、評估和歸類。
2.優質教育資源的傳送系統
傳送系統主要負責傳輸和配送優質的教育資料。例如,可以向特定的目標區域進行優質教育資源的配送,包括少數民族地區、貧困地區等等。也可以通過對口幫扶的形式,使優質教育資源的供需雙方結成對子。在大數據時代,要充分利用先進的社會計算、4G技術、三網融合、寬帶網絡等技術,提升優質教育資源的投入產出比。
3.優質教育資源的使用系統
使用系統要具備相應的硬件設備條件,使資源需方能夠順利獲取教育資源。使用系統還應該具備指導、培訓、高級檢索等功能模塊,使資源需方能夠按照自己的具體需求獲取和檢索優質教育資源。需方也可以對優質教育資源進行再加工,例如,高中學校可以對先進的教育教學理念進行二次加工,使之能夠與自身的教材版本、學情相符合。
4.優質教育資源的評估系統
通過評估系統,可以對優質教育資料的共享效率和共享質量進行切實反饋,對共享進行保障。評估系統先要評估本身的教育資源,從而解決數字化教育資源建設層次較低的問題,將真正有價值的、優質的教育資源挖掘出來。評估系統還要評估教育資源的傳輸配送情況。我國很多地區的地理條件比較惡劣,基礎設施建設薄弱,要確保教育資源能夠按照需方的要求進行傳輸。此外,需方對于優質教育資源的使用情況也應該納入評估系統,并讓需方根據教學活動的需要選擇合適的優質教育資源。在大數據時代,通過信息技術,可以有效地促進高中階段優質教育資源的共享。從社會發展的角度來說,優質教育資源的共享促進了不同地區和學校之間教育資源的交流,有利于我國教育公平的發展和實現。在大數據時代,要進一步發揮信息技術的重要作用,更加深刻和全面地推進優質教育資源的共享。
大數據論文范文第7篇
1.海量信息思維模式
以往人們總是嘗試先發現問題,再獲取相關信息,探索解決之道。而大數據時代,人們總是先盡可能多的去獲取和儲存信息,而信息數據價值密度低、數據量大,當遇到問題時再嘗試解決問題,其解決的效率和精準度率也有所提升。這種“海量信息”的思維在進行服裝流行款式、流行色彩的市場調研時,依然十分適用。
2.新媒體思維模式
信息數據附著在各類新媒體之上,數據格式多種多樣,從網頁論壇、視頻、網絡日志、微博微信、甚至地理位置信息等等。新媒體思維正在改變服裝市場的營銷方式,服裝企業傳統的營銷手段是實體店集中推廣、平面廣告以及電視媒體宣傳,節假期間雇傭大量勞動力街頭派發促銷傳單。而大數據時代,服裝企業充分利用互聯網的植入式廣告、病毒式推廣以及低成本營銷,打造網絡交易平臺,全方位收集消費者信息數據,分析消費者潛在消費動機與偏好,從而在推廣品牌的同時擴大銷售量。
二、大數據時代對高校服裝設計教育的啟示
1.教學方式的變革
隨著筆記本電腦、平板電腦逐步進入課堂,教材、教學活動不斷被數字化,教育方法應以更豐富多彩的形式融入課堂。網絡教學和討論方式也是大數字時代課堂經常采用的一種教學方式。以服裝設計課程為例,在服裝風格與流派章節學習中,鼓勵學生利用網絡資源,進行相關文獻查閱,了解不同歷史時期服裝風格的含義與表現,以演示文檔的形式進行小組討論,并設計“最受歡迎的大學生潮流服飾搭配”問卷進行市場調研,感受數據的多樣性以及數據分析方法。
2.課程知識點的設置
“因材施教”的理念在班級授課制中開展有著相當的難度,在有限的教學時間和教學空間內,教師對學生的“材”無法充分的了解和引導。在大數據時代,教師可以對每個學生學習數據進行分析,將學生的整個學習過程數字化,例如知識點可以被數字化并與測試題建立聯系,測試題中每道題的完成時間、錯題數等都以數據的方式記錄。計算機通過錯題分析出每個學生對各章節知識點的掌握程度,從而從根本上落實“因材施教”的教育理念。在服裝結構設計類課程中,將知識點與知識點進行組合并設計考核題目,例如人體測量部位與原型版的對照練習,放松量章節的知識點與不同類型板型對應,款式分析與服裝風格分析相關聯,從而建立知識點與測試題的聯系,用相關性思維解決結構類課程中的每一個細節問題。
3.側重對學習過程的評價
隨著筆記本電腦、平板電腦逐步進入課堂,教材、教學活動不斷被數字化,學生學習過程也將逐漸數字化,學生的學習過程更加受到關注,而對于這些數據的分析與利用,將使得每位學生的發展都有據可依。例如,在服裝工藝類課程中,將更注重實驗課程環節的設計與實驗過程考核,根據自學能力、創新能力和動手能力來評定學生的綜合成績。鼓勵學生海量收集學科咨詢,通過自主學習發現問題解決問題,而通過不同考核項目的得分,分析學生的自學能力與學習類型。
三、大數據時代對高校服裝人才培養提出的新要求
1.獲取有效信息數據的能力
互聯網上各類教學視頻、教學文庫林林總總,各類網絡學院、網絡公開課、精品課程應接不暇。高校須引導學生自主學習,加深學生對當今社會變革的理解和認知,使學生具有大數據思維能力和判別能力,能夠在時間學習中利用資源,使數據為專業學習所用。
2.分析數據的能力
要求學生能根據不同的需求,利用有效的問題解決思想和方法論,最終形成有效的數據,并能夠為大多數人使用。利用定量和定型的分析方法,挖掘數據之間的相關性,并形成數據分析報告。該項能力需在服裝專業考察、服裝創新實踐平臺等實踐環節的課程中,得到充分的訓練。
3.團隊的建立和管理
在大數據時代,單憑一己之力無法應對海量的數據,需要以團隊的形式,在共同目標的引導下齊心協力、分工合作,因此要求學生具有很強的團隊意識、良好的溝通能力和完善的團隊管理制度。基于以上大數據背景和啟示,大數據思維模式正在由商業服務領域向教育領域快速蔓延,大數據時代帶給人們主要的思維模式為相關性思維、海量信息思維和新媒體思維,能夠與高校服裝設計教育理念多角度、多層面融合,從而指導服裝設計專業從教學方式、課程知識點設置、考核評分標準等方面做出適應時代的變革。
大數據論文范文第8篇
在橋梁工程中,數據按時間上的劃分可以分為兩類,靜態數據與動態數據。靜態數據主要指橋梁的相關信息資料庫與科學實驗產生的數據。信息資料庫是一種相對靜態數據,因為這些數據資源每過一段時間將更新一次。各國家和各地方政府部門基本建立了橋梁工程資料庫及相關系統,列舉出主要國家和地方政府的橋梁管理系統,包括建成時間、系統功能、與建設部門等。除國家政府部門外,各科研單位也在完善各自的橋梁統計分析系統,系統中主要包括橋梁的橋型、跨徑、材料、建成時間等基本信息,還包括橋梁的病害、橋梁狀況評定等相關內容。橋梁的科學試驗數據主要來源于各大高校和科研單位科學研究中的模型試驗、振動臺試驗、風動實驗、橋梁的荷載試驗等產生的數據。這類數據的有效分析處理形成各類科學研究成果,但是此類數據的開放程度低,造成數據資源的極大浪費。橋梁的動態數據主要來自于橋梁的施工監控和成橋運營階段健康監測系統,此類數據由安裝在橋梁上的實時監測傳感器獲得,包括位移傳感器、速度傳感器、加速度傳感器、應變計、溫度計、風速儀、GPS等。統計了國內部分橋梁健康監測系統的傳感器數量以及安裝時間。各類傳感器配以相關的采集系統來獲得數據信息,再通過相關軟件分析、處理,從而掌握橋梁的實時健康狀況,對橋梁的狀態進行評估與預測。整個橋梁健康監測體系。
2開發橋梁工程領域大數據資源意義
利用橋梁的靜態數據庫,可以了解橋梁的基本信息,為全國的橋梁統計、普查與管理提供信息資源。科研數據的開放有助于學術界的交流、創新,取得更為豐富的科研成果。橋梁動態數據包括施工監控數據與成橋運營階段的監測數據,充分利用與挖掘大數據資源,可以提高橋梁的施工質量、加快施工進度,提前預測和解決施工過程中可能出現的問題,減少質量事故和經濟損失。成橋運營階段的監測數據主要為橋梁的健康狀況評估提供依據,掌握橋梁所處的狀態,分析、處理數據資源,提高預測、分析、解決問題的能力。可為同類橋梁的施工管理與養護等,提供寶貴經驗。同時大數據資源的開放、共享,有助于節約國家資金和社會資源。
3存在問題及解決方法
(1)最先遇到的也是最棘手的問題是數據的去冗、去噪,從海量數據中挖掘大數據資源價值。目前,所列一座特大橋上各類傳感器每天采集的數據達到幾個GB到幾十GB,甚至上百GB,如此海量的數據如何去處理,有效剔除無用的信息,找尋剩余有用的信息,從而產生新的價值、新的資源。這也是在大數據時代有效利用大數據資源要解決的首要問題。解決這一問題的主要途徑是編譯相關的去冗、去噪的智能分析軟件,同時可以利用云計算、云分析、云管理等方法來提高解決這一問題的效率,使大數據變為有用數據,做到真正智能化分析。
(2)現在各政府部門和科研單位,都在做自己的橋梁信息庫以及監測研發數據庫等,而且大多數數據庫都是相類似、重復的。這樣造成資源的極大浪費,包括勞動力、資金等。解決這一問題的有效途徑是加強政府部門、科研單位內部以及之間的相互合作,開放和共享數據資源,這也是大數據時代的必然趨勢。各部門和科研單位可以有步驟、分階段地開放共享各自所擁有的數據資源,不論是采用付費或免費的方式。
(3)由于大數據具有“4V”等特點,在大數據研究的初期階段,大數據的價值還未充分體現時,要儲存、分析、利用大數據資源,需有軟件、硬件等基礎設施的投入,國家和科研單位應提供專項資金的支持,同時國家可制定相關鼓勵支持政策。
(4)在大數據時代成熟以后,應建立相關法規,規范和保護數據的開發利用,制訂相關統一標準,提高數據的使用效率。
4結語
本文首次在橋梁工程領域引入大數據概念,提倡用大數據的觀察事物的方法和思維方式來分析、處理、挖掘早已在橋梁工程中應用的大數據資源。文章首先介紹大數據的概念及特點,和在橋梁工程領域產生的靜態與動態數據的來源。其次、說明充分開發橋梁工程領域大數據資源的重要意義。最后,就目前在橋梁工程應用中存在的問題提出相關解決途徑。
大數據論文范文第9篇
對于新媒體文學意味著什么大數據讓新媒體文學回到“去作者化”的共在混融狀態:在傳統聲音媒介時代,讀者與作者共同創作、修改詩歌;到了紙質媒介時代,作者的地位上升;在新媒體文學時代,讀者可以對作家進行積極主動的反饋,但這種反饋呈現出信息零碎化、評價隨性化以及無法把握所有地域、身份、族裔的不完整狀態;到了大數據時代,新媒體文學借鑒《紙牌屋》的數據挖掘模式,可以對讀者信息進行全數據收集整理,以最大的吸引力呈現一個文本(其中包括一種可能性,即同一個故事開頭,針對不同人群有不同的故事演進和情節,乃至人物設置)。舍恩伯格認為,“大數據是指不用隨機分析法這樣的捷徑,而采用所有數據的方法”,因此,我們分析的大數據其實應該被稱為“全數據”。在網絡新媒體時代,人類所有的網絡行為都可以被數據化,而這些數據又能完全被收集、存儲、交換和分析。人們在不經意之間產生的數據總量大到我們難以想象的程度。“據有關研究報告,2013年中國產生的數據總量超過0.8ZB,相當于2009年全球的數據總量。預計到2020年,中國產生的數據總量將超過8.5ZB,是2013年的10倍,一個大規模生產、分享和應用數據的嶄新時代正在到來。”新媒體文學在發展過程之中當然也生產了大規模的數據,這些數據對新媒體文學意味著什么呢?第一,以PC和移動終端為主要載體的新媒體文學產生巨大的相關信息數據庫,比如新媒體小說閱讀量排行榜、新媒體作家數據庫、讀者閱讀時間和習慣、哪些文學章節被反復閱讀等等。與此同時,因為網絡媒介的公開性和“無門檻”標準,新媒體文學的閱讀者和創作者數量達到了文學史上前所未有的奇跡。2014年,中國網絡文學的讀者已突破5億人,保守估計整體收入突破65億元。這樣大規模的用戶群保證了巨大的數據量,也使文學網站擁有所有與網絡文學相關的數據。網絡文學帶來的巨大經濟效益成為對網絡文學進行大數據分析的資本基礎和動力。作為迄今為止最為強大的分析技術,大數據的重要價值在于預測趨勢,即“正在發生的未來”。通過對這些大數據的分析,內容生產者可以有針對性地將作品推送給受眾,而這種經過精心設計的文學作品恰好就是受眾所需要的。這是因為大數據分析可以采用理想狀態的全數據分析(目前還不能完全達到),而全數據分析由于分析的數據量巨大,單個數據的誤差可以在分母巨大無比的全數據海洋之中被忽略。相反,在數據量有限的時代,我們就只能追求單個數據的精準。“因為收集信息的有限意味著細微的錯誤會被放大,甚至有可能影響整個結果的準確性。”當數據量持續積累增加時,對單個數據的精準性追求不是全數據的方式,放棄精準性、適度接受不精準性,仍然不會影響其結果。這類似于醫用手術無影燈,從各個角度照射對象,永遠不會存在盲區。盛大文學董事長邱文友認為,事實上國內文學網站在10年前就在運用大數據思維了:文學網站上有200多萬名作家,700多萬部作品,怎么在茫茫作家海中找出下一個唐家三少?靠數據分析。此外,在網絡連載過程中,作家跟讀者之間有互動,這些訊息也是數據。“比如作家本想讓甲娶乙,可是絕大部分讀者希望甲娶丙,這時候作家可以選擇,是按原來思路,還是按小說可能延伸的商業價值去改寫結局?所有決策的因素、動機跟方式,也是數據分析。”瑏瑡但是受網絡技術發展的限制,當時新媒體文學的數據挖掘不可能像現在這樣徹底和全面。第二,大數據時代新媒體文學批評走向多元化。當前的新媒體批評既包括傳統精英式的學院派批評,也包括點贊、跟帖式的草根批評;學院派批評以黃鳴奮、歐陽友權為代表,草根批評以崔宰溶為代表。“黃鳴奮和歐陽友權以從西方新媒體技術層面發展出來的超文本理論作為理論生發點,對網絡文學進行后現代性的學理探討。”瑏瑢而崔宰溶認為,對中國網絡文學的研究需要從原著理論(vernaculartheory)和網絡性理論入手,才能真實地對新媒體文學進行研究。新媒體文學的接受者并不會以文化精英式的方式來俯視作品,他們對新媒體文學的批評是純感受性的、本能直觀的和零散局部的。這種自下而上的反叛式文學批評,迥異于傳統精英式的學院批評。對中國新媒體文學的研究必須從網絡的“原著居民”(網絡文學讀者)出發,由于他們大部分時間棲居于網絡之中,因而對新媒體文學具有不受傳統文學理論影響的本性感受力和知識系統。瑏瑣筆者認為,無論是西方網絡文學理論還是原著理論,在大數據時代,它們都會被作為大數據庫中的一個組成部分,再結合“總點擊量”“總推薦”“月排名”等進行分析,從而尋找出讀者最有可能喜歡的作品。無論如何,大數據時代給新媒體文學研究帶來一種新實證研究路徑。米埃爾(Miall)認為,文學的實證研究像灰姑娘一樣總是被人們忽視或反對,早晚會有一天,實證研究將統領整個文化研究領域。人們會通過實證來研究理論觀念,反思文學的本質和文化地位。瑏瑤網絡技術的發達與新媒體文學的繁榮促成了大數據分析對于新媒體文學的數據實證性研究。
二、大數據思維給新媒體文學帶來的理論思考新媒體文學的大數據分析
從學理上帶來三組思考:一是大數據推動了新媒體文學的發展,然而新媒體文學能被徹底數據化嗎?如果不能,那在什么樣的層面上可以被數據化?新媒體文學與大數據思維融合的真正重要意義在何處?二是新媒體文學遭遇大數據思維之后,是否意味著對于新媒體文學的研究可以完全轉換為數據式的實證研究?如果不能,對新媒體文學的研究還有哪些方面是大數據不可能涉及和完成的?三是當我們將文學接受者的大數據作為文學創作的唯一和最高標準之后,新媒體文學在題材選取、形式美學和敘事節奏等方面是否走向絕對迎合讀者的趨勢?如果是的話,新媒體文學作家的意義何在?他們又應該采取迎合還是引領的姿態呢?
第一,新媒體文學活動都發生在網絡之上,因而可以被充分數據化。大數據自產生之日起,就迅速與人類已有的知識和學科產生了極強的關聯,比如醫療健康、交通規劃、公共管理、教育培養等領域都在你看不見的地方悄悄運作著大數據分析。“大數據時代的經濟學、政治學、社會學和許多科學門類都會發生巨大甚至本質的變化和發展,進而影響人類的價值系統、知識體系和生活方式。哲學史上爭論不休的世界可知論和不可知論都將轉變為實證科學中的具體問題。”瑏瑥大數據的此種趨勢根源于它能將所有網絡行為數據化的能力,比如在新媒體文學活動之中,我們可以輕松采集到作家和讀者的數量、年齡層、分布地域、經濟狀況、教育程度、閱讀習慣、題材喜好,等等。除此之外,大數據可以分析:哪種題材的文學受眾最多?同一種題材之中,什么樣的文學橋段讓讀者喜歡?幽默、推理、懸疑還是浪漫?文學作品之中什么樣風格的語言會更受哪種人的喜愛?什么樣的故事情節發展路線和結局是最受人歡迎的?等等。這些方面都可以通過讀者的評論和閱讀數據反饋到內容提供商和文學作家那里,從而對作品進行實時調整。但是,我們不能因為大數據有這樣的效果,就認為新媒體文學可以被完全大數據化。其實,作為技術和藝術合一的新媒體文學在多個維度上是不能被量化的,比如作家的靈魂高度、文學思想的深邃性、文學的意境、文學的美感、文學的終極關懷和文學對人性的探測等都不能被量化,而這些維度恰恰是文學之為文學最核心的內容。不管大數據技術怎么發達,它所追求的絕對客觀性其實在數據產生之初就不存在。數據無論在表面上看起來多么客觀地再現對象情況,它本身其實是在一種具有傾向性和差異性價值觀基礎上被建構的。因而,大數據的生成和分析永遠不可能擺脫自己天生就具有的價值主觀性。我們能看到的數據是研究者有能力或者熱切希望看到的數據,若非如此,即便大量數據生成了,也不能被數據識別系統發現。這就好比雷達效應,你的關注點除了對象之外別無他物,但是“他物們”卻客觀大量地存在于你的意識之外,只不過你無意或不能去抓取它們。所以,大數據不管看起來多么科學客觀,背后其實與主觀價值判斷是分不開的。“大數據”并不等同于“大智慧”,即使占有大量的數據,還必須有對數據具有專業化分析能力的人。Netflix的CEO里德•哈斯廷斯利用數據分析的方法也是受他前期從事碟片租賃服務的啟發。他一方面熟悉在網絡上怎么通過數據分析為別人推薦自己喜歡的電影和電視劇,另一方面他在無數的觀影之中對影片具有極強的審美鑒賞能力。科技和人文的結合讓他具有對《紙牌屋》數據進行采集和分析的能力,這才是Netflix進軍藝術界成功的原因。所以,同樣的大數據在不同主體那里得出的結論或者采取的應用是相距甚遠的。就好比同樣是醫學CT掃描,儀器是相同的,照出的片也是相同的,為什么大家愿意去權威醫院檢查呢?問題的根源在于對CT成像進行分析的醫生水平,同樣的CT成像,在擁有不同經驗的醫生那里得出的結論很可能有天壤之別。大數據作為一種技術在教育、電影、藝術等人文領域廣泛運用已是不爭的事實,除了讓人文領域的成果與經濟效益直接產生關聯之外,它的最重要意義其實是在哲學思維層面。大數據分析使我們拋棄傳統哲學一直追求的現象背后的原因,而轉向為關注事物和事物之間的關系性,即從因果關系轉變為相關關系。瑏瑦這種思維方式轉變是順應時代的實用需求而產生的。一方面,大數據思維不去深究因果關系,而是繞開因果關系,退到因果關系的上層———相關關系(包含因果和非因果關系)。這種擱置因果的選擇更是由于因果關系和相關關系之間復雜的關系:“(1)兩個事物間有因果關系時,這兩個事物間往往會有相關關系;(2)兩個事物間不存在因果關系時,這兩個事物間也可能會有相關關系(虛偽相關關系);(3)兩個事物間有因果關系時,這兩個事物間也有出現零度相關關系的可能(虛偽零度相關關系)。”瑏瑧當略過這些復雜關系,只關注“相關關系———結果預測”,就會省去無數不必要的麻煩,而直接得出需要的答案。“相關關系的核心是量化兩個數據值之間的數理關系。相關關系強是指當一個數據值增加時,其他數據值很有可能也會隨之增加。”瑏瑨2004年,沃爾瑪公司分析顧客消費時的各種數據時,意外察覺到數據和數據之間的相關性:颶風來之前,手電筒和蛋撻都銷量增加,因而超市毫不猶豫地將它們放在颶風用品附近。這個例子就表明在大數據時代,深究原因并不一定能找到答案,而對數據進行相關性分析才是其核心。另一方面,大數據帶來的相關性分析由于技術的成熟變得比因果分析更容易。丹尼爾•卡尼曼(DanielKahneman)甚至認為,人類之所以一直熱衷于因果關系思維,是因為在信息不發達的社會采用因果思維可以快速地作出決定。相反,在那個時代如果采用相關思維會特別費力且不可能有任何結論。大數據由于技術的支撐完全可以支持相關性思維,但我們在現實之中會發現傳統因果思維得出的結論被置于大數據時代后是有問題的。
第二,新媒體文學的學術研究與新媒體文學的大數據研究不能混為一談,二者采用的研究方法不同,而這兩種方法也只有被局限在一定范圍之內才能發揮出自己的長處。19世紀,類似大數據思維的實證主義就已經僭越過文學的領地。當時實證主義提出,表象本身才是具有研究確定性的對象,對象背后所謂的本質是并不存在的。實證主義“反對追求絕對的知識,它停止去探求宇宙的起源和目的,拒絕認識諸現象的原因,只專心致志地去發現這些現象的規律,換言之,去發現各種現象的承續與類似的關系”瑏瑩。實證主義的“只研究怎么樣(how),而不研究為什么(why)”瑐瑠主張與大數據思維追求相關關系而懸置因果關系的方式極為相似。文學雖然作為語言的藝術具有強烈的主觀情感色彩,但是對文學的研究在很大程度上可以采用實證主義的方法,比如對文學流派、文學史、作家時代背景、作品傳播狀況的研究等。實證主義既要有“實”,又要有“證”:從研究對象入手得到大量材料,在此基礎上,還需要進行分析論證的過程,否則材料只是死物。反過來,我們認為實證主義精神只能限定在以上研究領域才是對文學研究有益的。如果實證精神進入文學意義范圍,文學的靈魂、精神和審美只能被理性實證邏輯消解磨滅,最后成為他者的“嫁衣”。從傳統的實證主義對文學的研究經驗可知,任何一種研究方法是不可能包打天下的,對文學研究不同的維度只能用不同的方法。針對新媒體文學的實證主義(大數據思維),只能研究新媒體文學的,即對新媒體文學的傳播效果進行分析,預測新媒體文學會怎么樣,提供什么樣的文學作品其傳播力更強等。然而,對新媒體文學研究本身就不能是技術式的,而應該是美學式的。在具體研究方法上,新媒體文學與傳統文學走的是不同的理論路線。但就其藝術品格來說,文學應該研究的依然逃不脫深層的價值審視:從感官刺激的表層能否將讀者引向一般生活狀況,如生死、戰爭、世俗、宗教等,進而感受人類的終極意義和終極關懷。即使新媒體文學從表征上帶有后現代的去中心、平面化和反經典的傾向,但我們還是堅信好的文學與人性追求是同一的,狂歡式的淺薄帶來的是“娛樂至死”的悲哀。
第三,大數據思維帶來的新媒體文學審美形態是不是對大眾的迎合呢?純粹的迎合帶來的是否只是新媒體文學短時期虛假的繁榮?眾多網絡之中是否有一批逆潮流而上的引領美學品味的真正意義上的作家呢?如果只是一味迎合大眾趣味,以大數據的反饋作為依據,新媒體文學到一定階段完全可以通過技術手段調整寫作的內容和風格,這樣作家就成了讀者們意見的平衡機制,這樣的新媒體文學家沒有太大的存在必要。我們可以設想一種狀況:一部小說,作家只需要給一個開頭,后來的情節發展完全通過數據匯聚網民的意見和傾向進行延伸,最后,小說成為讀者們合力形成的整體,這樣的小說(姑且稱其為小說)就是優秀的文學作品嗎?真正偉大的作家并不迎合當下的惡俗狀況,而是寫出深刻的作品,慢慢培養讀者的審美趣味,讓我們真正感受文學的意義、領悟存在的價值、思考人生的真諦。就像史蒂夫•喬布斯做蘋果手機一樣,他堅持認為不用考慮消費者的興趣,你需要做的是培養和引領審美。兩種不同的文學態度使得對文學具有深入思考的作家陷入兩難境地:迎合還是引領讀者和市場?迎合讀者型的新媒體文學只需要通過大數據分析帶給讀者們娛樂風格的作品,這種作品只需要考慮文字故事如何帶來感官的愉快,讀者怎么舒服怎么寫。引領型的新媒體文學有一個共同特征———“反淺薄”,文學作品需要讀者理解力的參與和感受力的調動,從作品之中讀到的除了“文之悅”之外,還有深邃的心靈和精神層面的內容。新媒體文學植根于眾生喧嘩的網絡媒介之中,但是我們不能據此將新媒體文學必然地視為通俗藝術。新媒體文學不一定必須提供短暫的、不能激發任何智性思考和審美挑戰的作品。在新媒體之中不可能存在可以吸引所有讀者的文學作品,因為這就是新媒體的性質:作家創作風格的多元存在和讀者審美興趣的散點式分布。也就是說,新媒體文學的審美情趣和屬性不是由它所寓居的媒介來決定的,而是由作家自己的選擇決定的。網絡媒介帶給人表達的自由和平等,從而帶來大眾極大的參與興趣和閱讀快樂,其中不乏并未獲得話語權的精英作家。所以,新媒體文學應該生長在一個包容性極強的場域之中,否則,引領文流的作家就不可能擁有寬松的成長環境。但是,如果我們單純用技術方式來衡量藝術,藝術將會走向媚俗的商業邏輯道路,而優秀的藝術因其表征具有長期性會被戴著大眾文化眼鏡的數據技術過濾掉,剩下的只是眾生喧嘩的靡靡之音。
本文鏈接:http://www.svtrjb.com/v-141-2194.html大數據論文范文10篇
相關文章:
敬老愛老黑板報內容10-19
護理創新論文范文10篇08-15
愛情哲理語錄11-05
五年級班主任下學期工作計劃10-22
應屆畢業生工作總結(4篇)09-27
最新電商年終個人工作總結 電商年終工作總結(三篇)08-09
簡單的員工離職證明09-07
假如給我三天光明讀書心得10-24
電力系統實訓心得09-18
一件小事小學作文12-24
《讓世界充滿愛》觀后感11-19
一個令我敬佩的人優秀作文11-04
最新我的媽媽三年級作文150字09-28
西安醫藥科技職業學院學費多少10-28