科技信息論文范文第1篇
關(guān)鍵詞:信息論;研究生教學;教學改革
中圖分類號:G643 文獻標志碼:A 文章編號:1674-9324(2016)06-0131-02
《信息論》是本校電子科學與工程學院電路與系統(tǒng)專業(yè)碩士研究生(學術(shù)型)的專業(yè)必修理論課程,也是一般高等院校通信與信息工程、計算機科學與技術(shù)、電子科學與技術(shù)等一級學科下相關(guān)專業(yè)的本科生、研究生的主修專業(yè)課程[1-5]。通過對本課程的學習,使學生掌握有關(guān)信息論的基本理論以及編碼的理論、實現(xiàn)原理和具體應用。雖然人們在本科生的《信息論》教學改革方面做了一定的工作[6-9],但其改革內(nèi)容不符合電路與系統(tǒng)學科特點,更不符合研究生教學需要。筆者結(jié)合本學院學生基礎(chǔ)、學校政策及本人近年來的教學實踐,在學校研究生教學改革項目支持下,開展了本門課程的教學改革與實踐。
一、課程特點
1.需要堅實的數(shù)學基礎(chǔ)。該課程存在大量的公式推導與證明,與概率論、隨機過程、近世代數(shù)等數(shù)學知識密切相關(guān)。若無扎實的數(shù)學基礎(chǔ),學生無法看懂推導過程,更無法從根本上理解信息論的數(shù)學意義及物理含義。
2.學生學習興趣不高。由于電子專業(yè)碩士研究生的數(shù)學基礎(chǔ)僅限于本科生學過的概率論與隨機過程,對近世代數(shù)的了解幾乎為零。學生面對繁雜、抽象的理論問題時,無法宏觀地理解和把握,致使學生無法提高學習興趣。
3.課程聯(lián)系實際困難。課程抽象概念多、定理證明多,與實際應用有一定距離,且與其他課程聯(lián)系較少。多數(shù)學生在學習過程中覺得內(nèi)容枯燥、難度大,而且與將來就業(yè)方向聯(lián)系較少。
鑒于以上問題,為了激發(fā)學生學習的積極性和主動性,促進學生更好地掌握本門課程,筆者從課程的教學內(nèi)容、教學方法與考核方式三方面入手,提出了教學改革的相應措施。
二、教學內(nèi)容改革――三個強化
1.強化離散信息論的基礎(chǔ)作用。信息論的主要內(nèi)容是信源概念、信息度量方式及三個香農(nóng)基本定理,相應的內(nèi)容又分別面向連續(xù)信源與離散信源。二者的區(qū)別在于,連續(xù)信源/信道及相應的定理一般需要結(jié)合隨機過程知識來學習,而離散信源/信道及相應的定理是建立在概率論、線性代數(shù)的基礎(chǔ)上。從推導過程和公式形式來看,二者具有內(nèi)在的統(tǒng)一性。這可從連續(xù)信源信息熵的推導過程看出:將連續(xù)信源進行離散化,變?yōu)殡x散信源后再利用離散信源信息熵的求解公式并求解極限得到。因此筆者重點強化了對離散信源、離散信道及其容量、無失真信源編碼定理、無失真的信源編碼的內(nèi)容。這對學生進一步掌握連續(xù)信源、信道及相關(guān)問題奠定了基礎(chǔ)。
2.強化信息論的現(xiàn)實物理意義。筆者從課程本源出發(fā),讓學生理解公式或定理蘊含的深刻物理含義,使理論結(jié)果可視化,概念直觀化。例如,在講解離散信源的極值性定理時,可提煉出如下物理含義:第一層含義是,當信源各取值的概率相等時,人們對信源取何值的不確定性最大,由于各信源服從等概率分布,信源的平均不確定性即為各事件的不確定性,因此信息熵也越大;第二層含義是,對于具有不同數(shù)量事件的兩個信源,若二者同時滿足等概率分布,則預測數(shù)量較多事件的信源的難度較大,因此該信源的信息熵也較大。
3.強化教學案例的實用性。在本次教學改革中,共自創(chuàng)或搜集教學案例11例,每個教學案例都與教材內(nèi)容有關(guān),將晦澀難懂的理論內(nèi)容變?yōu)轷r活的例子,讓學生去感受和體會案例中蘊含的問題,從而為更好地理解教學內(nèi)容奠定基礎(chǔ)。以引入的六個視頻教學案例為例,該案例以美國國家航天局發(fā)射的新火星探測器為背景,講解了信息如何傳播、如何加密等問題。通過這部分教學案例的學習,學生深刻地認識到了信息論的價值與實踐意義。
三、教學方法改革――三個聯(lián)系
1.聯(lián)系計算機仿真。筆者鼓勵學生應用MATLAB中SIMULINK工具設(shè)計具體的通信系統(tǒng)模型,如基于開關(guān)鍵控或正交頻分復用的射頻通信系統(tǒng)。讓學生看到實驗現(xiàn)象的同時,更加深刻地體會信息的傳遞過程,了解信源、信宿、信道的構(gòu)成,學習信源編碼、信道編碼、加密、信道譯碼、信源譯碼等信息處理過程,加強學生對信道容量、信息傳輸速率、誤碼率等概念的把握。筆者督促學生將上述問題作為課程設(shè)計的作業(yè),使其結(jié)合信息論所學的知識,提煉出相關(guān)問題、建立模型,加以認真分析解決;再將提煉問題和解決問題的過程以及結(jié)論進行匯總,撰寫成研究報告。這既鞏固了學生的基礎(chǔ)知識,又鍛煉了學生運用計算機進行建模和仿真的能力。
2.聯(lián)系工程實際。由于研究生日常的工作大多在實驗室從事工程項目的研究或開發(fā)工作,若能將這些工作與信息論知識聯(lián)系到一起,無論對信息論的學習還是科研都將起到促進作用。筆者首先開展了調(diào)查研究工作,統(tǒng)計了各個學生從事科研項目的情況,然后讓學生結(jié)合課程知識,從信息獲取、處理、傳輸、存儲的角度去解釋。例如,在講述信息不增性原理時,筆者結(jié)合溫度傳感器的設(shè)計問題:將大氣環(huán)境溫度看成連續(xù)信源,將傳感器系統(tǒng)看作信道,將顯示終端看作信宿。因此,設(shè)計該系統(tǒng)的關(guān)鍵問題――如何設(shè)計傳感器才能最大化地得到信息而不丟失信息?學生帶著這個問題去思考,就可以真正地體會傳感器中信息傳遞過程。
3.聯(lián)系科學前沿。為鼓勵學生大膽創(chuàng)新,筆者嘗試將科學前沿技術(shù)引入信息論課程,例如,室內(nèi)、外可見光通信技術(shù)。筆者結(jié)合自己近年來從事可見光通信研究的經(jīng)歷,向?qū)W生講授了可見光通信系統(tǒng)的設(shè)計、研制、實驗測試等一系列過程;然后結(jié)合信息論課程所學的知識,將其與研制的可見光通信系統(tǒng)聯(lián)系在一起。筆者也鼓勵學生探索與信息論相關(guān)的科學前沿問題,開展課堂討論與課下交流。讓學生查詢保密學、光學信息論等方面的文獻,詳細閱讀并做總結(jié)。然后,切實提出自己的想法,再予以驗證,從而將學生所學知識真正地和科學前沿結(jié)合在一起。
四、考核方式改革――三個引入
該課程原來采取任課教師命題、紙質(zhì)考試方式。其弊端在于,教師命題規(guī)律和出題形式規(guī)定,學生只要做一遍往年考試題目,就可得到較高的分數(shù)。雖然這種考核形式能在一定程度上反映出學生的知識水平,但卻無法體現(xiàn)其學術(shù)水平和實踐能力。為此,筆者在考核方式上做了三個引入的變化。
1.引入隨堂能力測驗。隨堂能力測驗是考查學生運用所學信息論知識分析解決實際問題的能力。由于采取隨堂考試形式,因此,對學生課堂學習效率和前期積累提出了較高的要求。例如,在學習香農(nóng)公式時,筆者考查了學生運用香農(nóng)公式計算射頻通信所需帶寬的問題;在學習無失真的信源編碼時,筆者考查了應用霍夫曼編碼對離散信源進行編碼的能力。該測驗在總成績中占10%的比例,從而激勵學生很好地利用課堂來學習知識。
2.引入學術(shù)論文加分。提升學術(shù)水平是研究生教學的任務之一。筆者針對信息論教學中每章的重點問題,均設(shè)置開放性的論題供學生選擇,讓其查閱文獻、資料,進行認真的設(shè)計、理論推導、計算機仿真、現(xiàn)場實驗,并將其總結(jié)成文,然后以學術(shù)論文的形式提交。筆者根據(jù)學生在文中闡述的觀點、論證的嚴密性、結(jié)論的正確性與普遍性等方面予以考核。學術(shù)論文在總成績中占20%的比例,是本次教學改革的重點。
3.引入上機考試。往年的信息論期末考試中,題目是由任課老師自行擬定。由于種種原因,考試題目重復率高、知識點考查單一,這給學生突擊考試并取得好成績提供了可能。為此,筆者將期末教師出題測試改為上機隨機抽題考試。筆者建立了試題庫,題型包括:客觀題(選擇、判斷)、主觀題(概念、簡答、計算、綜合)。在本校計算機學院協(xié)助下,建成了信息論上機考試系統(tǒng),學生登陸系統(tǒng)后,按照教師設(shè)定的題目數(shù)量和難度,隨機抽取試題。上機考試的在總成績中占據(jù)70%的比例,也是這次教學改革的重點。該考核方式經(jīng)試運行后,效果良好。
五、結(jié)語
筆者根據(jù)電路與系統(tǒng)專業(yè)信息論課程的特點以及目前教學中存在的問題,從教學內(nèi)容、教學方法及考核方式三個方面提出了相應的改革措施。通過本次的教學實踐證明,采取的這些措施有效地改善了課程教學效果,提高了學生的學習積極性、知識掌握程度和應用知識解決實際問題的能力。
參考文獻:
[1]陳運.信息論與編碼[M].北京:電子工業(yè)出版社,2007.
[2]葉中行.信息論基礎(chǔ)[M].北京:高等教育出版社,2002.
[3]李梅.信息論基礎(chǔ)教程(2版)[M].北京:北京郵電大學出版社,2003.
[4]曹雪虹.信息論與編碼[M].北京:清華大學出版社,2003.
[5]吳偉陵.信息處理與編碼[M].北京:人民郵電出版社,2005.
[6]李迎春,等.《信息論與編碼》教學改革探討[J].科技信息,2010,(20):18-20.
[7]鄧家先.信息論與編碼課程教學改革探討[J].電氣電子教學學報,2007,29(2):111-114.
[8]高宏峰,彭勃.信息論基礎(chǔ)課程教學改革探究[J].洛陽師范學院學報,2010,29(2):160-161.
科技信息論文范文第2篇
在電子專業(yè)碩士研究生教學中,信息論課程是必修基礎(chǔ)理論課程,但由于其與數(shù)學聯(lián)系密切、理論性強、內(nèi)容抽象,導致學生缺乏學習興趣和效率低下。為促進學生更好地掌握課程內(nèi)容,筆者從課程的教學內(nèi)容、教學方法與考核方式三方面進行一系列教學探索,提出“三個強化、三個聯(lián)系、三個引入”的改革措施。實踐結(jié)果表明,這些措施有效地改善了課程教學效果,提高了學生的學習積極性、知識掌握程度和應用知識解決實際問題的能力。
關(guān)鍵詞:
信息論;研究生教學;教學改革
《信息論》是本校電子科學與工程學院電路與系統(tǒng)專業(yè)碩士研究生(學術(shù)型)的專業(yè)必修理論課程,也是一般高等院校通信與信息工程、計算機科學與技術(shù)、電子科學與技術(shù)等一級學科下相關(guān)專業(yè)的本科生、研究生的主修專業(yè)課程[1-5]。通過對本課程的學習,使學生掌握有關(guān)信息論的基本理論以及編碼的理論、實現(xiàn)原理和具體應用。雖然人們在本科生的《信息論》教學改革方面做了一定的工作[6-9],但其改革內(nèi)容不符合電路與系統(tǒng)學科特點,更不符合研究生教學需要。筆者結(jié)合本學院學生基礎(chǔ)、學校政策及本人近年來的教學實踐,在學校研究生教學改革項目支持下,開展了本門課程的教學改革與實踐。
一、課程特點
1.需要堅實的數(shù)學基礎(chǔ)。該課程存在大量的公式推導與證明,與概率論、隨機過程、近世代數(shù)等數(shù)學知識密切相關(guān)。若無扎實的數(shù)學基礎(chǔ),學生無法看懂推導過程,更無法從根本上理解信息論的數(shù)學意義及物理含義。
2.學生學習興趣不高。由于電子專業(yè)碩士研究生的數(shù)學基礎(chǔ)僅限于本科生學過的概率論與隨機過程,對近世代數(shù)的了解幾乎為零。學生面對繁雜、抽象的理論問題時,無法宏觀地理解和把握,致使學生無法提高學習興趣。
3.課程聯(lián)系實際困難。課程抽象概念多、定理證明多,與實際應用有一定距離,且與其他課程聯(lián)系較少。多數(shù)學生在學習過程中覺得內(nèi)容枯燥、難度大,而且與將來就業(yè)方向聯(lián)系較少。鑒于以上問題,為了激發(fā)學生學習的積極性和主動性,促進學生更好地掌握本門課程,筆者從課程的教學內(nèi)容、教學方法與考核方式三方面入手,提出了教學改革的相應措施。
二、教學內(nèi)容改革———三個強化
1.強化離散信息論的基礎(chǔ)作用。信息論的主要內(nèi)容是信源概念、信息度量方式及三個香農(nóng)基本定理,相應的內(nèi)容又分別面向連續(xù)信源與離散信源。二者的區(qū)別在于,連續(xù)信源/信道及相應的定理一般需要結(jié)合隨機過程知識來學習,而離散信源/信道及相應的定理是建立在概率論、線性代數(shù)的基礎(chǔ)上。從推導過程和公式形式來看,二者具有內(nèi)在的統(tǒng)一性。這可從連續(xù)信源信息熵的推導過程看出:將連續(xù)信源進行離散化,變?yōu)殡x散信源后再利用離散信源信息熵的求解公式并求解極限得到。因此筆者重點強化了對離散信源、離散信道及其容量、無失真信源編碼定理、無失真的信源編碼的內(nèi)容。這對學生進一步掌握連續(xù)信源、信道及相關(guān)問題奠定了基礎(chǔ)。
2.強化信息論的現(xiàn)實物理意義。筆者從課程本源出發(fā),讓學生理解公式或定理蘊含的深刻物理含義,使理論結(jié)果可視化,概念直觀化。例如,在講解離散信源的極值性定理時,可提煉出如下物理含義:第一層含義是,當信源各取值的概率相等時,人們對信源取何值的不確定性最大,由于各信源服從等概率分布,信源的平均不確定性即為各事件的不確定性,因此信息熵也越大;第二層含義是,對于具有不同數(shù)量事件的兩個信源,若二者同時滿足等概率分布,則預測數(shù)量較多事件的信源的難度較大,因此該信源的信息熵也較大。
3.強化教學案例的實用性。在本次教學改革中,共自創(chuàng)或搜集教學案例11例,每個教學案例都與教材內(nèi)容有關(guān),將晦澀難懂的理論內(nèi)容變?yōu)轷r活的例子,讓學生去感受和體會案例中蘊含的問題,從而為更好地理解教學內(nèi)容奠定基礎(chǔ)。以引入的六個視頻教學案例為例,該案例以美國國家航天局發(fā)射的新火星探測器為背景,講解了信息如何傳播、如何加密等問題。通過這部分教學案例的學習,學生深刻地認識到了信息論的價值與實踐意義。
三、教學方法改革———三個聯(lián)系
1.聯(lián)系計算機仿真。筆者鼓勵學生應用MATLAB中SIMULINK工具設(shè)計具體的通信系統(tǒng)模型,如基于開關(guān)鍵控或正交頻分復用的射頻通信系統(tǒng)。讓學生看到實驗現(xiàn)象的同時,更加深刻地體會信息的傳遞過程,了解信源、信宿、信道的構(gòu)成,學習信源編碼、信道編碼、加密、信道譯碼、信源譯碼等信息處理過程,加強學生對信道容量、信息傳輸速率、誤碼率等概念的把握。筆者督促學生將上述問題作為課程設(shè)計的作業(yè),使其結(jié)合信息論所學的知識,提煉出相關(guān)問題、建立模型,加以認真分析解決;再將提煉問題和解決問題的過程以及結(jié)論進行匯總,撰寫成研究報告。這既鞏固了學生的基礎(chǔ)知識,又鍛煉了學生運用計算機進行建模和仿真的能力。
2.聯(lián)系工程實際。由于研究生日常的工作大多在實驗室從事工程項目的研究或開發(fā)工作,若能將這些工作與信息論知識聯(lián)系到一起,無論對信息論的學習還是科研都將起到促進作用。筆者首先開展了調(diào)查研究工作,統(tǒng)計了各個學生從事科研項目的情況,然后讓學生結(jié)合課程知識,從信息獲取、處理、傳輸、存儲的角度去解釋。例如,在講述信息不增性原理時,筆者結(jié)合溫度傳感器的設(shè)計問題:將大氣環(huán)境溫度看成連續(xù)信源,將傳感器系統(tǒng)看作信道,將顯示終端看作信宿。因此,設(shè)計該系統(tǒng)的關(guān)鍵問題———如何設(shè)計傳感器才能最大化地得到信息而不丟失信息?學生帶著這個問題去思考,就可以真正地體會傳感器中信息傳遞過程。
3.聯(lián)系科學前沿。為鼓勵學生大膽創(chuàng)新,筆者嘗試將科學前沿技術(shù)引入信息論課程,例如,室內(nèi)、外可見光通信技術(shù)。筆者結(jié)合自己近年來從事可見光通信研究的經(jīng)歷,向?qū)W生講授了可見光通信系統(tǒng)的設(shè)計、研制、實驗測試等一系列過程;然后結(jié)合信息論課程所學的知識,將其與研制的可見光通信系統(tǒng)聯(lián)系在一起。筆者也鼓勵學生探索與信息論相關(guān)的科學前沿問題,開展課堂討論與課下交流。讓學生查詢保密學、光學信息論等方面的文獻,詳細閱讀并做總結(jié)。然后,切實提出自己的想法,再予以驗證,從而將學生所學知識真正地和科學前沿結(jié)合在一起。
四、考核方式改革———三個引入
該課程原來采取任課教師命題、紙質(zhì)考試方式。其弊端在于,教師命題規(guī)律和出題形式規(guī)定,學生只要做一遍往年考試題目,就可得到較高的分數(shù)。雖然這種考核形式能在一定程度上反映出學生的知識水平,但卻無法體現(xiàn)其學術(shù)水平和實踐能力。為此,筆者在考核方式上做了三個引入的變化。
1.引入隨堂能力測驗。隨堂能力測驗是考查學生運用所學信息論知識分析解決實際問題的能力。由于采取隨堂考試形式,因此,對學生課堂學習效率和前期積累提出了較高的要求。例如,在學習香農(nóng)公式時,筆者考查了學生運用香農(nóng)公式計算射頻通信所需帶寬的問題;在學習無失真的信源編碼時,筆者考查了應用霍夫曼編碼對離散信源進行編碼的能力。該測驗在總成績中占10%的比例,從而激勵學生很好地利用課堂來學習知識。
2.引入學術(shù)論文加分。提升學術(shù)水平是研究生教學的任務之一。筆者針對信息論教學中每章的重點問題,均設(shè)置開放性的論題供學生選擇,讓其查閱文獻、資料,進行認真的設(shè)計、理論推導、計算機仿真、現(xiàn)場實驗,并將其總結(jié)成文,然后以學術(shù)論文的形式提交。筆者根據(jù)學生在文中闡述的觀點、論證的嚴密性、結(jié)論的正確性與普遍性等方面予以考核。學術(shù)論文在總成績中占20%的比例,是本次教學改革的重點。
3.引入上機考試。往年的信息論期末考試中,題目是由任課老師自行擬定。由于種種原因,考試題目重復率高、知識點考查單一,這給學生突擊考試并取得好成績提供了可能。為此,筆者將期末教師出題測試改為上機隨機抽題考試。筆者建立了試題庫,題型包括:客觀題(選擇、判斷)、主觀題(概念、簡答、計算、綜合)。在本校計算機學院協(xié)助下,建成了信息論上機考試系統(tǒng),學生登陸系統(tǒng)后,按照教師設(shè)定的題目數(shù)量和難度,隨機抽取試題。上機考試的在總成績中占據(jù)70%的比例,也是這次教學改革的重點。該考核方式經(jīng)試運行后,效果良好。
五、結(jié)語
筆者根據(jù)電路與系統(tǒng)專業(yè)信息論課程的特點以及目前教學中存在的問題,從教學內(nèi)容、教學方法及考核方式三個方面提出了相應的改革措施。通過本次的教學實踐證明,采取的這些措施有效地改善了課程教學效果,提高了學生的學習積極性、知識掌握程度和應用知識解決實際問題的能力。
參考文獻:
[1]陳運.信息論與編碼[M].北京:電子工業(yè)出版社,2007.
[2]葉中行.信息論基礎(chǔ)[M].北京:高等教育出版社,2002.
[3]李梅.信息論基礎(chǔ)教程(2版)[M].北京:北京郵電大學出版社,2003.
[4]曹雪虹.信息論與編碼[M].北京:清華大學出版社,2003.
[5]吳偉陵.信息處理與編碼[M].北京:人民郵電出版社,2005.
[6]李迎春,等《.信息論與編碼》教學改革探討[J].科技信息,2010,(20):18-20.
[7]鄧家先.信息論與編碼課程教學改革探討[J].電氣電子教學學報,2007,29(2):111-114.
[8]高宏峰,彭勃.信息論基礎(chǔ)課程教學改革探究[J].洛陽師范學院學報,2010,29(2):160-161.
[9]劉鶯,胡劍煒.信息論基礎(chǔ)課程教學優(yōu)化改革的探討[J].科技信息,2011,(35):112.
科技信息論文范文第3篇
關(guān)鍵詞:信息論;實驗課;研究型教學
作者簡介:尚緒鳳(1981-),女,山東萊蕪人,中國計量學院理學院數(shù)學系,副教授。(浙江 杭州 310018)
基金項目:本文系中國計量學院“信息論基礎(chǔ)”校重點課程建設(shè)項目的研究成果。
中圖分類號:G642.0 文獻標識碼:A 文章編號:1007-0079(2014)05-0148-02
信息論、錯誤控制編碼和密碼學是現(xiàn)在數(shù)字通信系統(tǒng)中的三大支柱。信息論基礎(chǔ)是應用概率論、隨機過程和近世代數(shù)等方法研究信息的存儲、傳輸和處理中一般規(guī)律的學科,主要解決通信過程中信息傳輸?shù)挠行?、可靠性與安全性的問題,是信息科學和通信科學領(lǐng)域中的一門基礎(chǔ)理論。[1,2]自從“信息論”課程在信息及計算科學專業(yè)開設(shè)以來,筆者一直在研究和探索適合本專業(yè)學生學習的教學模式,經(jīng)過多年的教學探索經(jīng)驗,在該課程的教學中,筆者發(fā)現(xiàn)采用分組討論、學生組與組之間進行實驗報告互評、分組研究討論、通過圖書館及網(wǎng)絡資源查找并研讀相關(guān)論文以及學生做研讀論文的研討報告等新的教學方法和教學手段,在實際的教學過程中收到了比較滿意的效果,也得到了學生比較認可的評價。
研究型教學就是要鼓勵學生“在學習中研究,在研究中學習”。在教學中筆者鼓勵學生除了學習選用教材上的知識外,還要借閱本課程相關(guān)的參考書,作為輔助學習資料,并用一些前沿科學問題,引導學生去探究和研究書本上沒有的東西,并通過圖書館和網(wǎng)絡上的相關(guān)課程網(wǎng)站及文獻檢索平臺,增加獲取知識的渠道,鼓勵和引導學生學會用書本上的知識解決相關(guān)的科研問題。為此,筆者在“信息論”課程的教學過程中給學生提供基于課程教學內(nèi)容而又略高于課程教學內(nèi)容的科學研究問題以及相關(guān)文獻資料和獲取文獻資料的途徑,開拓學生的學習視野和途徑,滿足不同層次學生的需要,培養(yǎng)學生搜集科研論文資料以及閱讀文獻的能力,逐步使學生養(yǎng)成科學研究的素養(yǎng)。對于研究型教學的范疇,教育專家們 對其內(nèi)涵和本質(zhì)的看法基本上是一致的,大體可以歸納為:以課程內(nèi)容和學生的知識經(jīng)驗為基礎(chǔ),在教學過程中選擇恰當?shù)目茖W問題為載體,以學生為中心創(chuàng)設(shè)情境,引導學生充分參與,主動探究,使學生能夠自主地發(fā)現(xiàn)問題、研究問題和解決問題,并從中體驗“搜集資料方案設(shè)計方案研討實驗驗證撰寫論文”完整的科學研究過程,進而學習科學知識,掌握研究方法,并培養(yǎng)其創(chuàng)新能力和探究精神。因此,研究型教學是一種學習和研究融為一體的教學體系,就是通過教師充分備課,提供基于課程教學內(nèi)容又略高于教學內(nèi)容的科研問題,進行合理的設(shè)計與引導,使學生在學習中主動發(fā)現(xiàn)和探索知識,提供給學生參與研究工作和接觸科研問題的機會,從而在研究中學習,在學習中研究,逐步培養(yǎng)學生應用學科知識與研究方法,為進一步的研究生科研工作做準備。
課題組成員在多年的大學生數(shù)學建模競賽指導過程中,根據(jù)已有的指導經(jīng)驗,發(fā)現(xiàn)精干的指導團隊、規(guī)范的組織體系、嚴謹?shù)慕虒W計劃、新穎的教學模式、先進的教學手段、靈活的教學方法、交叉的知識補充等使得數(shù)學建?;顒釉谥袊嬃繉W院(以下簡稱“我校”)倍受學生青睞,每年有數(shù)以千計的學子從中受益。只要正確引導學生學習和探究問題,對于一些科學前沿科研問題,他們可以通過已有知識,并查閱相關(guān)參考文獻,對科研問題會有創(chuàng)新性的想法和思路。只要他們發(fā)揮團隊的合作精神,他們可以發(fā)揮學習的主動性和積極性,并會有突破性的成績。鑒于在數(shù)學建模競賽指導中的經(jīng)驗,課題組成員把競賽指導中的部分經(jīng)驗方法應用到信息論基礎(chǔ)課程的課堂教學中,在過去一年的實踐中,已經(jīng)收到了不錯教學效果,并有應用信息論知識相關(guān)的科研論文公開發(fā)表在學術(shù)期刊上。
一、“信息論”課程新的教學模式
1.理論教學和實驗教學相結(jié)合,以最新科研成果做引導
堅持以“理論和實驗課相結(jié)合,最新科研成果作為教學過程中知識學習的主線”,引導學生探知探究問題,發(fā)揮學習的積極性和主動性,提高學生分析和解決問題的綜合能力。研究型教學需要給學生提供活躍的課堂學術(shù)氛圍,在教學過程中啟發(fā)、引導學生主動思考,為此,在教學中筆者采用互動式討論的教學方法,特別是以網(wǎng)絡的BB平臺作為創(chuàng)新實踐平臺,加強學生討論組之間的互動和問題討論。特別是要善于激發(fā)學生求知欲使他們在課堂上積極發(fā)言參與教學和討論,激發(fā)學生探究問題的興趣。
在教學過程中,優(yōu)化拓展教學內(nèi)容,保持教學內(nèi)容先進性,開始每個章節(jié)的教學之前,課題組成員首先把與本章節(jié)相關(guān)的科研問題在BB平臺的網(wǎng)絡課程平臺教學中,讓學生先通過這些問題了解主要的知識重點,并通過圖書館和文獻查閱,了解相關(guān)知識,并且在課堂的教學過程中,在分組討論的時候,學生可以根據(jù)自己查閱的資料發(fā)表觀點,教師補充糾正部分問題,學生發(fā)言的情況將作為期考考核的一部分。授課過程中注重跟蹤信息處理技術(shù)最新前沿問題,通過引入信息論及編碼理論知識在文本識別、語音識別和圖像處理等方面的成功應用,強調(diào)理論與實際應用問題之間的關(guān)系,讓學生體會學有所用的過程。通過對實際應用問題的研究和探討加深他們對理論知識的理解,學以致用。
2.提高實踐教學的效果和效率,改革實驗課教學模式
由于受到教學計劃設(shè)置的影響,一般一次實驗課大約要2個自然班級一塊上課,由于學生人數(shù)比較多,教師在實驗課的教學過程中很難照顧到全部學生。針對現(xiàn)實的情況,目前大多數(shù)學生都擁有計算機,并且學校圖書館也有機房提供給學生使用,所以實驗課的教學過程中,筆者會在每次實驗課之前,先通過網(wǎng)絡課程網(wǎng)站實驗指導書,學生在實驗課開始前根據(jù)每次實驗的指導書完成實驗內(nèi)容,要求每個學生撰寫實驗報告,對于在實驗過程中的問題通過網(wǎng)絡課程平臺發(fā)問,教師或者學有余力的學生都可以在平臺上對問題進行解答,供學生共享,并且簡單的實驗內(nèi)容讓學生之間互評,這樣更能調(diào)動學生學習的積極性和參與性。實驗課時對于一些還沒有解答的問題,再在課堂上統(tǒng)一解答。并把每次做得較優(yōu)的幾個同學的實驗報告上傳到網(wǎng)絡課程平臺供全體同學參考和學習,對于作為范本的學生在期末考核中實行額外加分。由于信息論的實驗內(nèi)容大多都是關(guān)于編碼的實驗,需要學生掌握Matlab以及C語言的基本操作代碼,在實驗課堂中學生們可以進行討論和更進一步的學習,使得學生們的動手能力得到較大提高,對于學生學過的“數(shù)學軟件與數(shù)學實驗”以及“C語言”課程也是直接地應用,部分實驗課程的相關(guān)研究內(nèi)容也可以作為下學期畢業(yè)論文設(shè)計的后續(xù)研究問題。實驗報告的撰寫過程,培養(yǎng)了學生的寫作能力和綜合應用能力。
二、優(yōu)化教學內(nèi)容,把科研問題引入到教學過程中,增加課堂的學術(shù)研究氛圍
自從2003年開設(shè)信息論這門課程以來,筆者先后采用過以下三本教材《信息論——基礎(chǔ)理論與應用》、[4]《信息論基礎(chǔ)與應用》[5]和《信息論、編碼與密碼學》,[6]由筆者所教授的學生為信息與計算科學專業(yè)的學生,所有最終筆者選擇采用《信息論、編碼與密碼學》這本教材。該教材更側(cè)重于實踐應用環(huán)節(jié),更適合調(diào)動學生的實際動手能力以及編碼的編程能力,弱化編碼理論的繁瑣證明。
針對自信息、互信息、信息熵、平均互信息及信道容量等是“信息論”課程中較為重要的幾個關(guān)鍵概念和知識,為了加深學生對這些概念的理解和掌握,在教學過程中,筆者選擇了一些基于這些知識卻能被本科生所能理解的科研題目,提供相關(guān)文獻資料和獲取文獻資料的途徑等學術(shù)資料,給出“自信息量在文本處理中的應用”、“Shannon-Fano-Elias編碼理論的改進方法及應用”、“圖像處理中無損壓縮算法研究”、“基于預測編碼的圖像壓縮算法研究”等題目。按照數(shù)學建模比賽的模式,以三人作為一組,學生自由組隊,自選其中之一題目進行相關(guān)的討論和探究,學生通過查閱資料、定期匯報交流等環(huán)節(jié)完成任務,提交研讀報告或者學術(shù)論文。最終使基礎(chǔ)不同的學員都能夠提升學習能力,在學習的過程中享受學習和合作的樂趣,學有余力的同學可以把有創(chuàng)新性觀點的科研問題最后撰寫成科研在學術(shù)期刊上。一年的教學實踐之后,已經(jīng)有兩篇論文公開發(fā)表在國內(nèi)外期刊上,分別是《A NEAR-LOSSLESS PREDICTIVE COMPRESSION ENCODING BASED ON HEXAGONAL SAMPLING》發(fā)表在2013 International Conference on Machine Learning and Cybernetics 和《基于自信息的犯罪網(wǎng)絡情報分析與研究》發(fā)表在2013年的科技信息期刊上。
三、利用現(xiàn)代網(wǎng)絡技術(shù),提高增加教師和學生的互動
課堂教學上,采用板書與多媒體課件并重的形式,利用網(wǎng)絡資源,比如:網(wǎng)絡課程平臺,提供學生訪問國內(nèi)外著名大學的相關(guān)課程的網(wǎng)站,通過不同的途徑對本課程進行學習,拓展學生的學習視野和途徑,鼓勵同學了解信息論知識發(fā)展的最新成果。
實驗課程教學中,網(wǎng)絡課程平臺上設(shè)置主題討論區(qū),設(shè)置相關(guān)問題,例如:日常生活中哪些問題可以用信息量來刻畫;什么是信息,能否舉例說明;信息能否度量,如何度量等,通過這些問題的解答可以是學生更加深刻的理解信息的概念,以便于后續(xù)章節(jié)的學習,讓學生把相關(guān)的概念與現(xiàn)實生活中的生活知識聯(lián)系在一起,便于把抽象的問題具體話,學生掌握這些概念也不會太過于枯燥。同時設(shè)置答疑區(qū),可以方便學生有問題可以及時提問,另外其他學生也可以看到相應的問題,教師統(tǒng)一做回復,這樣可以更加有效地增加教師和學生的互動,及時地解答學生的疑問。
四、提升教學理念,優(yōu)化考核評價機制
由于新的教學模式,理論與實驗并重,所以筆者采用新的考核方式,期末閉卷考試(60%)+課堂討論表現(xiàn)(10%)+實驗報告(15%)+專題研討(15%)+額外加分(10%)。對于有創(chuàng)新觀點的學生可以額外加分,可以很好地調(diào)動學習過程中學生的積極性。通過期末閉卷考試的卷面成績可以考核學生對于課本知識的掌握情況,實驗報告的成績體現(xiàn)了學生的實際動手能力及知識的應用能力,并且也很好地反映學生熟練應用軟件的程度。
五、總結(jié)
在研究型教育理念的指導下對“信息論”課程重新進行整體設(shè)計,優(yōu)化教學內(nèi)容,采用有效的教學方法,使學生的積極性和主動性得到全面發(fā)展。在過去一年的教學實踐中,筆者發(fā)現(xiàn)不同層次的學生對研究型教學模式的接受能力存在差異,因此如何針對不同層次學生開展研究性教學將是下一教學周期課題組成員的研究重點。總之,在教學過程中,只有不斷探索和突破常規(guī)教學方法,積累有用的教學經(jīng)驗,才能培養(yǎng)出具備實踐能力和創(chuàng)新思想的專業(yè)技術(shù)人才。今后筆者將在教學過程中,不斷的發(fā)現(xiàn)問題,總結(jié)經(jīng)驗,不斷創(chuàng)新,力爭把信息論課程的教學和改革做得更有成效。
參考文獻:
[1]陳運.信息論與編碼[M].北京:電子工業(yè)出版社,2007.
[2]D CMacKay.Information Theory,Inference,and Learning Algorithms[M]. Cambridge :Cambridge University Press,2000.
[3]李春,鄒逢興,周宗潭,等.《計算機硬件技術(shù)基礎(chǔ)》精品課程研究型教學探索與實踐[J].高等教育研究學報,2013,(1):26-29.
[4]傅祖蕓.信息論——基礎(chǔ)理論與應用[M].北京:電子工業(yè)出版社,
2001.
[5]沈世鎰,吳忠華.信息論基礎(chǔ)與應用[M].北京:高等教育出版社,2004.
科技信息論文范文第4篇
[關(guān)鍵詞]學術(shù)論文 復制檢測 抄襲剽竊檢測 統(tǒng)計語言模型 文本相似度算法
[分類號]TP391.1
自從方舟子的“新語絲”使原本長期存在于學術(shù)界的學術(shù)不端暴露出來之后,學術(shù)論文抄襲剽竊引起社會的廣泛關(guān)注。抄襲剽竊的表現(xiàn)形式多種多樣:有些只是在語言文字的表達形式上做手腳,換成同義詞或顛倒語句的表達順序,在文章框架、主要觀點和主要論據(jù)上卻沒有大的變化;有些直接大段地“引用”別人的內(nèi)容;有些綜合運用多種手段,將多篇別人的文章拼湊而成自己的;有些“學術(shù)高手”直接拿國外的論文翻譯成中文發(fā)表,等等。抄襲和剽竊“手段”的越來越“高明”,給抄襲剽竊檢測帶來很大困難。抄襲檢測又叫復制檢測、剽竊檢測或副本檢測,根據(jù)檢測對象性質(zhì)不同可分為圖像、聲音和文本復制檢測。學術(shù)論文抄襲檢測是文本復制檢測的一種,歸根到底是判斷兩篇學術(shù)論文的相似程度?!罢倩芈省焙汀熬珳事省笔桥袛鄼z測算法好壞的兩個重要指標。為了進一步提高學術(shù)論文復制檢測判斷的準確率,針對學術(shù)論文的文檔相似度算法的改進和創(chuàng)新研究變得尤為重要。
1 國內(nèi)外研究現(xiàn)狀及存在的問題
1.1 國外研究現(xiàn)狀
國外具有代表性的文檔相似度算法主要有以下幾種:①Manber提出一個sif工具,其“近似指紋”是用基于字符串匹配的方法來度量文件之間的相似性;②Brin等在“數(shù)字圖書館”工程中首次提出文本復制檢測機制COPS(copy protection system)系統(tǒng)與相應算法,奠定了論文抄襲檢測系統(tǒng)的基礎(chǔ);③Garcia-Molin提出SCAM(Stanford copy analysis method)原型,改進了COPS系統(tǒng),用于發(fā)現(xiàn)知識產(chǎn)權(quán)沖突。他使用基于詞頻統(tǒng)計的方法來度量文本相似性,后來把檢測范圍從單個注冊數(shù)據(jù)庫擴展到分布式數(shù)據(jù)庫上以及在Web上探測文本復制的方法;④貝爾實驗室的Heintze開發(fā)了KOALA系統(tǒng)用于剽竊檢測,采用與sif基本相同的算法;⑤si和Leong等人建立的CHEC系統(tǒng)首次把文檔結(jié)構(gòu)信息引入到文本相似性度量中;⑥Stein提出一種方法,這種方法能產(chǎn)生一種“指紋”,在某種程度上能有效防止修改;⑦MeyerzuEissen等提出通過根據(jù)寫作風格上的變化來分析單篇文檔,從而決定是否有潛在抄襲;⑧美國學校首先引入Tumitin偵探剽竊數(shù)據(jù)庫,用于防止論文抄襲,此外還有其他類似軟件系統(tǒng)用于進行文檔相似度分析。當然不同的檢測系統(tǒng)其相似度算法的精度也不盡相同。
1.2 國內(nèi)研究現(xiàn)狀
國內(nèi)關(guān)于論文抄襲剽竊檢測方面已有一些研究:①張斯通過對中文文本進行自動分詞,然后計算它們的相似度,從而判別文本是否抄襲,其對應裝置包括:樣本輸入裝置、樣本數(shù)據(jù)庫、自動分句分詞裝置、分詞數(shù)據(jù)庫、預處理裝置、特征詞數(shù)據(jù)庫、相似判別裝置、判別結(jié)果輸出裝置和控制處理裝置等。②鮑軍鵬通過文本的結(jié)構(gòu)信息和語義信息提取文本特征,是通過運用文本剽竊判定模塊中設(shè)定的探針法,估計待檢測文本特征和特征庫中的文本特征的最大共同語義,并給出文本雷同度量,從而判別文本是否抄襲。③沈陽是通過先找到存儲空間內(nèi)的格式遺留,再將這些遺留格式附近文檔的關(guān)鍵詞或/和句子或/和段落與文獻庫中的文獻內(nèi)容進行比較,從而減少被檢測文檔的數(shù)據(jù)量,加快了反剽竊或轉(zhuǎn)載文檔檢測速度。④張履平通過對已植入水印的文章進行特征擷取,根據(jù)所取得的詞匯輸入搜尋引擎以搜尋相關(guān)可疑文章;根據(jù)與原文比對結(jié)果取得的句子進行水印解析;將所取得的水印信息與原來的水印比對,從而判斷是否為剽竊。⑤金博等則對基于篇章結(jié)構(gòu)相似度的復制檢測算法有一些研究。
1.3 存在的問題
事實上,由于剽竊形式的多樣性和隱蔽性、語法和句法的復雜性等,目前主要采用的“數(shù)字指紋”和詞頻統(tǒng)計兩大類抄襲識別技術(shù)已經(jīng)不能滿足實際的剽竊檢測需求,會造成很多漏檢和誤檢,其“召回率”和“精準率”都有待提高。歸根到底是因為其檢索模型有待突破,算法亟待改進或需創(chuàng)造全新的算法來針對學術(shù)論文抄襲剽竊檢測的實際。如何把握并充分利用學術(shù)論文的結(jié)構(gòu)和語言特征,提供具有針對性的檢索模型和相似度算法及其實現(xiàn)系統(tǒng),對能否在異構(gòu)的分布式學術(shù)論文資源系統(tǒng)中,對抄襲剽竊檢測進行更精確的判斷至關(guān)重要。
2 學術(shù)論文復制檢測研究的新思路
針對以上問題,筆者提出以下學術(shù)論文復制檢測研究的新思路:①建立有針對性的學術(shù)論文語料庫;②通過對語料庫的深層加工、統(tǒng)計和學習,建立統(tǒng)計語言模型;③充分利用學術(shù)論文著錄項目自身的特點,通過將文檔結(jié)構(gòu)化,賦予元數(shù)據(jù)項加權(quán)系數(shù),運用卷積計算學術(shù)論文的相似度;④利用支持網(wǎng)絡語言的JAVA編程實現(xiàn)相似度算法;⑤通過將待檢測論文與數(shù)據(jù)庫中已有文獻對比,計算其相似度,當相似度超過某一閾值時,則判斷該論文有抄襲的可能,如圖1所示:
3 具體方法及步驟
3.1 建立某一學科專業(yè)的學術(shù)論文語料庫
新一代的兆億級的大規(guī)模語料庫可以作為語言模型的訓練和測試手段,用以評價一個語言模型的質(zhì)量。本文建立的語料庫中存放的是在學術(shù)論文語言的實際使用中真實出現(xiàn)過的學術(shù)論文語言材料;是以電子計算機為載體,承載學術(shù)資源語言知識的基礎(chǔ)資源;通過對真實語料進行分析和處理等加工,使之成為本文的學術(shù)論文抄襲檢測模型和算法的訓練與測試手段。
利用豐富的學術(shù)資源數(shù)據(jù)庫,如Dialog、SCI、EI、INSPE、IEEE、Science Direct、EBSCO、PQDD、SPRINGERLINK、KLUWER、Science online、Medline、CNKI、中文科技期刊全文數(shù)據(jù)庫、萬方數(shù)據(jù)科技信息子系統(tǒng)、萬方數(shù)據(jù)商業(yè)信息子系統(tǒng)、七國兩組織的專利數(shù)據(jù)庫、國內(nèi)外專利數(shù)據(jù)庫等異構(gòu)的分布資源,通過信息檢索,從某一學科專業(yè)著手,構(gòu)建某一學科專業(yè)領(lǐng)域的學術(shù)論文語料庫。
3.2 以信息論為工具,創(chuàng)建統(tǒng)計語言模型用于學術(shù)論文檢索
數(shù)學是解決信息檢索和自然語言處理的最好工具。其實早在幾十年前,數(shù)學家兼信息論專家香農(nóng)(Claude Shannon)就提出了用數(shù)學方法處理自然語言的想法。語音和語言處理大師賈里尼克(Fred Je-
linek)首先成功利用數(shù)學方法解決了自然語言處理問題。統(tǒng)計語言模型(即基于統(tǒng)計的語言模型)通常是概率模型,計算機借助于統(tǒng)計語言模型的概率參數(shù),可以估計出自然語言中每個句子出現(xiàn)的可能性,而不是簡單地判斷該句子是否符合文法。統(tǒng)計語言模型以概率頒布的形式描述了任意語句(字符串)s屬于某種語言集合的可能性,需要對任意的語句s都給出一個概率值,例如:P(他/認真/學習)=0.02。本文充分利用學術(shù)論文不同于報紙新聞論文或其他類型文檔的語言特點,以建立的學術(shù)論文語料為訓練和測試基礎(chǔ),提出新的基于學術(shù)論文的統(tǒng)計語言模型作為針對學術(shù)論文抄襲剽竊檢測算法的檢索語言模型。具體做法為:以信息論為工具,把握學術(shù)論文的語言特點,通過對以上所建立的學科專業(yè)語料庫進行深層加工、統(tǒng)計和學習,獲取大規(guī)模真實學術(shù)論文語料中的語言知識,建立基于學術(shù)論文語料庫的統(tǒng)計語言模型;通過實驗,與其他文本信息檢索模型進行比較,論證其有效性。
3.3 利用學術(shù)論文中描述資源對象語義信息的元數(shù)據(jù)結(jié)構(gòu),計算文檔相似度
充分利用正式出版的學術(shù)論文的結(jié)構(gòu)特點,根據(jù)學術(shù)論文中標引出的K個描述資源對象語義信息的元數(shù)據(jù)(Di,i=1,2…k),將學術(shù)論文結(jié)構(gòu)化;然后利用已有的基于學術(shù)論文語料庫的統(tǒng)計語言模型,將待比較的論文的各相同元數(shù)據(jù)Di(i=1,2…k)部分進行比對得相似度si,再根據(jù)元數(shù)據(jù)對論文的重要程度給定第i個元數(shù)據(jù)項相似度權(quán)函數(shù)wi;則整篇學術(shù)論文總體的相似度為Sd=∑Wi*Si。
具體算法舉例如下:
將待檢測的學術(shù)論文的元數(shù)據(jù)如題名Til、關(guān)鍵詞Kyl、摘要Abl、正文.Tel、參考文獻Rel等元數(shù)據(jù)字段抽取出來,與語料庫中已有論文的相應元數(shù)據(jù)字段內(nèi)容題名Ti2、關(guān)鍵詞Ky2、摘要Ab2、正文Tx2、參考文獻Re2進行相似度計算。計算時,在篇名字段前給以0.25,0.4,0.15,0.1和0.1的加權(quán)系數(shù)。建立的統(tǒng)計語言模型計算待測論文和語料庫中已出版的論文j同一元數(shù)據(jù)字段的內(nèi)容相似程度,記為:Sim_Tij,sim―Kyj,Sim_Abj,Sire Tej,Sim_Rej,卷積后得整篇論文與語料庫中某篇論文j的相似程度值計算公式為:Sinai―larity_paper_j=0.25×Sim_Tij+0.4×Sim_Kyj+0.15×Sim_Abj+0.1×Sim_Txj+0.1×Sim_Rej;再計算與待檢測論文最相似的那個最大相似度Max_Similarity=Max{Simflarity_paper_j};如果Max_Similarity大于設(shè)定的閥值1(如40%),則判斷為疑似抄襲,這樣的論文需要審稿專家仔細認真審理,如果Max_Similarity大于設(shè)定的閥值2(比設(shè)定的閥值1大,如80%),這樣的論文極有可能存在抄襲,需要審稿專家特別注意。在計算相似度值后,計算機系統(tǒng)記錄下相似度高于設(shè)定閥值的抄襲和被抄襲的學術(shù)論文來源、相似度值、及其各元數(shù)據(jù)項信息(包括作者信息)。以上各元數(shù)據(jù)項相似度計算過程中,加權(quán)系數(shù)可以根據(jù)需要做適當調(diào)整為其他數(shù)值,但系數(shù)總和為1。
3.4 推廣使用
通過對某一學科專業(yè)的研究,進一步拓展到其他學科領(lǐng)域,從而最終實現(xiàn)在異構(gòu)的分布式學術(shù)論文資源系統(tǒng)中,對各個學科領(lǐng)域的學術(shù)論文抄襲剽竊進行跨平臺檢測。
4 研究展望及難點、解決辦法
今后的研究主要是將以上思想和方法步驟通過實驗進行論證。通過JAVA編程實現(xiàn)算法,同時能實現(xiàn)對于空間地址分布和數(shù)據(jù)異構(gòu)的學術(shù)資源進行跨平臺的復制檢測。使用支持語言模型的Lemur工具箱,在標準的TREC文檔集上做測試試驗,并對算法的召回率和精準率作出量化;選擇與Turnitin偵探剽竊系統(tǒng)進行實驗對比,評價該基于學術(shù)論文語料庫的統(tǒng)計語言模型及算法。
科技信息論文范文第5篇
【關(guān)鍵詞】決策樹算法 應用 優(yōu)點
決策樹是在信息論基礎(chǔ)上建立的,對數(shù)據(jù)進行分類的一種常用方法。決策樹是一種樹型結(jié)構(gòu),執(zhí)行過程與流程圖比較相類似,在決策樹中的各個結(jié)點以及分枝分別代表著一種測試,屬性上的一個測試就用結(jié)點進行表示,輸出一個測試則用分枝進行表示,樹中的葉結(jié)點代表類或類分布。首先,一棵決策樹的創(chuàng)建是通過訓練數(shù)據(jù)建立的,訓練數(shù)據(jù)是根據(jù)一批已知的數(shù)據(jù)得到的。其次,決策樹建成后,要進行數(shù)據(jù)預測。決策樹創(chuàng)建整個過程,我們可以視為是數(shù)據(jù)規(guī)則的生成過程,因此,決策樹成功實現(xiàn)數(shù)據(jù)規(guī)則的可視化,輸出結(jié)果易于理解,效率也比較高,所以比較常用。
1 決策樹生產(chǎn)過程
決策樹進行傳統(tǒng)的數(shù)據(jù)分類包含兩個步驟:
第一步:利用訓練集進行創(chuàng)建模型階段,找到映射函數(shù)表示模型,從指定的訓練集中獲取知識,這是一個學習的過程。
第二步:利用生成的決策樹預測數(shù)據(jù)的類別,使用上一步訓練完成的函數(shù)模型進行預測,對輸入的記錄,從根結(jié)點開始一直到葉結(jié)點進行測試屬性值,然后對數(shù)據(jù)集中的每一類數(shù)據(jù)進行描述,生成分類規(guī)則。
具體工作過程如圖1所示。
2 決策樹算法的優(yōu)點
(1)學習該算法,不要求使用者的知識背景豐厚,就能夠在訓練事例中用屬性結(jié)論的方式來進行表達。
(2)訓練集數(shù)據(jù)量較大的情況下,決策樹模型效率較高。
(3)決策樹是一種樹狀結(jié)構(gòu),它是最簡單直觀的,因此在分類模型中經(jīng)常被應用的方法之一,通過從根結(jié)點一直到達葉子結(jié)點的路徑轉(zhuǎn)換,最終能夠生成分類規(guī)則以IFTHEN形式進行表示,這樣更能夠讓人容易理解。
(4)決策樹方法對于分類而言,精確度較高。
3 決策樹的評價指標
(1)準確的預測性。決策人員最關(guān)心的就是預測的準確性,分類模型具有對未知新數(shù)據(jù)進行準確預測的能力、也能對未知的數(shù)據(jù)類的預測能力。
(2)描述的簡潔性.分類發(fā)現(xiàn)模型對問題的描述方式提出的分類發(fā)現(xiàn)模型只有越簡潔越容易理解才能夠方便決策人員使用。
(3)計算復雜性。在數(shù)據(jù)挖掘的過程中,操作的數(shù)據(jù)對象是海量信息的數(shù)據(jù)庫,所以空間和時間的復雜性將直接影響模型的計算成本,計算的復雜度是在海量數(shù)據(jù)庫中具體實現(xiàn)的細節(jié)決定的。
(4)處理規(guī)模性。
(5)模型強健性。
4 決策樹算法在學生就業(yè)工作中應用
4.1 設(shè)計方案
利用決策樹C4.5算法分析哪些因素對學生就業(yè)有影響。
選取計算機系10屆、11屆、12屆計算機科學與技術(shù)專業(yè)學生為研究對象,學生人數(shù)為200人。
4.2 數(shù)據(jù)采集
(1)學生基本信息庫。數(shù)據(jù)結(jié)構(gòu)如下:姓名、學號、性別、班級、籍貫。
(2)學生就業(yè)信息庫。內(nèi)容包括學號、姓名、參加公司培訓、是否優(yōu)質(zhì)就業(yè)(工資在3000元以上為優(yōu)質(zhì)就業(yè))等。
(3)成績表。成績數(shù)據(jù)庫中包括了學生的課程總成績平均分和綜合測評成績平均分,這個數(shù)據(jù)庫由教師在教學過程中和輔導員對學生表現(xiàn)評定產(chǎn)生。
4.3 數(shù)據(jù)項處理
數(shù)據(jù)集成。根據(jù)給出的數(shù)據(jù)文件,將三個數(shù)據(jù)源的數(shù)據(jù)利用數(shù)據(jù)庫技術(shù)生成學生就業(yè)分析表。
數(shù)據(jù)清理。生成學生就業(yè)分析表工作要進行填補遺漏的數(shù)據(jù)值。
數(shù)據(jù)轉(zhuǎn)換。數(shù)據(jù)轉(zhuǎn)換中離散值屬性要占大多數(shù),連續(xù)值屬性并不多,只有個別的需進行離散化處理?,F(xiàn)將上述綜合成績屬性的屬性值化分為4類:成績從0~60分屬于“及格”,60~80分屬于“中”,80~90分屬于“良好”,90~100分屬于“優(yōu)”,性別兩類:男或女;參加公司培訓分為兩類:是或否;就業(yè)分為三類:工資在3000元以上為優(yōu)質(zhì)就業(yè),2000-3000元為普通就業(yè),2000元以下為一般就業(yè),無工作為待就業(yè)。增加參加公司培訓可以判斷優(yōu)質(zhì)就業(yè)的可信度。
數(shù)據(jù)消減。由于學生基本信息表和學生就業(yè)信息表中的屬性比較多,筆者為了便于分類挖掘,將籍貫、班級這兩個屬性進行刪除,原因是這兩個屬性與就業(yè)相關(guān)性不大,為了能夠保護學生的隱私,筆者將學生姓名屬性也刪除掉,從而生成新的學生就業(yè)分析表與轉(zhuǎn)換數(shù)據(jù)表。
參考文獻
[1]郭佳,陳春燕.數(shù)據(jù)挖掘技術(shù)在高校畢業(yè)生就業(yè)工作中的應用[J].中國科技信息,2008,14:67-69
[2]宮杰,譚躍生,李慧萍.數(shù)據(jù)挖掘技術(shù)在高校教務管理中的應用[J].科技信息,2010,13:56-60
作者簡介
王秀巖(1975-),黑龍江省望奎縣人,副教授。研究方向為計算機教法研究。
作者單位
科技信息論文范文第6篇
其次是研究領(lǐng)域不廣。從整個西北地區(qū)和西北各省區(qū)信息化研究主題分布來看,研究基本上深入了信息化所包括的各個部分,但在某些領(lǐng)域仍顯薄弱,例如,對于傳統(tǒng)工業(yè)改造中,煤炭、鋼鐵、石化、建材等傳統(tǒng)工業(yè)如何利用信息技術(shù)提升行業(yè)競爭力、轉(zhuǎn)變經(jīng)濟增長方式等方面的專門理論研究幾乎沒有。說明研究者對于這個問題還沒有給予充分的重視。再如信息安全、信息化環(huán)境等內(nèi)容,研究涉及的也很少。
再次是研究分布不均。在西北地區(qū)信息化理論、西北地區(qū)信息化進程、西北地區(qū)信息化實踐三者研究中有關(guān)理論和進程的文章較少,實踐的較多。有關(guān)整個西北地區(qū)信息化的研究少,但研究西北各省區(qū)信息化的論文相對較多。而從西北各省區(qū)信息化研究論文地區(qū)分布來看,新疆最多,青海最少。
、西北地區(qū)信息化研究展望
根據(jù)以上分析和判斷,西北地區(qū)信息化研究將會出現(xiàn)如下幾個方面的趨勢:
1.信息化與西北地區(qū)經(jīng)濟發(fā)展的研究將會繼續(xù)升溫。信息化在宏觀經(jīng)濟學研究中將成為重中之重,因為信息化直接關(guān)系中國經(jīng)濟發(fā)展的增長點及動力問題。這方面的論著將會增多,研究將會更加深入細化。如信息化與經(jīng)濟增長的理論聯(lián)系、信息化對經(jīng)濟發(fā)展的影響、經(jīng)濟信息化水平測算與發(fā)展模式等研究將會繼續(xù)升溫。同時隨著國家實施信息化戰(zhàn)略的進程,信息化的研究將會和更為具體的行業(yè)經(jīng)濟聯(lián)系起來,如煤炭、鋼鐵、石化、電力、建材等傳統(tǒng)工業(yè)在利用信息技術(shù)提升行業(yè)競爭力、轉(zhuǎn)變經(jīng)濟增長方式等方面的理論研究將會進一步細
化、具體。
2.信息化與西北地區(qū)城市發(fā)展的研究將會深入。從收集到的資料看,有關(guān)信息化與西北地區(qū)城市發(fā)展的研究幾乎沒有,而隨著我國城市發(fā)展的進程,信息化與城市發(fā)展論述將會增多。如信息化與城市化問題、城市信息化問題、信息產(chǎn)業(yè)與城市發(fā)展問題等研究應該有所增加。在以政府的發(fā)展規(guī)劃和城市發(fā)展一般趨勢為依據(jù)的前提下,這一方面的研究也會更加細致。如信息產(chǎn)業(yè)與城市發(fā)展、信息產(chǎn)業(yè)與城市經(jīng)濟發(fā)展、信息產(chǎn)業(yè)的空間發(fā)展及其對城市地域結(jié)構(gòu)的影響等問題研究者將會認真分析并提出對策建議。
3.信息資源開發(fā)及其配置問題的研究將會更加重視。雖然國家一直在積極進行信息資源的建設(shè),西北地區(qū)也在努力進行這一方面的建設(shè),但信息資源建設(shè)方面存在著重復建設(shè)、形式不規(guī)范、配置不合理、資源數(shù)據(jù)難以整合等現(xiàn)象。再加上信息資源運行機制的不合理及缺少政策支持,致使網(wǎng)上信息資源貧乏,共享困難。根據(jù)這些,信息資源及其配置問題的研究將會成為熱點,如良好的運行機制、評價標準,實現(xiàn)資源配置與共享的途徑和方法、知識產(chǎn)權(quán)與流通共享等問題的研究將會有更多的人關(guān)注。
4.信息化水平測度及標準化將會成為研究領(lǐng)域的熱點和難點。國家已出臺了一些信息化標準,但目前的工作只涉及網(wǎng)絡相關(guān)的技術(shù)標準,因此信息化的標準化工作還有很大的發(fā)展空間。而為了提高信息化建設(shè)的理性化和規(guī)范化,信息化的建設(shè)必須建立一套完整的評價系統(tǒng)。但從研究來看,西北地區(qū)的評價體系還不夠完善,今后這也是西北地區(qū)信息化研究的重要方向。同時,要逐步實現(xiàn)西北地區(qū)信息化的標準化和規(guī)范化管理。西北地區(qū)及西北各省區(qū)的信息化基礎(chǔ)設(shè)施建設(shè)、資源建設(shè)都必須要有一個統(tǒng)一的標準和規(guī)范。而且此標準的推廣、普及
將是未來標準化工作的重點。
5.欠發(fā)達地區(qū)信息化推廣研究將會進一步拓展。信息化不單純是一個技術(shù)問題,更是一個認識和觀念問題,西北貧困地區(qū)由于歷史和社會發(fā)展的原因,對信息化在社會發(fā)展中的地位和作用缺乏足夠的認識。所以,要推進西北地區(qū)的現(xiàn)代化,首先改變?nèi)藗兊目捶?提高認識,這是發(fā)展的前提和基礎(chǔ)。對于西北貧困地區(qū)而言,不管是當?shù)卣€是社會大眾,都應該充分認識到信息化在社會進步和社會發(fā)展中的重要地位和作用。信息化在一個社會發(fā)展中的作用和地位愈來愈顯著,現(xiàn)代化的進程首先是觀念的現(xiàn)代化,觀念現(xiàn)代化的前提則是信息化的推廣,這也是理論研究者要去做的。
參考文獻:
[1]梁春陽.西北地區(qū)信息化現(xiàn)狀的國際比較[J].圖書館理論與實踐,2004,(2):87-89.
[2]劉珙.西北地區(qū)信息化水平的定位與分析[J].情報資料工作,2004,(2):60-63.
[3]王海彬.不發(fā)達地區(qū)信息化問題[J].開發(fā)研究,2002,(2):37-39.
[4]史培軍,周武光.西北地區(qū)可持續(xù)發(fā)展的幾個關(guān)鍵問題[J].北京師范大學學報(人文社會科學版),2000,(5):130-140.
[5]中國科學院中國工程院.加快西北地區(qū)發(fā)展的幾個關(guān)鍵問題[J].地球科學進展,2000,(10):489-498.
[6]李雪慧.信息化與西北農(nóng)業(yè)發(fā)展[J].農(nóng)村經(jīng)濟,2003,(9):27-29.
[7]李惠蘭.甘肅農(nóng)村經(jīng)濟發(fā)展必須大力推進農(nóng)業(yè)信息化[J].甘肅農(nóng)業(yè),2005,(11):22-23.
[8]白明.信息+技能+資本=最大收益:新世紀農(nóng)民收入增長新模式[J].開發(fā)研究,2001,(5):37-39.
[9]謝忠民,王紅蕾.淺談新疆農(nóng)業(yè)信息化建設(shè)[J].新疆財經(jīng),1999,(4):22-23.
[10]張曉峰.西部地區(qū)中小企業(yè)信息化現(xiàn)狀及對策[J].CAD/CAM與制造業(yè)信息化,2003,(1):8-10.
[11]何彥平.寧夏中小型企業(yè)信息化建設(shè)的再認識[J].圖書館理論與實踐,2007,(4):131-133.
[12]李純英.對青海省企業(yè)信息化建設(shè)的思考[J].青海社會科學,2005,(9):58-60.
[13]巫江,史煜娟.甘肅企業(yè)管理信息化發(fā)展的思考[J].甘肅理論學刊,2002,(11):63-65.
[14]滕堂偉.論新型工業(yè)化進程的區(qū)域路徑與模式選擇———以西北民族地區(qū)為例[J].經(jīng)濟研究參考,2006,(67):33-39.
[15]付小妮.抓住契機積極推進西北民航的信息化建設(shè)[J].民航經(jīng)濟與技術(shù),2000,(6):58-59.
[16]宋雪飛.西北地區(qū)信息咨詢業(yè)的發(fā)展現(xiàn)狀及社會經(jīng)濟效益分析[J].發(fā)展,1998,(9):29-30.
[17]梁春陽.論西部地區(qū)信息服務業(yè)發(fā)展的投資取向[J].情報資料工作,2001,(5):57-59.
[18]李曉東.對制定西北物流業(yè)發(fā)展規(guī)劃的管理分析[J].甘肅省經(jīng)濟管理干部學院學報,2005,(9):40-43.
[19]黃智杰.甘肅省商務物流建設(shè)的基本框架研究[J].開發(fā)研究,2004,(1):68-69.
[20]龔海濤,張晟義.以涉農(nóng)供應鏈的成長促進新疆新型工業(yè)化:互動關(guān)系及現(xiàn)實基礎(chǔ)[J].新疆大學學報(哲學·人文社會科學版),2006,(7):5-9.
[21]李鳳虎.發(fā)展電子商務促進陜西開發(fā)[J].統(tǒng)計與信息論壇,2000,(11):63-65.
[22]徐燕.對新疆中小企業(yè)發(fā)展電子商務的思考[J].全國商情,2006,(5):33-34.
[23]余兆明,高玉琢.加快西部地區(qū)教育城域網(wǎng)的建設(shè)推動地方教育信息化的發(fā)展[J].中國科技信息,2007,(1):259-261.
[24]郭靖花.西北民族地區(qū)教育信息化發(fā)展探析———由正寧五頃原回族自治鄉(xiāng)信息技術(shù)教育發(fā)展所觀[J].甘肅聯(lián)合大學學報(自然科學版),2006,(9):79-82.
[25]王海燕,龍英艷.西北地區(qū)中小學教師信息素養(yǎng)現(xiàn)狀調(diào)查研究[J].現(xiàn)代教育技術(shù),2007,(4):58-64.
[26]張景春.復合圖書館與總館分館制西部公共圖書館事業(yè)的兩大增長點[J].圖書館理論與實踐,2002,(6):67-69.
[27]雷潤玲,賴伯年:數(shù)字圖書館建設(shè)與西北地區(qū)經(jīng)濟跨越式發(fā)展[J].情報雜志,2004,(8):42-44.
[28]曹臻.西北地區(qū)數(shù)字圖書館建設(shè)若干問題的探討[J].圖書館理論與實踐,2005,(2):103-104.
[29]張彬.民族地區(qū)行政環(huán)境與電子政務建設(shè)[J].內(nèi)蒙古大學學報(人文社會科學版),2004,(7):34-37.
[30]王利清,張建新.民族區(qū)域自治地方電子政務建設(shè)現(xiàn)狀與對策[J].內(nèi)蒙古農(nóng)業(yè)大學學報(社會科學版),2007,(3):61-63.
[31]馮玉才.電子政務也要國產(chǎn)貨[J].軟件世界,2006,(8):65-66.
[32]常紅,黃玉花.關(guān)于開發(fā)利用我國西北地區(qū)地理信息資源的思考[J].西北師大學報(社會科學版),1999,(3):100-102.
[33]劉斌,辛海強.新疆基礎(chǔ)地理信息庫建設(shè)構(gòu)想[J].測繪通報,2002,(9):51-54.
[34]唐志榮.星火農(nóng)村信息服務體系[J].甘肅農(nóng)業(yè),2003,(9):34-35.
[35]張照云.青??萍夹畔㈤_發(fā)利用之障礙分析及對策研究[J].青??萍?2001,(2):49-51.
[36]馬春贊.談陜西地市級科技信息網(wǎng)絡的建立與發(fā)展[J].情報雜志,1998,(1):86-87.
科技信息論文范文第7篇
關(guān)鍵詞:系統(tǒng)科學理論 圖書情報學定律 知識組織 系統(tǒng)論 控制論 信息論 協(xié)同論 耗散結(jié)構(gòu)理論 突變論
中圖分類號: G254.29 文獻標識碼: A 文章編號: 1003-6938(2013)06-0001-07
1 引言
科學研究需要有科學的理論和方法來支撐,對于每一項研究也需要科學的理論來升華和詮釋、需要借助科學的方法來實現(xiàn)。就知識組織研究而言,欲獲得高效知識服務需要來自于科學理論指導知識組織,需要科學的方法實現(xiàn)知識組織。長期以來支撐著知識組織研究的除了圖書情報學中一些定律之外,還涉及與數(shù)學密切關(guān)聯(lián)的理論和方法,尤其是系統(tǒng)科學中一些重要理論對知識組織研究與實踐都有著很大的指導意義和解惑作用。應該說,這些理論和方法促進了知識組織研究與實踐的快速發(fā)展和完善。
長期以來,在圖書情報領(lǐng)域,學者非常注重應用性研究、方法性研究、技術(shù)性研究以及解決圖書情報工作中實際問題的研究,在理論研究方面或者說研究理論對研究的指導作用、理論對研究對象的科學闡釋相對較少。例如,筆者對CNKI檢索,發(fā)現(xiàn)學界在科學理論對知識組織的理論價值、指導作用等方面的研究尚缺乏系統(tǒng)和深入。因此,迫切需要這樣的探討來改進和提升知識組織效率和水平,從而提升知識服務的效率。
早在20世紀80年代,劉植惠教授就對系統(tǒng)科學理論在情報學研究中的應用進行了系列講座[1-2],探討了這些理論對圖書情報學研究中的指導作用和有關(guān)應用問題;王知津教授等于2009年出版的《知識組織理論與方法》[3],主要探討了網(wǎng)絡環(huán)境下知識組織的學科基礎(chǔ)、基本原理、方法與技術(shù),以及新概念、新理論和新工具等問題,但尚缺乏深入的知識組織的理論探討;柯平教授等[4]從知識資源論的角度研究了圖書館學基礎(chǔ)理論體系的三層結(jié)構(gòu);周文芳等[5]從系統(tǒng)論的角度論述知識組織的構(gòu)建原理;李紅春[6]根據(jù)系統(tǒng)論的原理探討了知識組織中的分類系統(tǒng)和主題系統(tǒng);雷會珠等[7]利用耗散結(jié)構(gòu)理論等信息資源系統(tǒng)中的信息自組織與熵值變化進行了探索。
此外,在圖書情報學理論與實踐研究方面也有一些代表性的相關(guān)成果。如,武漢大學馬費成教授在情報理論方面從事過大量的研究,其中最突出的貢獻凝聚他2008年出版的專著《IRM-KM范式與情報學發(fā)展研究》[8]中,他從知識網(wǎng)絡演化及知識網(wǎng)絡中的群體行為等方面,提煉出情報學的六個基本原理(離散分布原理、有序性原理、相關(guān)性原理、易用性原理、小世界原理、對數(shù)透視原理),這些理論對知識組織研究有很大的指導作用;邱均平教授早在1988年就從文獻計量學角度深入探討了布拉德福定律、齊普夫定律、洛特卡定律等,并對這些理論在文獻計量學中的應用做了大量闡述[9],其后20多年他借助這些理論從事了大量的應用研究;中國科技信息所的化柏林博士提出了適合于以信息、知識、情報為對象的三動論(序化論、轉(zhuǎn)化輪、融合輪)思想 [10], 主要探討了資源的空間分布、資源轉(zhuǎn)化和資源互操作的理論思想;武漢大學董慧教授等從本體演化角度,結(jié)合邏輯學、圖論等理論,構(gòu)建了一個以本體、本體分子為核心的知識組織動態(tài)模型[11];溫有奎教授、焦玉英教授從范疇論角度對知識對象的進行了描述,并構(gòu)建了范疇知識單元信息模型 [12]。
國外雖然也有大量關(guān)于知識組織理論與方法上的研究,但真正涉及科學理論與知識組織緊密聯(lián)系的詮釋也不多見。如,Judit Bar-Ilan等[13]從認知理論出發(fā),根據(jù)兒童特點研究了網(wǎng)絡知識資源如何適合兒童,并構(gòu)建了適合于兒童使用Web的知識構(gòu)建模型;Alon Friedman[14] 結(jié)合知識表示、語言學模型和概念理論的知識組織方法,提出了一個融合兩者優(yōu)點的綜合知識組織模型;Richard P[15]基于Idea Collider 信息解組合重構(gòu)理論,提出了在知識檢索和分類中,需區(qū)分相對于“常識知識”的“多元知識”的理念。
無論是國內(nèi)還是國外,學者很少涉及科學理論的機理(尤其是系統(tǒng)科學中一些橫斷理論與方法)研究知識組織的理論價值,確切的說是技術(shù)與方法的研究,欲使知識組織更加科學合理,必須將科學理論融入知識組織研究中,用科學的理念指導知識組織研究與實踐,從而促進知識組織理論框架的完善。
2 系統(tǒng)科學理論與知識組織
知識組織不同于信息組織,它更強調(diào)數(shù)據(jù)間的有機關(guān)聯(lián),通過數(shù)據(jù)間的聯(lián)系從而形成相關(guān)知識。所以,知識組織更關(guān)注知識組織的結(jié)構(gòu)和系統(tǒng)性,強調(diào)數(shù)據(jù)質(zhì)量控制和數(shù)據(jù)流程管理,注重數(shù)據(jù)關(guān)聯(lián)的平衡性和穩(wěn)定性,重視知識間關(guān)系的協(xié)同作用,發(fā)現(xiàn)知識組織中的特殊規(guī)律等,都需要相關(guān)的理論來支撐和解釋。作為系統(tǒng)科學理論中的“老三論”、“新三論”對一切科學都有著重要的指導作用,同樣對知識組織研究過程中一些問題和現(xiàn)象也能夠進行科學的闡釋和有效地引導。
2.1 系統(tǒng)論與知識組織
中國大百科全書認為:系統(tǒng)論(System Theory)是研究系統(tǒng)思想和系統(tǒng)方法的哲學理論。它包括三部分內(nèi)容:系統(tǒng)的科學(或稱數(shù)學系統(tǒng)論)、系統(tǒng)技術(shù)論(包括系統(tǒng)工程)和系統(tǒng)哲學[16]。從圖書情報學或信息學角度闡釋系統(tǒng)論,認為它是研究系統(tǒng)一般模式、結(jié)構(gòu)和規(guī)律的理論,是研究各類系統(tǒng)的共同特征,并用數(shù)學方法定量描述其功能,尋求并確立適用于一切系統(tǒng)的原理、原則和數(shù)學模型,是具有邏輯和數(shù)學性質(zhì)的一門新興科學[17]。
從系統(tǒng)論角度出發(fā),任何事物都具有整體性、關(guān)聯(lián)性、動態(tài)平衡性,以及具有等級結(jié)構(gòu)、時序性和可延續(xù)性。我們不僅要利用系統(tǒng)論的思想和方法去認識事物的規(guī)律和特征,更重要的是借助所認識的規(guī)律和特征去創(chuàng)造新事物、管理新事物,使事物達到最優(yōu)化。
借助系統(tǒng)論思想,我們可以把知識服務系統(tǒng)中的知識資源看成一個整體,利用系統(tǒng)論的事物(知識資源)都具有關(guān)聯(lián)性的思想,認識到孤立的數(shù)據(jù)不能成為知識。這一思想指導我們必須尋找知識或數(shù)據(jù)間的聯(lián)系,并把這些聯(lián)系上升為語義關(guān)系,保證經(jīng)過關(guān)聯(lián)的知識和數(shù)據(jù)的知識總量高于知識資源內(nèi)個體知識之和。
系統(tǒng)論的系統(tǒng)內(nèi)部事物的動態(tài)平衡性思想可以指導我們在進行語義網(wǎng)絡構(gòu)建時,注重語義網(wǎng)絡的平衡性,在知識聚類過程中,要保持各類元素的平衡,切忌出現(xiàn)大量的孤立點(或元素很少的類)和稠密網(wǎng)絡(元素很多的類),這樣既可以避免在進行知識查詢時命中很少的結(jié)果而不能滿足需求,也可以避免命中大量的結(jié)果而加重用戶篩選結(jié)果的負擔。
在知識組織的分類系統(tǒng)和詞表系統(tǒng)中,其體系的層次結(jié)構(gòu)和詞匯間的屬分關(guān)系,充分印證了系統(tǒng)論中所認為的事物的等級結(jié)構(gòu)之特征。而系統(tǒng)論的這一思想對知識分類體系的建立和詞表構(gòu)建都具有指導意義。同樣,系統(tǒng)論中事物的時序性思想,對進行知識組織中的文獻鏈結(jié)構(gòu)和用戶行為知識的組織都具有非常重要的參考價值。
2.2 控制論與知識組織
中國大百科全書對控制論(Control Theory,Cybernetics)的定義是:研究生命體、機器和組織的內(nèi)部或彼此之間的控制和通信的科學[18]。我們可以理解為,控制論是關(guān)于工程系統(tǒng)、生命系統(tǒng)和社會系統(tǒng)等領(lǐng)域中有關(guān)反饋現(xiàn)象和控制機制共同理論的一門學科??刂普摰闹髦妓枷胧?,通過反饋機制,采用系統(tǒng)方法或過程方法對復雜事物或現(xiàn)象進行控制,通過調(diào)節(jié)使被控對象達到預定目標。因此,作為一門橫斷理論的控制論,其理論幾乎可以應用于任何復雜過程。
在知識組織領(lǐng)域,控制論可以全面運用于數(shù)據(jù)的質(zhì)量控制、數(shù)據(jù)和知識生產(chǎn)流程控制,并借助控制論基本原理解決知識組織過程中大量復雜問題。例如,在進行知識組織的架構(gòu)時,需要針對系統(tǒng)的服務目標,借助控制論的系統(tǒng)分析方法,辨識數(shù)據(jù)或知識間的關(guān)系,使知識的關(guān)聯(lián)達到最優(yōu)化;在數(shù)據(jù)組織與操作過程中,控制論可以將人們對數(shù)據(jù)組織的計劃、組織、激勵、領(lǐng)導等職能與糾正工作中偏差緊密結(jié)合起來,使數(shù)據(jù)的管理工作形成一個有機的系統(tǒng),以確保對數(shù)據(jù)質(zhì)量的有效控制。
總之,強調(diào)系統(tǒng)方法、過程方法和微觀調(diào)整的控制論,在知識組織的實施中發(fā)揮著重要作用。具體而言,控制論指導人們對數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)關(guān)聯(lián)所進行的宏觀控制思想,為實現(xiàn)知識服務目標提供了保證;過程化的控制思想對數(shù)據(jù)加工處理環(huán)節(jié)的數(shù)據(jù)質(zhì)量控制、加工處理環(huán)節(jié)的時間、進度等控制,為知識組織工程的時間、進度和質(zhì)量的控制提供了有效地理論與方法;為了對事物有效控制,控制論還強調(diào)反饋和調(diào)節(jié)功能,在知識組織的一些細節(jié)中,通過系統(tǒng)使用或測試的反饋信號,加強了對數(shù)據(jù)或知識間關(guān)系的調(diào)節(jié),確保知識的組織能夠提供更為有效的知識服務。
2.3 信息論與知識組織
信息論(Information Theory)是利用數(shù)學的方法來討論信息本質(zhì)、信息度量、信息識別和信息傳遞與交換共同規(guī)律的科學理論。正如中國大百科全書對信息論定義所述:信息論是研究信息的表示、傳輸、處理、存儲和利用的理論科學。它的經(jīng)典內(nèi)容包括信息的數(shù)量定義(信息量)、信道容量、信源和信道編碼以及信息失真率理論等[19]。由此可見,知識組織所涉及的知識表示、知識傳遞、知識的處理與存儲、知識的利用等研究與實踐,都可以得到信息論思想的指導,并促進知識組織研究的升華。
信息論將信息描繪成在現(xiàn)實世界中客觀、廣泛地存在著的對象,信息空間充斥著大量雜亂無章的信息子,當信息子有規(guī)律的排布時,就會產(chǎn)生能量,這些能量經(jīng)過傳遞就會使確定的事件發(fā)生。而知識組織正是遵循這一原理,將數(shù)據(jù)或信息(可比做信息子)有機聯(lián)系,建立數(shù)據(jù)、信息之間的語義關(guān)系后,就可能確定知識或產(chǎn)生新的知識,當這些知識傳遞給人們解決問題時,就激發(fā)出知識的能量。
知識組織的一個重要因素就是將數(shù)據(jù)進行關(guān)聯(lián)后,使之能夠進行推理獲得知識,以滿足知識服務的要求。信息論中所述信息子的摩擦碰撞產(chǎn)生能量,信息子的排布形式?jīng)Q定事件的性質(zhì),這一信息論機制非常雷同于知識組織中數(shù)據(jù)倉庫的數(shù)據(jù)間的多維聯(lián)系、本體結(jié)構(gòu)數(shù)據(jù)間的語義關(guān)系,這種聯(lián)系與關(guān)系完全可視為信息子的碰撞和排列,其產(chǎn)生的知識恰恰可視為解決問題的能量。
信息論思想告訴我們,知識系統(tǒng)內(nèi)部存在著大量知識熵,為了控制知識熵的增長,我們必須將知識系統(tǒng)內(nèi)的知識序化,也就是進行有效地知識組織。信息論有助于我們?nèi)ヌ剿髦R組織的本質(zhì),去觀察知識組織中的全新世界,讓我們跳出傳統(tǒng)的數(shù)據(jù)組織思想去建立一個全新的知識組織領(lǐng)域,促使系統(tǒng)提升了知識服務的能力,為我們構(gòu)造出更加高效的知識服務系統(tǒng)提供理論基礎(chǔ)。
2.4 耗散結(jié)構(gòu)理論與知識組織
耗散結(jié)構(gòu)理論(Dissipative Structure Theory)是指“尋求系統(tǒng)在非平衡狀態(tài)下形成穩(wěn)定有序結(jié)構(gòu)的條件和機制,探索自組織過程的一般原理的理論”[17]。在知識組織過程中,無論是知識聚類、分類,還是語義網(wǎng)絡的構(gòu)建,亦或數(shù)據(jù)倉庫的組織等,均存在大量非平衡狀態(tài),而這些知識組織體系本身就潛在著穩(wěn)定的有序結(jié)構(gòu),我們需要認識這些有序結(jié)構(gòu)形成的條件和機制,完成這些知識組織結(jié)構(gòu)的自組織過程。
典型的耗散結(jié)構(gòu)需具備四個基本特征:系統(tǒng)的開放性、系統(tǒng)的非平衡性、系統(tǒng)與外界物質(zhì)和能量的可交換性、系統(tǒng)的自組織性。也就是說,具有耗散結(jié)構(gòu)的系統(tǒng)必定能和外界進行某種交換,孤立或封閉的系統(tǒng)不可能產(chǎn)生耗散結(jié)構(gòu);其次,耗散結(jié)構(gòu)是遠離平衡態(tài)的,平衡態(tài)或衡態(tài)都不可能將已有的有序走向更高級的有序,只有遠離平衡的開放系統(tǒng),通過與外界進行物質(zhì)與能量交換時,所積聚的能量達到某個臨界值將會引起突變,形成穩(wěn)定有序的結(jié)構(gòu);第三,耗散結(jié)構(gòu)具有自組織能力,這種自組織能力使系統(tǒng)具有柔韌性和魯棒性,具備抗拒外界的干擾能力,確保系統(tǒng)走向自我完善。
因此,知識組織可視為一種耗散結(jié)構(gòu),如何借助耗散結(jié)構(gòu)理論促進知識組織的穩(wěn)定有序、提升知識組織的知識服務能力,需要將耗散結(jié)構(gòu)理論充分運用于知識組織的研究中。知識組織是一個開放并遠離平衡的系統(tǒng),它需要外部知識的介入,語義關(guān)系的鏈接激活了知識,隨著內(nèi)外部知識交換的頻繁,新的知識大量增生,產(chǎn)生了質(zhì)變,構(gòu)成了自成一體的知識組織系統(tǒng),形成了知識組織的耗散結(jié)構(gòu),為實現(xiàn)理想的知識服務提供了保證。
隨著社會、文化和科學技術(shù)的發(fā)展,原有知識體系將不斷被新生知識所取代,如果原有知識組織不更新,很快就會衰退到惰性的平衡,又從有序走向無序。所以,欲保證知識組織對知識服務的持續(xù)有效性,需要不斷加強內(nèi)外部的能量(數(shù)據(jù)、知識、關(guān)系)交換,增添新的知識和語義關(guān)系,使知識組織處在有序—無序—有序的轉(zhuǎn)化過程中,保證知識服務系統(tǒng)始終處于高效的活動狀態(tài)。
如此看來,知識組織雖然是一種耗散結(jié)構(gòu),但仍需要在耗散結(jié)構(gòu)理論指導下不斷提升和完善,只有這樣才能在知識服務中發(fā)揮更大作用。
2.5 協(xié)同論與知識組織
協(xié)同論也稱協(xié)同學(Synergetics)或協(xié)和學,是研究系統(tǒng)從無序到有序轉(zhuǎn)變規(guī)律和特征的一種理論方法。它是研究系統(tǒng)中子系統(tǒng)之間怎樣合作產(chǎn)生宏觀的空間結(jié)構(gòu)、時間結(jié)構(gòu)或功能結(jié)構(gòu)的[16]。協(xié)同論認為,盡管各子系統(tǒng)之間千差萬別,但它們在一個大的系統(tǒng)下,依然存在相互影響、相互配合以及相互作用的關(guān)系,也存在著相互干擾、相互制約等因素。因此,協(xié)同學研究的任務就是,探索人類社會各類系統(tǒng)共同本質(zhì),研究它們發(fā)展演變的共同規(guī)律,以及尋求它們之間的協(xié)作機理。
協(xié)同論所研究的對象在知識組織的研究中大量存在,信息聚類組織時依賴的是信息的主題,而同一主題的信息我們可以看作是這些信息所具有的共同本質(zhì)。在關(guān)聯(lián)信息的組織時,相關(guān)聯(lián)的數(shù)據(jù)可能會相互影響、相互作用,甚至是相互制約。將信息的這種影響或制約關(guān)系加以描述并組織起來,可使信息上升為能夠提供知識服務的知識,實際上這就是協(xié)同論中所闡述的系統(tǒng)從無序轉(zhuǎn)變?yōu)橛行?。然而,協(xié)同學的思想更希望我們?nèi)ふ倚畔㈥P(guān)聯(lián)前后信息轉(zhuǎn)化為知識的轉(zhuǎn)變規(guī)律和特征。
協(xié)同學應用于知識組織告訴我們這樣一個道理,孤立的數(shù)據(jù)或一個個數(shù)據(jù)個體可能價值很小甚至沒有價值,但是數(shù)據(jù)“協(xié)同”(關(guān)聯(lián))起來,卻能展現(xiàn)出數(shù)據(jù)中隱藏的大量知識,也就是說“協(xié)同”可以幫我們找到了數(shù)據(jù)中大量的“客觀性質(zhì)”。因此,在知識組織中,我們應當借助協(xié)同學思想,針對知識服務的目的和要求,建立探索數(shù)據(jù)間各類關(guān)系的機制,解決知識組織中的復雜問題,更有效地開展知識服務。
2.6 突變論與知識組織
突變是指事物發(fā)展過程中的間斷或突然轉(zhuǎn)換的現(xiàn)象,從理論角度探討突變,就是用數(shù)學的方法研究自然界中事物發(fā)生演變出現(xiàn)的不連續(xù)現(xiàn)象。如,中國大百科全書認為:突變論(Catastrophe Theory)是描述自然界中發(fā)生的各種突變現(xiàn)象的數(shù)學理論[20]。突變論使我們對人類許多社會現(xiàn)象的發(fā)展變化有了更深刻的理解,為我們戰(zhàn)勝愚昧和無知提供了新的武器。突變理論使事物發(fā)生的質(zhì)變或飛躍(革命性的變化)有了科學的解釋依據(jù)。例如,互聯(lián)網(wǎng)的急劇膨脹,網(wǎng)絡地址資源遠遠不能滿足互聯(lián)網(wǎng)發(fā)展的需要,并制約了互聯(lián)網(wǎng)的發(fā)展,使接近崩潰邊緣的互聯(lián)網(wǎng)處于極不穩(wěn)定狀態(tài),需要一種網(wǎng)絡技術(shù)的革命性變化(突變)使互聯(lián)網(wǎng)達到一種新的平衡,所以新一代互聯(lián)網(wǎng)技術(shù)完成了互聯(lián)網(wǎng)發(fā)展歷程中的突變。
信息組織同樣也經(jīng)歷過面臨從量變到質(zhì)變的突變過程。從二次文獻信息到全文信息、從文本信息到多媒體資源都帶來信息存儲技術(shù)、信息獲取技術(shù)躍變和質(zhì)變。目前,在大數(shù)據(jù)和云計算環(huán)境下,數(shù)據(jù)的組織更是發(fā)生了巨大的變化,大數(shù)據(jù)產(chǎn)業(yè)的出現(xiàn),數(shù)據(jù)的計算已由GB級的計算上升到TB、PB甚至YB級 的度量,信息組織架構(gòu)已不再局限于某個局部,而是拓展到全球,形成大區(qū)域甚至全球協(xié)作戰(zhàn)略。
在知識服務環(huán)境下,隨著知識服務需求的不斷提升,知識組織也將會發(fā)生突變,如何應對這種突變?如何控制需求變化帶來的知識組織的突變?我們可以借鑒突變論中應對突變現(xiàn)象的數(shù)學方法,對知識組織由于知識服務需求帶來的突變進行有效的控制和科學應對。首先,我們可以針對知識服務要求分析刻畫知識需求參數(shù)和滿意度控制參數(shù);其次,進行知識標引并建立知識間的關(guān)聯(lián)關(guān)系,構(gòu)造知識間的勢函數(shù);第三,分析關(guān)聯(lián),構(gòu)建實現(xiàn)平衡態(tài)的知識空間;第四,研究知識空間到知識需求參數(shù)間的投影,確定知識需求可能發(fā)生的變化??傊谕蛔冋摰闹笇?,知識組織研究與實踐可以迅速適應用戶知識需求的不斷升級和變化。
3 圖書情報學相關(guān)定律與知識組織
圖書情報學是研究事實、數(shù)據(jù)、信息、知識和情報的產(chǎn)生及其有效收集、組織、存儲、傳遞、轉(zhuǎn)換和利用規(guī)律,并運用科學技術(shù)手段對其進行有效的管理和利用的一門科學[17]。因此,圖書情報學中的定律注重探索信息、知識的活動特征,強調(diào)探究信息、數(shù)據(jù)中有價值情報的規(guī)律。著名的圖書情報學基本定律(布拉德福定律、齊普夫定律、洛特卡定律)雖然是針對文獻、詞匯以及作者和文獻關(guān)系給出的一般性規(guī)律,但同樣對知識的組織有很大的指導意義。另外,在圖書情報學中廣為應用、闡述社會網(wǎng)絡的小世界理論也對知識組織研究有著啟示作用。
3.1 布拉德福定律與知識組織
布拉德福定律(Bradford’s Law or Bradford’s Distribution)是英國文獻學家、化學家布拉德福先生[17]創(chuàng)立的,主要描述文獻分散規(guī)律的經(jīng)驗定律。布拉德福定律認為,如果按科技期刊刊載某專業(yè)論文的數(shù)量多少,以倒序排列,則可以分出一個核心區(qū)和相應的幾個區(qū),每個區(qū)的論文數(shù)量相等,則核心區(qū)期刊數(shù)量和相繼區(qū)期刊數(shù)量成1:n:n2 …的關(guān)系(n>1)[17]。布拉德福定律用專業(yè)文章數(shù)量的多少確定期刊核心區(qū)的概念,雖然這一定律不一定適合當今選擇核心期刊,但他的這一思想?yún)s對當今選擇核心期刊仍有很大的指導作用。
布拉德福定律的主要思想告訴我們,文獻有相對集中和普遍分散兩個方面,這一思想對開展知識組織研究同樣具有幫助作用。我們可以將文獻分散原理應用于知識組織的信息聚類研究中,聚類核心區(qū)的思想可以指導我們確定閾值,從而幫助我們確定類的規(guī)模。另一方面,無論是知識倉庫還是知識庫,亦或本體數(shù)據(jù)組織,都存在著知識點的集中和分散規(guī)律。布拉德福定律可以指導我們?nèi)グl(fā)現(xiàn)知識點的集中區(qū),了解分散的知識點,這些信息可以幫助我們更科學有效的構(gòu)造各類知識庫的邏輯結(jié)構(gòu)。
布拉德福定律強調(diào),對于某一專業(yè)領(lǐng)域的論文通常分布在眾多期刊中,雖然有少量的期刊刊載了較多的該專業(yè)領(lǐng)域論文,但仍存在大量的論文分散在眾多的期刊中,而這一經(jīng)驗總結(jié)提示我們,每一學科都有本學科重要知識點的關(guān)鍵詞,也有其他學科知識點的關(guān)鍵詞散落在自己學科,這就提醒我們在進行相關(guān)知識庫組織時,對散落在不同學科的知識點(關(guān)鍵詞)做好學科關(guān)聯(lián)處理,并確定關(guān)鍵詞的主要學科,以保證我們可以通過關(guān)鍵詞的學科關(guān)聯(lián)關(guān)系發(fā)現(xiàn)交叉學科,尋找學科新的增長點,以此為學科規(guī)劃提供知識服務。
3.2 齊普夫定律與知識組織
齊普夫定律(Zipf’s Law)是美國學者G.K.齊普夫于20世紀40年代提出的關(guān)于詞匯在文獻中出現(xiàn)頻次的分布規(guī)律,也稱詞頻分布定律、最省力法則、齊氏分布定律。齊普夫定律的主要思想:如果把文獻中詞的頻率(f)從高至低遞減排序,并用自然數(shù)給這些詞編上等級序號(r),則有 f r=C(C為常數(shù))。這個定律與80/20規(guī)律有異曲同工之效。這條定律提示我們做任何事情盡可能以較少的付出去獲得較大的收益。當然,這條定律并不是暗示我們“偷工減料”,而是指導我們?nèi)绾卫檬挛锏目陀^規(guī)律,發(fā)現(xiàn)可能產(chǎn)生較大影響的并較為“省力”部分作為重點突破,以后再向全局突破。
在知識組織研究中,我們可以依照這條定律的原則,歸納出社會對知識服務的需求,并分析用戶對各類知識服務需求的渴望程度,再根據(jù)分析結(jié)果針對相應的知識組織的難易程度、工作量大小,選擇率先建設(shè)的知識組織系統(tǒng)。例如,根據(jù)用戶使用信息系統(tǒng)的行為信息,分析大家關(guān)注的領(lǐng)域,并針對這些領(lǐng)域率先構(gòu)建相關(guān)知識庫。如,知識點鏈接知識庫、用戶行為推薦知識庫以及相關(guān)主題的知識倉庫,以后逐漸擴大知識庫的構(gòu)建領(lǐng)域。再如,該定律提示我們可以針對國家、地區(qū)或企業(yè)關(guān)注的領(lǐng)域,選擇重點建設(shè)相關(guān)知識庫,確保知識服務能夠首先和國家、地區(qū)重點關(guān)注的問題緊密結(jié)合起來。
在具體的知識組織方面,我們可以根據(jù)齊普夫定律將知識組織體系中工作量大小以及各項數(shù)據(jù)組織工作在知識服務中影響的大小分別進行排列,并權(quán)衡工作量大小和知識服務中發(fā)揮作用大小選取先進行的工作,使知識組織工作達到效率和效果的平衡。例如,在語義關(guān)系的構(gòu)建工作中,我們可以花費較小的力氣建立實體間的簡單關(guān)系,那些大量的復雜語義關(guān)系可以交給計算機實現(xiàn),計算機根據(jù)人們設(shè)計的推理算法就可以完成各種復雜關(guān)系的組合。這恰恰是最省力法則的精髓。
3.3 洛特卡定律與知識組織
洛特卡定律(Lotka’s Law)揭示了科學研究人員數(shù)量與所著文獻數(shù)量之間的關(guān)系,認為發(fā)表兩篇論文的作者數(shù)量是發(fā)表1篇論文作者數(shù)量的1/4,發(fā)表3篇論文的作者數(shù)量是發(fā)表1篇論文作者數(shù)量的1/9,如此類推,發(fā)表N篇論文的作者數(shù)量是發(fā)表1篇論文作者數(shù)量的1
n2 [17]。洛特卡定律又稱倒平方定律,描述了科學生產(chǎn)率的經(jīng)驗規(guī)律,是美國學者A.J.洛特卡于20世紀20年代提出的。
洛特卡定律并未有涉及知識組織領(lǐng)域,但該定律能否符合知識表達上的一些規(guī)律,確切的說,在學術(shù)成果的影響上是否遵循這一規(guī)律。我們做了實驗,三年以后,沒有被引用的論文是被引一次論文的4倍,被引2次的論文是沒有被引過論文的1/9,如此下去,基本符合洛特卡定律的倒平方定律。這一規(guī)律的出現(xiàn)為我們構(gòu)建引文索引的數(shù)據(jù)結(jié)構(gòu),計算文章發(fā)表后的知識量提供了一個非常有效的途徑。
同樣,洛特卡定律也為我們探索知識詞庫中使用詞的規(guī)律,發(fā)現(xiàn)常用詞匯以及分析各詞匯在知識服務中的貢獻(熱詞)提供了新的思路,我們曾經(jīng)對文章中漢語詞匯的分布情況進行了探索,發(fā)現(xiàn)漢語詞匯在文章中呈現(xiàn)洛特卡現(xiàn)象[21] 。這一結(jié)論為我們更加科學有效地構(gòu)建知識詞庫提供了新的依據(jù),為知識服務系統(tǒng)在分析用戶行為用詞上提供更加科學的方法。在引文知識組織中,洛特卡定律為我們構(gòu)建作者知識庫,探求核心作者群提供了新的思路。
3.4 小世界理論與知識組織
小世界理論(Small world theory)也稱為六度分割理論(Six Degrees of Separation theory),它來自數(shù)學領(lǐng)域的猜想和社會學領(lǐng)域的實驗。六度分割概念始自于1929年的一則小故事。匈牙利作家Frigyes Karinthy在這個小故事里論斷,地球上任何兩個人都可以通過一條由5位聯(lián)系人組成的鏈條聯(lián)系起來[17]。也就是說,世界上任何兩個人,均可以通過不超過6個人建立聯(lián)系或搭上關(guān)系。即,一個人預想結(jié)識世界上任何一個陌生人,可通過自己所熟識的那個可能認識這個陌生人的人去結(jié)識他,這個熟識的人再通過他所熟識的、可能更靠近那個陌生人的人,依此聯(lián)系不斷進展,這個人可能最多經(jīng)過6個人就可能和那個陌生人搭上關(guān)系。這個故事后來成為數(shù)學家的猜想,也得到社會學家的實驗證明[17]。六度分割理論讓世界變“小”,所以也被人們稱為“小世界理論”。
六度分割理論并非是準確的兩個人之間需通過6個人才能建立聯(lián)系,隨著現(xiàn)代人類社會交往的密切,網(wǎng)絡的普及而增添了更多的交往渠道,人類關(guān)系聯(lián)系更加緊密,可能會使人類的聯(lián)系鏈更短。但無論怎樣,它卻說明了一個問題,世界上任何事物都存在或近或遠的聯(lián)系,這種聯(lián)系為我們建立信息、數(shù)據(jù)間的關(guān)聯(lián)提供了理論依據(jù),也為我們建立語義網(wǎng)實現(xiàn)推理性知識服務打下基礎(chǔ)。
既然人與人之間通過聯(lián)系鏈總能找到某種聯(lián)系,那么數(shù)據(jù)、信息、知識也一定存在某種關(guān)聯(lián)。小世界現(xiàn)象在學術(shù)文獻間的引用網(wǎng)絡、知識間的語義網(wǎng)絡、詞匯(主題詞表或敘詞表中)間語詞關(guān)系網(wǎng)絡、作者合作研究網(wǎng)絡、研究主題的交叉網(wǎng)絡等都有很深刻的體現(xiàn)。如果我們把每篇文獻、每一個詞匯、每一位作者、每一個主題等看作是一個網(wǎng)絡的節(jié)點,并根據(jù)關(guān)聯(lián)關(guān)系實現(xiàn)兩者之間的聯(lián)系,構(gòu)成的網(wǎng)絡就是一種小世界現(xiàn)象。
小世界理論的世界事物都存在關(guān)聯(lián)的思想,為我們在尋找數(shù)據(jù)間關(guān)聯(lián)提供了依據(jù),使我們清楚的認識到,數(shù)據(jù)、信息或知識在關(guān)聯(lián)或傳遞中不斷提升其價值。將數(shù)據(jù)、知識間的關(guān)系有效地組織,將會大大提升知識服務系統(tǒng)的服務效率。因此,我們可以借助小世界理論,建立復雜網(wǎng)絡,并通過復雜網(wǎng)絡中數(shù)據(jù)間的關(guān)聯(lián),進行數(shù)據(jù)挖掘和深度分析,發(fā)現(xiàn)新的知識,提供解決問題的素材、知識和方案。
當然,在圖書情報學領(lǐng)域?qū)π∈澜缋碚撨\用還處在初步階段,在知識組織領(lǐng)域中還需要我們進一步研究。例如,小世界理論只給出了人與人之間的一般聯(lián)系,并沒有強調(diào)人與人之間的關(guān)系程度,實際上人與人之間的關(guān)系強度在人的交往中是非常重要的一個方面,可能決定兩人合作事件的走向。這也提示我們,知識間的聯(lián)系也有強弱關(guān)系,這種強弱關(guān)系可能會影響我們對知識網(wǎng)絡中的知識發(fā)現(xiàn),因此我們可以設(shè)定一個閾值屏蔽數(shù)據(jù)或知識間的一些弱關(guān)系,將強關(guān)系凸現(xiàn)出來,這也就是要求我們在知識組織方面如何區(qū)別關(guān)系的強弱問題。
再者,在小世界理論中,只強調(diào)人與人之間存在聯(lián)系鏈,但人與人之間具體有什么關(guān)系并沒凸顯。例如,一位社會學家為證實小世界現(xiàn)象,進行一項連鎖信件實驗,讓發(fā)件人把信件傳給其他城市的陌生人,每一位發(fā)信人將信件發(fā)給自己熟識并認為最有可能認識目標人的人,最終信件經(jīng)過不到6個人到達了陌生的收信人手中[17] 。這一實驗說明小世界現(xiàn)象并沒有改變?nèi)伺c人之間的原有關(guān)系,傳遞的信息并沒有得到升華。因此,在知識組織研究中我們必須認識到,知識間的關(guān)系是普遍存在的,如果欲實現(xiàn)知識升華,在知識服務中發(fā)揮更大效能,需要建立知識間語義關(guān)系。
小世界現(xiàn)象在知識組織中還有一個方面需要注意,在人的傳遞網(wǎng)中,忽略了關(guān)系鏈中兩人互逆問題。如,某人有兩個朋友A和B,分別支撐著此人的前后朋友鏈,但A、B兩人矛盾很深,如果此人將這兩個朋友同時引入朋友圈,這條朋友鏈就可能崩潰。同樣的道理在知識組織中也會出現(xiàn),這就需要我們在知識組織時需要把各知識元間語義關(guān)系都要建立起來,尤其是將知識元之間的主要關(guān)系建立起來。
4 結(jié)語
科學理論是人類智慧的結(jié)晶,是高屋建瓴對相應科學領(lǐng)域的總結(jié)。嚴格地說來,科學理論并不像許多人所認為的那樣,是完全抽象的東西,實際上它是實實在在的指導著我們開展科學研究、支持著我們進行科學實驗。本文通過對系統(tǒng)科學理論的闡釋與理解,對這些理論在知識組織研究中指導作用、理論滲透以及應用價值給出了深刻的解答。如分析了系統(tǒng)論對加強知識組織的整體性、關(guān)聯(lián)性、動態(tài)平衡性、等級結(jié)構(gòu)性提出了理論依據(jù);控制論為我們加強數(shù)據(jù)質(zhì)量控制和知識的生產(chǎn)流程控制提供了科學有效地方法;信息論為我們探索信息的本質(zhì)、控制信息熵的增長給出了科學的理論解釋;耗散結(jié)構(gòu)理論告訴我們,知識組織就是一種耗散結(jié)構(gòu),它是在有序—無序—有序的轉(zhuǎn)化過程中使知識得到增長;協(xié)同論使我們認識到數(shù)據(jù)需要協(xié)同(關(guān)聯(lián))才能產(chǎn)生新的知識和發(fā)現(xiàn)隱藏規(guī)律;突變論解釋了在知識存量不斷增長、知識爆炸的突變環(huán)境下,如何有效地進行知識架構(gòu)和知識組織。此外,文中還對圖書情報學相關(guān)理論對知識組織研究的滲透進行了科學闡釋,探討了布拉德福定律、齊普夫定律、洛特卡定律、小世界理論對知識組織提供的理論思想和科學方法。
雖然,知識組織研究所涉及的理論與方法遠遠不止本文所述,但本文所論及的理論和方法對知識組織研究的指導作用和針對性更加顯著,對面向知識服務的知識組織理念形成,提升知識服務系統(tǒng)水平都有很大的幫助。我們也期待著更多的學者加入到知識組織理論的研究中,促進和完善知識組織的理論與實踐研究,從而提升我國知識服務的水平。
參考文獻:
[1]劉植惠. 系統(tǒng)論、控制論和信息論簡述及其在情報學研究中的作用[J]. 情報理論與實踐,1988,(5):41-43;(6):41-44.
[2]劉植惠. 耗散結(jié)構(gòu)理論、協(xié)同論、突變論概述及其在情報學研究中的作用[J].情報理論與實踐,1989,(1):45-48;(2):45-47.
[3]王知津. 知識組織理論與方法[M]. 北京:知識產(chǎn)權(quán)出版社,2009:1-212.
[4]柯平,王平. 基于知識資源論的圖書館學基礎(chǔ)理論體系研究[J]. 中國圖書館學報,2006,(2):9-14.
[5]周文芳. 論知識組織的系統(tǒng)論原理[J].情報資料工作,2007,(6):50-51,61.
[6]李紅春. 系統(tǒng)論與知識組織[J]. 現(xiàn)代情報,2010,(6):20-23.
[7]雷會珠,趙慧清. 圖書館信息資源系統(tǒng)的自組織與熵值變化[J]. 圖書情報工作,2010,(增刊):251-253,4.
[8]馬費成. IRM-KM范式與情報學發(fā)展研究[M]. 武漢:武漢大學出版社,2008:341-364.
[9]邱均平.文獻計量學[M]. 北京:科學技術(shù)文獻出版社,1988:109-195.
[10]化柏林. 情報學三動論探析:序化論、轉(zhuǎn)化論與融合論[J]. 情報理論與實踐,2009,(11):21-24,41.
[11]董慧等.基于數(shù)字圖書館的本體演化和知識管理研究(Ⅱ)——動態(tài)知識組織[J]. 情報學報,2009,28(4):483-491.
[12]溫有奎,焦玉英. 基于范疇論的知識單元組織與檢索研究[J]. 情報學報,2010,29(8):387-392.
[13]Judit Bar-Ilan,Yifat Belous. Children as architects of Web directories: An exploratory study[J]. Journal of the American Society for Information Science and Technology,2007,(6): 895-907.
[14]Alon Friedman. Concept Theory and Semiotics in Knowledge Organization[J]. Journal of Documentation, 2011,67(4):644-674.
[15]Richard P. Idea Collider: From a Theory of Knowledge Organizationto a Theory of Knowledge Interaction[J]. Bulletin of the American Society for Information Sci-ence and TechnologyVolume,2011,37(4):43-47.
[16]中國大百科全書編輯委員會.中國大百科全書(第二版)(第24卷)[M]. 北京:中國大百科全書出版社,2009:24-556.
[17]《中國情報學百科全書》編委會.中國情報學百科全書[M].北京:中國大百科全書出版社,2010:303,78,191,
13,149,308.
[18]中國大百科全書編輯委員會.中國大百科全書(第二版)(第13卷)[M].北京:中國大百科全書出版社,2009:
13-130.
[19]中國大百科全書編輯委員會.中國大百科全書(第二版)(第25卷)[M].北京:中國大百科全書出版社,2009:
25-161.
[20]中國大百科全書編輯委員會.中國大百科全書(第二版)(第22卷)[M].北京:中國大百科全書出版社,2009:
22-350.
[21]王東波,朱丹浩,蘇新寧. 洛特卡現(xiàn)象在漢語詞匯句法功能分布復雜度中的呈現(xiàn)[J].情報學報,2012,(3):
297-302.
本文鏈接:http://www.svtrjb.com/v-141-2419.html科技信息論文范文10篇
相關(guān)文章:
輔導班新老師的自我介紹09-13
化工環(huán)境保護論文范文10篇08-15
初中英語晨讀美文07-26
唯美的情感語錄07-05
玉米購銷合作協(xié)議書07-07
三維動畫項目策劃書09-13
給生病朋友的慰問信08-17
學生會團學干部培訓心得體會09-19
法律法制心得體會08-16
cad學習心得體會08-02
新課程新理念新課堂心得體會08-02
描寫我的老師初一作文10-28
《根本停不下來》觀后感10-26
誰說女子不如男的議論文08-26
花木世界三年級作文08-17
512防災減災日班會教案優(yōu)秀10-30