時間:2023-06-11 09:07:42
引言:易發表網憑借豐富的文秘實踐,為您精心挑選了九篇規則的作用和意義范例。如需獲取更多原創內容,可隨時聯系我們的客服老師。
俗話說,"不以規矩,不能成方圓",它道出了規則的重要性。遵紀守法,遵守社會規則,是公民意識和文明水平的體現。規則意識的培養,是品德教育的重要內容。本文以《品德與社會》里《規矩與方圓》主題單元中"校園'紅綠燈'"(五年級上期)一課的教學經歷,談談"規則"教育的幾點體會。
1.趣味游戲,感知規則作用
由于規則對人有約束、制約作用,是用來"管束"人的,因此,"規則"不是人人都樂于接受的,規則教育也不能只是簡單的說教,只有設法讓學生真切地感受到規則在生活中的重要作用,他們才會自覺地去遵守。
為了讓本課教學收到良好的效果,我針對小學生喜歡活動、游戲的年齡特點,利用課前午會時間,先帶領學生進行了一次班級"兩人三腳走"分組比賽。活動前,我有意不提細致的比賽規則和要求,只強調安全、快速、有序,目的是為了讓學生在活動中感知規則的缺失對活動的影響,以便于在活動小結時凸顯出規則的作用。
在活動總結時,同學們發現各組人數有不一樣的,各組男女生的數量也有不一樣的;有兩個組各單著一個人,其中一組為了陪單著的同學游戲,有一位同學走了兩次,另一組里單著的同學沒有參加比賽;還有一個組在老師還沒有發起跑口令前就先跑了一點,這些對評判各組名次、輸贏都有影響。通過總結、討論,學生初步體會到了規則的作用,并討論制定了較完善的游戲規則。
2.事例分析,理解規則意義
本課的主題故事為《玩不成的游戲――誰來搖繩》。有了班級比賽活動的啟發,學生很快明白了游戲不能正常進行的原因,不僅很快為故事中的小伙伴想出了解決問題的辦法,還在討論過程中理解了主題提示語"開展集體活動時,有了明確的規則,并且大家都能自覺遵守,這樣才能保障活動順利進行"這句話,理解了規則的作用和意義。
教科書里還有"下象棋不能飛象過河""起跑時腳不能踩線""聽報告時要保持安靜"等情景對話,分別從公共秩序、公共安全等角度對"規則"概念進行拓展延伸,幫助學生去探尋和發現無處不在的規則。教學時,引導學生探究制定這些規則的原因,能使學生更深入地理解規則的作用和意義。
3.榜樣引領,深化規則意識
教科書還編排了"名人與規則"的故事《規則伴我成長》來深化規則意識。故事講一位記者采訪一位榮獲諾貝爾獎的科學家,問他"你是在哪所大學學到了您認為最重要的東西?"這位科學家認為,他學到的最重要的東西,是在幼兒園學會的規則,比如"把自己的東西分一半給小伙伴;不是自己的東西不能拿;東西要放整齊;吃飯前要洗手,午飯后要休息;做錯事要表示歉意;要仔細觀察大自然"等。
科學家列舉的都是些生活小事,然而正是這些生活小事構成了社會生活的方方面面。遵守這些人們普遍認同、約定俗成的習慣,就是遵守社會規則。這位科學家的故事告訴我們,大科學家與普通人沒有什么兩樣,所不同的是他們從小養成了遵守規則的好習慣。當學生明白了這些道理以后,他們對規則的作用與意義有了更深入的認識和體會。
4.整合教學案例,強化規則意識
教科書提供的"小資料"是"校園踩踏事故",講的是某省一所小學的同學在第二節課下課后,爭先恐后地奔向樓梯,因為推搡、擁擠,導致當場壓死、踩死24人,壓傷幾十人的慘劇。為了強化規則意識,教學時,我將教科書下一課里某人違章駕駛農用車搭載80人,造成20人死亡、53人受傷的特大交通事故提前運用。
一個個血淋淋的真實案例,讓學生看到了不遵守規則的可怕,從心底里明白了"沒有紅燈的約束,就沒有綠燈的自由。""我們遵守規則,也享受著規則帶來的好處。""如果沒有規則的制約,社會秩序就會變得混亂。""不遵守規則的人最終只會給自己的生活帶來不便,甚至釀成慘禍,危及他人,危害社會"這些主題提示語的含義,深刻地體會到規則的巨大作用和重要意義,強化了規則意識。
5.總結提升,內化規則意識
教科書在每一部分內容后面,都有總結性的主題提示語對所講內容進行歸納、總結和提升。"校園'紅綠燈'"這課的主題提示語還有"規則意識來自責任感,它的最高體現是自律,是自己管住自己。""在人生路上,我們要不斷學習自省,學習自我約束,學習對自己的行為負責。"等。
關鍵詞:語法 規則 語法意識
中圖分類號: G642 文獻標識碼: A 文章編號:1672-1578(2012)01-0076-01
語法教學是二語習得中不可忽略的部分,掌握英語語法規則對于提高學習效率具有重要意義。然而在現實的英語語法教學中,常常由于對語法認識上的誤區,導致語法教學的失誤,最終影響了英語的學習效果。筆者試圖對此進行以下分析:
1 英語語法教學的誤區
英語語法教學脫離不了語法規則的學習,然而語法規則的作用常常被夸大,將語法視為對語言使用的絕對規定和權威規則。在語法教學實踐中,往往將語法規則僵死化,規定化和模式化處理,用語法絕對的規定論抹殺了語言學習的生動性和活潑性。當面及學生對語法規則追根溯源時,教師常常冠以“語法的規定”來解釋,并要求學生死記硬背規則的條條框框。基于這種認識,語法教學成了“僵死的”“權威的”規則教學,英語學習以學生掌握語法規則為中心,尤其以“偏,難,怪”等語法知識點傳授為重點,視這些語法點為高深的“學問”和“知識”,而忽視了對一些基本語法規則的教學,這是語法教學的本末倒置。語法絕對的規定論夸大了語法在語言學習中的作用,將語言學習模式化,最終不利于語言習得。
2 英語教學中語法的含義
在英語教學中,通常在語法學意義上理解語法,語法學是描述、解釋、總結或是研究語法結構規律的科學,它以語法事實為基礎,是對客觀存在的語法事實的系統性認識和說明。語法教學是有意識有目的的傳授語言規則的實踐。語法來源于語言使用者的使用,經過語法學家的總結,形成了語法學,成為我們教學中的內容。從根源上講,語言現象和事實決定了語法規則,語法教學只是對現實生活中語法現象和事實的說明和總結概括的呈現。因此,語言學家和語法學家研究的語法是語言現象和事實的總結而不是“誰的規定”,只有語言使用者或者說大多數語言使用者對語法具有絕對的支配權。至此,我們可以看到語法作為規則不是絕對的,而是相對的,這將引導我們走出語法絕對規定論的誤區,避免對語法規則產生絕對的權威的崇拜,從而認識到語言的生動性和鮮活性。
3 語法規則的局限性
語法規則的總結和概括總是有限性,有限的語法規則不可能對無限的語言現象進行全面的概括和總結。首先,英語中的一些固定搭配,習語和諺語等是用語法知識無法解釋的。例如:to have no time for 在美式英語中表示的“dislike”意思;It is a wise father that knows his own child根據語法分析意思是“只有聰明的父親才能了解自己的孩子”,但在英語中已成為一句諺語“即使聰明的父親也不一定了解自己的孩子”。其次,不是所有合乎語法的句子都是有意義的,例如Colorful red ideas合乎語法規則但是沒有意義的。第三,即使合乎語法又有意義的句子,也不一定都是正確的,因為語言很大程度上講是約定俗成的,是一種使用習慣。“有些句子合乎語法也有意義,卻是錯句,例如:He is impossible to finish the job in three days. 因為它不合習慣”(王福禎)第四,有些句子合乎語法也有意義,也能算正確的,但不地道。John Pinkham 在《中式英語之鑒》中對這類現象做了深入的分析。例如“The prolongation of the existence of this temple is due to the solidity of its construction”應該為“This temple has endured because it was solidly built.”更為地道。雖然第一個句子符合語法也有意義還算正確,但第二個句子用動詞主宰更富有生氣,更符合英語語言的習慣,更為地道。我們既要認識語法規則對于英語學習的意義,更要認識它的局限性,這對于我們樹立正確的語法教學觀具有重要意義。
4 樹立正確的英語語法教學觀
我國著名語法學家章振邦先生對語法有精辟的論述:“語法規則是從大量的,實際使用的口頭語和書面語中抽象出來的,而不是少數語法學家和修辭學家主觀規定的;它是不斷發展變化的語言現象的科學概括 ,而不是停滯不前,脫離實際的僵死條文。研究語法必須從語言實際出發并用以指導實踐,以提高對語言的分析理解和運用水平。”摒棄語法絕對規定論這一錯誤的認識,是樹立正確語法教學觀的前提。
應當樹立怎樣的語法教學觀呢?首先應當認識到,語法教學不是以掌握僵死的語言規則為宗旨,而是以這些基本語法規則的學習為手段,理解句子,并加深對同一類語言現象的理解,舉一反三,更有效地學習語言。其次,語法規則的歸納是不完全的歸納,語法規則之外還有很多特例現象,在語法教學實踐中,要摒棄那些“偏,難,怪”等語法概念和現象,回歸到普遍的共性的規則的教學。第三,在教授語法規則之后要通過大量的句子練習來培養語法應用能力,例如運用情境創設法,角色扮演法等讓學生在真實的語言環境中運用語法。語法教學評價不能考查學生對規則的識記,應當檢測學生能否正確的表達。第四,喚起學生的語法意識,是當代語法教學的追求。擯棄絕對規定論的語法觀,要求我們將語法教“活”起來,使學生在平時的英語學習中,有意識地注意目的語的形式特征,并實現內化,最終達到自如地正確使用語言,這也是語法教學的最終歸宿。
參考文獻:
[1]王福禎.英語慣用法色奧秘 [M].北京:中國國際廣播出版社,2005.2.
[2](美)平卡姆(PInkham,J).中式英語之鑒[M]北京:外語教學與研究出版社,1998.12.
關鍵詞:數據挖掘;數據庫;多數據庫;模式評價
中圖分類號:TP311文獻標識碼:A文章編號:1009-3044(2008)19-30021-02
Data Mining Pattern Valuation in Multi-database and Single-database
MI Jie, LI Ke
(Henan Institute of Engineering, Zhengzhou 450007, China)
Abstract: Some measures of pattern evaluation are analyzed from both the objective and subjective point of view respectively. Also two objective measures to evaluate patterns in multi-database are proposed.
Key words: data mining; database; multi-database; pattern evaluation
1 引言
數據挖掘(DM),又稱為數據庫中的知識發現(KDD)。根據目前比較公認、完整、深刻和全面的數據挖掘定義――德國Fayyadz等人在1996年發表的論文《From Data Mining to Knowledge Discovery》中提出:數據挖掘是從大量的數據中提取出有效的、新穎的、有潛在價值的、可信的、并能最終被人理解的模式的非平凡的處理過程。從該定義可以看出,數據挖掘得到的模式,評價其度量標準主要包括有效性、新穎性、潛在有用性和最終可理解性[1]。對它們進行綜合度量的標準稱為模式或規則的感興趣度,它分為客觀感興趣度和主觀感興趣度。前者的主要根據是模式或規則的形式和數據庫中的數據,屬于數據驅動;而后者還要考慮用戶的參與等人為因素的影響,屬于用戶驅動。在評價過程中應該綜合使用這兩種度量標準,比較合理的方法是首先用客觀感興趣度作為第一級過濾器,選出潛在感興趣的模式,然后再用主觀感興趣度來對它們進行第二級篩選,得到用戶真正感興趣的知識。
2 對單數據庫挖掘模式的評價
2.1 客觀評價
目前,感興趣度的研究主要針對規則的客觀感興趣度[2],客觀度量是對用戶興趣的估計。有趣性的客觀評價是指規則的有趣性是由規則的具體結構和在數據挖掘過程中所依賴的數據決定的,這種方法主要是在這些規則上應用統計學方法,用定量的數值來判定規則的有趣性,從而避免了人為的主觀意見,因此從這個意義上講,規則有趣性的客觀評價是可靠的、有說服力的。
一般的,影響規則感興趣度的數據方面的因素共有三個(假設規則為A=>B):
(1)覆蓋度(Coverage):指前件A出現的概率P(A);
(2)完全性(Completeness):指兩者(A與B)同時出現的概率與B出現的概率之比,即P P(A∧B)/P(B);
(3)可信度(Confidence Factor):指兩者(A與B)同時出現的概率與A出現的概率之比,即P(A∧B)/P(A)。
Piatetsky-Shapiro提出的規則感興趣性RI(Rule Interestingness)度量的三個準則為:
(1)如果P(A∧B)=P(A)P(B),那么RI=0;
(2)當其它參數固定時,RI隨著P(A∧B)的增加單調遞增;
(3)當其它參數固定時,RI隨著P(A)或P(B)的增加單調遞減。
Magor和Mangano提出了第四個準則:
(4)當給定的可信度大于允許的可信度時,RI隨著P(A)的增加單調遞增。
另一個通用的評價規則質量的是規則簡潔度。它是用來衡量規則的最終可理解程度的指標。它表現在兩個方面:一方面是在規則項的個數上,如果規則項數很多將不利于對這條規則的理解。因此,規則的項數是一個衡量規則簡潔性的逆向指標,即規則的項數越多,規則的簡潔性越差;另一方面是在規則所包含的抽象層次上,層次越高,它對數據的解釋能力越強,也越容易理解;相反則它對數據的解釋能力越差,因此也越不容易理解。
Symth利用如下函數對規則A=>B的簡潔性和包含的信息量進行綜合度量,考慮了規則的前件A和后件B的概率分布的相似程度,以及用A的出現概率作為前件的簡潔性的度量,但是,忽略了P(B)的作用。
■
以關聯規則為例,支持度和可信度度量是評價關聯規則的兩個常用客觀性指標,支持度度量反映了規則的實用性,而可信度度量反映了規則的有效性。很多傳統的關聯規則挖掘算法就是基于這種模型來進行關聯規則挖掘的,也就是找出所有的強關聯規則。但是強關聯規則并不一定是有趣的,有時甚至是有錯誤的。
因此,有人提出了各種新的規則評價標準,并將其加入到挖掘算法中,對關聯規則的產生加以限制和約束,以得到更加新穎、更加有效的關聯規則。有人提出了興趣度(lift)度量方法。對于一條規則A=>B,興趣度定義為:
■
興趣度反映了交易A和交易B之間的關系,當興趣度等于1時,表明兩項交易同時出現屬于概率事件,不具有特別意義,即A和B是獨立的,稱該規則為不相關規則;興趣度小于1時表明其中一個項集的出現降低了另一個項集出現的可能性,稱為負相關規則;興趣度大于1時表明一個項集的出現會增加另一個項集出現的可能性,稱為正相關規則。一般情況下,挖掘出正相關的關聯規則更具現實意義,但有時負相關規則的出現也會為用戶帶來新的知識。
我們可以將興趣度同支持度和可信度一起作為規則的客觀度量標準,以提高所挖掘規則的有效性。
2.2 主觀評價
規則有趣性的客觀評價只是基于數據本身的結構來展開的[3],規則的產生完全基于事實數據,并沒有考慮規則之間的聯系和用戶對規則的認同程度。但是一個規則是否有趣最終要取決于用戶的感覺。只有用戶可以決定規則的有效性和可行性。我們應該將用戶的需求和挖掘系統結合起來才能挖掘出更加有效的規則。因此,判斷規則的有趣性必須考慮到主觀層面上的意義。僅根據客觀感興趣度選取用戶所關注的模式,難以獲得用戶真正感興趣的模式,還需要人為的參與。從主觀的角度講,能使用戶對發現的模式產生興趣的原因主要有兩個:意外性和實用性。
這兩者是緊密相關的。以關聯規則為例,有趣性的主觀評價是指關聯規則的有趣性不僅由規則的具體結構和在數據挖掘過程所依賴的數據決定,而還應與使用規則的用戶感覺有關。而高支持度和高可信度的規則對用戶來講并不一定有意義,從用戶的主觀角度看,規則的非預期性(指所挖掘的規則對用戶來講是超乎想象的、沒曾見過的)和可行性(指依據所挖掘出來的規則進行決策)應該是用戶更感興趣的。
與主觀評價有關的指標有新穎度、用戶感興趣度等,本文認為,規則的新穎度是其中一個很重要的評價指標。
模式的新穎性主要表現在發現模式與知識庫中模式的差異程度上。對模式的新穎性評價是針對于原有的模式而言的,這可能會包括兩個部分的內容:
首先,所挖掘出來的模式與已有的模式有差異,產生這種情況的原因可能是:
(1)所挖掘的數據對象有問題,則該模式是錯誤的;
(2)新挖掘出來的模式是對原有模式的一個補充或具有更高的抽象層次;
(3)新挖掘出來的模式了原有的模式。這說明原有的模式可能失效,應刪除原有的模式。
其次,所挖掘出來的模式與用戶的期望模式有差異,用戶在進行模式挖掘的過程中,往往期望得到一些自己感興趣的模式。然而,實際的挖掘過程中可能會出現用戶意想不到的新模式。這些可能有助于用戶修正原有的期望模式,同時可以通過對新模式的進一步分析,從而得到更具新穎性的。
用戶對規則是否感興趣的重要指標是新穎性,它是針對于原有知識而言的,這些知識包括兩個部分:一是以往得到的準確性很高的規則,與當前所得到的規則相悖;二是與用戶所期望的知識相悖。因此,衡量新穎性主要是從形式上進行的,即分別用與規則的前件和后件的相悖程度來衡量,也可以用與原有知識的相悖的項數來衡量。我們可以通過模板匹配的方法來評價模式的新穎度,首先由用戶給出他所期望的模式作為模板,然后我們將挖掘得到的模式與模板對前件和后件分別進行匹配。匹配的結果可以將挖掘得到的模式分成四類:前件后件都匹配、前件匹配后件不匹配、后件匹配前件不匹配及前件后件都不匹配。前件后件都匹配的模式與用戶的期望一致,達到了用戶預想的目的,但是它對用戶的期望不具有新穎性。其他三類模式均與用戶的期望有差異,也即具有新穎性,這時用戶便可以對這些模式進行更深層次的分析,從而發現問題或作出更加有利的決策。
3 多數據庫中的模式的評價
目前,專門針對多數據庫中的模式的評價尚不多見。本文認為從主觀方面,對多數據庫中的模式的評價與單數據庫中的模式評價方法類似,但從客觀方面應有不同,因為多數據庫在數據方面與單數據庫有著很大差別,需要考慮許多單數據庫不需要考慮的因素,比如說應考慮多數據庫中每個數據庫的權重等。對于多數據庫中模式的客觀度量主要考慮以下兩方面:
3.1 模式的支持度
假設模式為A,我們定義模式A的支持度為多數據庫中模式A的支持程度,記為support(A),計算方法如下:
■
其中,num(A)表示多數據庫中支持模式A的數據庫個數,n為總的數據庫個數。
模式的支持度反映了模式在多數據庫中的實用性或普遍性。支持模式的數據庫個數越多,則模式的支持度也越高,該模式在多數據庫中就越普遍,也即實用性也越高。
3.2 模式的重要度
我們定義多數據庫中模式的重要度為模式對整個多數據庫系統的重要程度,記為importance(A)。 計算方法如下:
其中,k為支持模式A的數據庫個數,即num(A);Wi為支持模式A的第i個數據庫的權重,這里我們對如何為數據庫賦權值不作討論,只在我們假設多數據庫中各個數據庫具有相同地位時將其權重默認為1;sup(Ai)為模式A在支持它的第i個數據庫中的支持度;min supi為支持模式A的第i個數據庫中用戶給定的最小支持度閾值;max supi為支持模式A的第i個數據庫中所有模式的最大支持度。
重要度的計算中我們主要考慮到三個因素:模式的支持度、支持模式的數據庫的權重及模式在支持它的數據庫中的相對支持度。模式的支持度反映了模式的實用性或普遍性;每個數據庫所在的分支對總公司的貢獻是不同的,因此對不同的數據庫應賦予不同的權重;每個數據庫有不同的數據信息,模式在支持它的不同數據庫中的支持度有著不同的標準,因此要計算模式在支持它的各個數據庫中的相對支持度,即公式中的■。
模式的重要度越大,我們認為模式對整個多數據庫系統越重要。
4 小結
在知識發現過程中,通過挖掘算法產生大量的模式,但是大多數用戶對此并不感興趣。如何對它們進行評價,選取出用戶感興趣的和有用的知識是至關重要的,故對知識評價的研究具有重要的意義。
現有的各種評價方法都存在一定的缺陷,目前還沒有一種非常有效的評價方法能適應所有的數據或不同的用戶需求。這方面的研究工作還有待我們繼續進行。
參考文獻:
[1] 綦艷霞,楊炳儒.KDD中知識評價的研究綜述[J].計算機應用研究,2001(12):1-4.
[2] 婁蘭芳,蔣志芳,田世壯.影響關聯規則挖掘的有趣性因素[J].計算機工程與應用,2003(6):190-191.
一、家園協同培養幼兒規則意識的重要性
研究表明,良好的習慣是建構在幼兒良好的規則意識和執行規則的能力之上的,幼兒教育工作者應與家長攜起手來共同探究一些行之有效的培養幼兒規則意識的途徑與方法,積極地引導、點撥幼兒努力提升自己的規則意識,讓幼兒成為規則的主人。
幼兒規則意識的形成離不開家庭,家庭是幼兒規則意識形成的自然的“生態環境”,不可否認任何一個幼兒都能從自己的家庭生活中獲得不同于其他人的經驗,形成自己的獨特行為習慣、發展待人處事的技能等。家長是幼兒規則意識形成的重要“力量源”。幼兒園與家庭共同協同是培養幼兒規則意識的必由之路,幼兒園與家庭共同擔負著培養幼兒規則意識的任務。幼兒形成了規則意識,對幼兒的全面可持續發展有著積極的意義。
二、培養幼兒規則意識的有效策略
現代幼兒教育研究表明規則絕非是冰冷冷的條條框框,而應該是與幼兒的情感世界有密切聯系的,讓幼兒共同認同的,讓幼兒共同參與制定的,讓幼兒能夠自覺遵守的,幼兒理應成為規則的小主人。
(1)幼兒應當成為規則的發現者。在幼兒生活中規則無處不在。在生活中,處處有規則,幼兒教育工作者如果能適時抓住幼兒感興趣的話題與幼兒展開談話,就可以恰當地了解幼兒們對生活中“規則”的掌握情況。如爸爸媽媽常常帶領幼兒逛商場、超市、書店,帶幼兒乘坐地鐵、公交等,在這些場所人們應當遵守什么規則?此時此刻,成人特別是家長的“榜樣”作用會給幼兒留下深刻的印象,會對幼兒發生潛移默化的影響,幼兒會自主發現取放物品要做到從哪里拿還放回哪里的規則;發現到超市付款、乘地鐵、乘公交應該排隊等候的規則……在大人特別是家長的榜樣與監督下,幼兒們會逐步明白這些規則的意義并能自覺地遵守諸如此類的規則。又如幼兒們會自然地發現在幼兒園區域游戲活動時對活動材料要歸類擺放,并應當與同伴一起合作分享等。幼兒教育工作者應善于做規則的引導者,啟發、點撥幼兒發現生活中的規則,讓幼兒觸類旁通、舉一反三,真正成為規則的發現者。
(2)幼兒應當成為規則的制定者。幼兒規則習慣的養成應以幼兒自身為主體,幼兒規則的制定應以幼兒為本,要發揮幼兒的主體性、主動性,制定規則、實施規則應尊重幼兒,幼兒教育工作者應把握好適當的“度”,只能起主導作用而不是主體作用,不可喧賓奪主。什么樣的規則是幼兒們愿意并自覺遵守的,他們最有發言權、自,幼兒教育工作者應大膽放手,讓幼兒大膽地、無拘無束地去感受規則、去體驗規則、去比較規則、去建構規則,在平等與尊重的基礎上讓幼兒充當規則的主動制定者,進而發展為規則的自覺執行者。
(3)幼兒應當成為規則的管理者。幼兒心理學研究認為幼兒仍是一個處于成長發展中的尚欠成熟的獨特生命個體,幼兒自身的主體自覺性尚不夠,規則制定后要想能夠得到充分的落實,幼兒還需要別人,尤其是幼兒教育工作者與家長的協同督促。規則離不開幼兒不斷的練習與強化,有時幼兒尚且在思想上接受了規則,知道規則的存在,但往往很難形成自覺的行為,以至于不能很好地去遵守規則。幼兒教育工作者可以引導幼兒們自主選舉一些監督員作為規則的管理者,以培養幼兒的規則意識,提升幼兒的管理能力,讓幼兒相互督促、相互幫助,共同維護并遵守規則,形成良好的行為習慣。
關鍵詞: 數據挖掘; 關聯規則; 確定因素法; 序列模式
中圖分類號: TN911?34; TM417 文獻標識碼: A 文章編號: 1004?373X(2016)13?0145?04
Abstract: According to the educational data mining (EDM) technology, the minimum association rule of students course selection and student temporary interest learning pattern are mined respectively by means of definite factor method and sequence pattern mining in association rules mining to analyze the student behavior. The definite factors (DF) method in minimum association rule mining is used to mine the minimum association rules of students course selection in the courses database. And then, the temporary interest sequence pattern (TIPS) technique is used to find out the short?term learning behavior pattern in learning activity sequences. The experimental verification results show this algorithm has a practical significance.
Keywords: data mining; association rule; definite factor method; sequence pattern
近些年,圍繞著大數據可被用于造福教育與學習科學這一共同利益,兩個方面的技術逐漸得到了發展,這兩個方面就是教育數據挖掘(EDM) 以及學習分析[1]。隨著教育數據挖掘的快速發展,數據挖掘中的各項技術,諸如關聯規則挖掘,序列模式挖掘等技術都相繼得到了應用,這也進一步促進了教育數據挖掘技術的發展。同時,通過教育數據挖掘對教育數據進行的數據挖掘而得到的潛在信息或是關聯規則也得到了更多的應用,通過這些潛在信息和關聯規則,管理者可以更好地制定管理策略和教學策略,這對提高學校的管理和教學有著非常重要的意義[2]。
1 學生課程選擇的最小關聯規則的挖掘
學生的課程選擇是大學生日常學習生活中必須接觸到的,并且會直接影響到學生在校學習,所以課程選擇顯然是一種重要的學生行為[3]。因此,采用確定因素法,從課程數據庫中挖掘學生課程可以采用最小關聯規則挖掘技術。
1.1 關聯規則
(1) 關聯規則的挖掘
關聯關系可以采用置信度、支持度、期望置信度、作用度四個標量進行表述。通常來說,置信度就是關聯規則下準確度的衡量標準,而支持度則體現了重要性標準。支持度越大,說明這個關聯規則就更加重要。如果在數據挖掘中,存在關聯規則的置信度較高,但是支持度卻相對較低,那么這種規則的實際應用效果就很難保障[4]。
(2) 關聯規則挖掘的過程
關聯規則的挖掘需要通過兩個階段來實現:第一個階段就是從現有的數據集合中找到高頻項目組,并進行整合;第二個階段就是通過這些高頻項目組構建關聯規則。
在第一個階段中涉及到的高頻項目組中的高頻內涵指的是其中某一個具體的項目組出現的頻率,只有這個項目組在記錄中出現的頻率達到了某一個水平,那么就叫做高頻項目組。而且一個項目組出現的頻率實際上就是支持度。比如以包含了物品集合和物品集合的項目為例,通過式(1)就能夠獲得的項目支持度。
通過式(1)計算出來的支持度如果大于設定的最小支持度,那么{A,B}這個項目組就可以稱作高頻項目組。比如某個項目組K?滿足了這個最小支持度,就說明這個項目組K?是高頻項目組,可以使用Large k表示這種高頻項目組。然后關聯算法就從Large k中進行延伸,從而產生Large k+1,直到找到了所有的高頻項目組。
關聯規則的第二個階段自然就是找到關聯規則。實際上很多高頻項目組就是產生關聯規則的搖籃。利用第一個過程中的項目組K?獲得關聯規則。在設置最小置信度的門檻下,如果每一個關聯規則超過了這個置信度,那么這個規則就能夠作為有意義的關聯規則進行評估和可視化。
1.2 教育數據挖掘中的最小關聯規則
教育類數據是挖掘明顯的最小關聯規則中的一種潛在資源,這些規則對于協助高校的管理者或是高校的教師在做出正確的決策和制定完善的教學方案時有著非常好的作用。這一研究的重要性在于,它能夠發現所選的課程中不尋常的關聯[5]。進一步而言,它還可以反映在大學的課程問題上頻繁和最低規則的結合中可能存在的規則。這一研究的結果可以讓學校老師給某一類的學生提供合適的課程作出指導。事實上,它可以幫助大學政策制定者理解和提高目前的教學水平,整體提升管理流程水平[6]。
采用確定因素(Definite Factors,DF)法檢測學生已選擇的大學課程之間的不尋常關系。事實上,確定因素法可以考慮到大學課程之間的頻繁和最低的結合因素,用以生成想要的最低管理規則。在生成這些規則之前采用LP?3和LP?增長算法。
1.3 確定因素法
設指的是一系列稱為常數值的項目,指的是一系列非負實數稱為權重的項目,指的是業務中的數據集,而業務中的是一系列特別的項目,每個業務可以由一個特殊的識別碼TID進行識別。
(1) 定義
針對本文中所使用的算法,為了使其易于理解,在這里,先給出一些定義。
定義1 設為一個項目集,該項目集合為項目K?,稱為項目集K?。
定義2 該項目集的支持值是即supp(X)被定義為一項包括了業務的項目數據。
定義3 設為一個項目集,和之間的關聯規則是在的情況下,其中,和分別表示原因和結果。
定義4 關聯規則支持值即supp則定義為包括了業務中的數據。
定義5 關聯規則的置信區間,即conf,定義為包含的業務中的數據的一種概率。所以,conf的計算公式如下:
定義6 確定因素是在不同的項目集里,通過一個項目集的頻繁程度與基準頻率進行對比,開發支持值的公式。項目集的基準頻率應假設為統計上是獨立的。
確定因素,即DF,且:
(2) 最低關聯規則的構造定義
若一個規則符合以下兩個條件歸類為最小相關規則定義(SLAR) 。一是,相關規則的DF必須大于預設的最低DF。最小DF是在0~1之間。二是,相關規則的因果條件必須既不是最低項目也不是頻繁項目[7]。每個相關規則DF的計算都應該采用定義6的方法確定。DLAR算法構建的完整過程如下:
1.4 實驗結果
用確定因素方法取得實驗文本,所有關聯規則的權重都會根據這一方法進行分配。在此,學生可以在原始圖表中根據固定定位選擇8個課程。每個課程的實際定位是根據固定課程進行設置的。在某大學里,共計為某屆學生提供822個本科課程。根據這些數據,160名學生選擇了342個本科課程,可以歸類為47個類型領域。從中抽出了5個課程列在表1中。同時,在實驗中還用到了確定因素法中的LP?樹和LP?成長算法。
經過實驗,共有4 177個相關規則被成功提取出來,如圖1所示,學生一共選擇了一些(或沒有選擇) 相關的計算機課程,大約有32%的學生沒有申請計算機科學課程,大約有36%的學生選擇了4門計算機課程。如圖2所示為采用不同支持范圍的相關規則的總數。較高的相關規則數支持值低于1%,而最低值相關規則的支持范圍應為2%~3%,進一步分析表明,專注于支持值大于3%的規則。3%的最小支持值相當于在本項目中必須至少出現五次的項目集。表2列舉了前十位最小值為3%的相關規則。
表3給出了根據表2的相關規則的意義。由于課程領域的矛盾,第一個規則到第五個規則是比較奇怪的。第六個規則就非常真實,因為在基礎要求上兩個項目有著相似之處。第六到第十個規則,解釋起來則比較難比較復雜,因為這些課程中并無相關的興趣。據此,可以看到,學生們在選擇大學課程的過程中混淆了他們的幾種興趣。總之,在大學選課數據庫中現存的相關規則是有例外的。這一信息對全面了解學生的興趣以及如何引導他們選擇更合適的大學課程是非常有意義的。
2 挖掘具有臨時興趣的學習行為模式
2.1 識別臨時興趣模式
在這一環節里,使用序列技術展現臨時興趣序列模式(TIPS) 技術并使其與興趣方法相符,從而辨識出學生行為中最具臨時興趣的部分,然后對其進行視覺化處理[8]。每名學生的一系列不同行為都具有與其相關的序列,TIPS技術主要由四個基礎步驟組成:
(1) 通過在學生的學習活動序列中應用序列模式挖掘法并生成候選模式(頻率底線為50%) ;
(2) 通過把每個候選模式映射到它在活動序列中發生的位置,算出其臨時覆蓋區域;
(3) 使用一種被應用于每種模式的臨時覆蓋范圍中的理論興趣方法來提供候選模式的排名;
(4) 對于那些排名較高的模式,使用熱量地圖對其臨時覆蓋范圍做出視覺化處理,從而更輕易地獲取其用法趨勢和峰值。
為了定義TIPS技術的信息增益應用表現出了兩個重要觀點:
(1) 當使兩種模式的總發生幾率相同時,更具時間特異性(即特定時間域內具有更多獨特活動)的模式則會具有更高的排名;
(2) 當使兩種模式在相臨時域內總發生幾率相同時,總計頻度更高的模式則會具有更高的排名。
2.2 Betty的大腦數據
在“Betty的大腦”這款軟件中,學生的學習和教導任務主要圍繞以下7種展開:閱讀相關材料獲取信息;在因果聯系圖中添加或移除聯系以組織聯系,然后把這些信息教授給Betty;詢問Betty對基于因果聯系圖域的看法;讓Betty參加由導師制作出的小測驗以檢驗其對于當前圖中各種聯系的正誤理解;讓Betty說明她會使用哪種關系來回答小測驗中的問題;記下筆記以供日后參考;標注出聯系以記錄下通過測試與閱讀環節決定的正確性。
2.3 實驗結果
關鍵詞:原產地規則;原產地規則協定;原產地規則委員會
中圖分類號:DF4 文獻標志碼:A 文章編號:1673-291X(2013)23-0297-02
一、原產地規則的含義及意義
原產地規則的產生,起源于一國在國際貿易中對貿易統計的需要。貨物的“原產地”通常指貨物的“原產國”(包括國家、國家集團、地區)。 所謂貨物的“原產國”是指為了國際貿易的目的,依據一定的標準所確定的生產或制造貨物的國家。原產地規則應定義為:一個國家或地區為確定貨物的原產地而實施的普遍適用的法律、法則和行政決定。①
原產地規則在國際貿易中的基本作用主要體現在以下三個方面:
1.確立產品享受關稅待遇的依據。在貨物的進出口貿易過程中,各國海關均依據進口貨物的原產地,確定給予的相應的“多欄制”差別關稅待遇。
2.實施非關稅措施的依據。在WTO 中,反傾銷措施、反補貼措施、保障措施、關稅配額等等都離不開原產地規則。如反傾銷訴訟案中貨物的原產地就涉及到國內價格的確定。
3.進行貿易統計的依據,即用于聯合國、世界貿易組織等國際機構及各國的國別貿易統計和分析。
二、原產地規則的協調進程
(一)協調原產地規則的歷史進程
1.GATT時代
在GATT之前有關原產地規則的國際協調行動幾乎無跡可尋,哈瓦那的籌備委員會曾認為,原產地的認定屬于各國的自力,因此應該按照各國法律為適用最惠國待遇規定的目的決定和貨品來源。但可以肯定的是1947年制定GATT前國際社會已經意識到各行其是的各國原產地規則對國際貿易的消極影響,所以于GATT中對原產地有所定義,但GATT1947本身并無原產地規則的具體規定,僅由委員會建議了以下原產地規則,即“貨物系完全由一個國家的原料與勞力所制造者,系屬該國產品,即該產品系在該國收獲、由土地上取得、制造或用其他方法造成。一貨品系由兩個以上國家的原料及勞力所制造,其原產地的認定,應以此一貨品最終實質轉型時所屬國家決定。由于加工的結果而給予貨品新的特性時,被認為有本質上的改變。”烏拉圭回合簽訂的原產地協定仍然是以這個定義為基礎而發展出來的。
GATT體系中,在烏拉圭回合之前,僅由東京回合時所制定的《政府采購協定》對原產地規則有所提及。該協定第四條第一項規定,締約國就政府采購所適用的原產地規則必須與產品及服務通常貿易過程所適用的原產地規則相同。但是,政府采購協定本身沒有對原產地規則的內容進行任何說明。
2.關稅合作理事會的“京都公約”
在GATT的體系之外,關稅合作理事會于1973年贊助簽訂并于1974年生效的《關稅程序的簡化及統一化國際公約》(簡稱“京都公約”)附件D.1.有較詳細的規定。“京都公約”也是烏拉圭回合之前國際上唯一有關原產地規則的多邊協定。該公約附件D.1.將原產地的認定分為兩類不同的情形:一是僅涉及一個國家的情況,即此產品系完全在一國生產者,該國家為產品的原產地。二是產品的制造過程涉及兩個以上的情形,“京都公約”以產品最終實質轉型地點為原產地。
“京都公約”生效之后,由于其簽約國不多,且該公約對簽約國除強制性規定“完全在一國生產”的情形限于公約所列10種情況外,并未強制要求采取什么方式認定“實質轉型”,所以各國所采用的原產地規則自有不同。 京都公約只規定了供成員國自由造擇或參照的標準條款和建議條款,原產地規則的協調進程并沒有因為“京都公約”而有質的飛躍。
(二)WTO的原產地規則法律制度框架
1.WTO《原產地規則協定》
在烏拉圭回合中,應美國、日本等國的要求,烏拉圭回合多邊貿易談判的非關稅措施談判組將原產地規則問題列為重點談判議題。在談判過程中,日本就原產地認定基準的程序、基本的規則框架、通報、協商及爭端解決的程序提出一個方案,美國也提出了方案,其后美日兩國在關稅合作理事會的配合之下,提出要制定包括特惠貿易的原產地規則。但是,歐共體主張在關稅合作理事會主持之下,制定不包括特惠貿易的原產地規則。1990年12月的布魯塞爾部長會議最后達成妥協,同意把特惠貿易的規則作為原產地規則的附件,最終通過了原產地規則協定。《原產地規則協定》 ( Agreement of Rules of Origin )是WTO體系下唯一有關原產地規則的生效的國際協定。
《原產地規則協定》除了前言,由第1部分“定義與適用范圍”,第2部分“關于實施原產地規則的規定”,第3部分“通知,審查和爭端解決的程序安排”,第4部分“原產地規則的協調”,以及附錄1“原產地規則技術委員會”,附件2“關于優惠性原產地規則的共同宣言”,這樣4個部分2個附錄所組成。
《原產地規則協定》將原產地規則定義為:“任何成員為確定貨物原產地而實施的普遍適用的法律、法規和行政裁決,”①“包括用于非優惠商業政策工具的所有原產地規則”,“還應包括用于政府采購和貿易統計的原產地規則”。②這表明《原產地規則協定》將原產地規則定位于非優惠原產地規則。
第二部分規定了過渡期內和過渡期后的紀律。③第三部分涉及通知、審議、磋商和爭端解決的程序安排。第四部分是該協定的核心內容,對原產地規則的協調目的、原則、工作計劃、實施期限及其聯系方式作了安排。在世界貿易組織協定生效后,立即開始原產地規則的國際協調工作,要求在3年之內完成。由世界海關組織提供詳盡的數據,技術委員會按照既定原則對有關協調工作提供解釋和意見。在技術委員會根據HS協調編碼制度目錄各章節所列產品類型的基礎上,完成協調工作計劃。
《原產地規則協定》的兩個附件具有與文本同樣的法律效能。一是《原產地規則技術委員會》;二是《關于優惠原產地規則的共同宣言》。前者主要明確和規定了技術委員會的職責、工作要求和代表的產生等事宜;后者的定義不同于本協議正文中所述的非優惠原產地規則,它是指一成員方為確認貨物能否享受關稅減免優惠的規則,適用自制的貿易體制而實施的有關原產地規則的法律、法規以及行政決定。世界各發達國家給發展中國家的關稅優惠待遇G.S.P.普惠制方案中的原產地規則一般都應遵循這個《宣言》制訂。
2.WTO《非優惠原產地協調規則》
烏拉圭回合一覽子協議中的《原產地規則協議》規定,世界海關組織(WCO)框架下成立的原產地規則技術委員會負責制定協調非優惠原產地規則的技術性工作。在世界貿易組織框架下成立的原產地規則委員會負責審議技術委員會無法達成一致的疑難問題和政策性問題。從1995年開始至1999年2月,技術委員會共召開了18次會議,基本完成了技術級的工作。等WTO原產地規則委員會將尚余的未決問題解決后,由WTO部長級會議通過《非優惠原產地協調規則》(簡稱協調規則)的文本后,即對各成員國具有法律約束力。
國際協調是充分考慮在HS協調編碼制度的框架結構的前提下,對烏拉圭回合貿易談判形成的《原產地規則協議》進行細化,逐個商品討論其在HS某一數級(如6位、8位數等)歸類的改變是否構成實質性改變,以及必要時應參考附加的輔助標準的周密考慮后形成的。協調規則的基本框架結構主要由定義、總規則、主規則、補遺規則、附錄一、附錄二組成。
協調規則以“完全獲得”和“實質性改變”作為原產地規則的基本標準,并規定“實質性改變”的判定標準應盡可能以國際通用的《商品名稱及編碼協調制度》目錄中歸類改變為基礎,必要采用“從價百分比”標準時,必須列明計算這一百分率的方法;采用制造或加工工序標準時,必須準確地列明能授予有關產品原產地資格的制造或加工工序。
這里需要進一步說明的是,協調規則是建立在協調編碼制度的基礎上,二者是相互依存的關系。實質性改變的首選標準是稅則歸類的改變。協調制度發生改變,協調規則也要進行重新審議。
協調規則所附的“附錄一”、“附錄二”是判定貨品原產地的標準。“附錄一”確定了完全獲得的貨品的定義和適用范圍,以及對某些微小加工或處理的限定。“附錄二”是產品特定的原產地規則,其適用范圍是指那些當按照“附錄一”不能確定貨品是在一個國家完成時,采用“附錄二”規定的標準判定的貨品。
協調規則至今仍未發生法律效力,而仍由協調項目工作組主持對核心政策問題進行磋商,到2004年7月為止,已經經過了4次修改。協調項目工作組的主席向相關成員國提交了涉及94項核心政策問題的一攬子建議。按照第4次修改的協調規則的規定,基于操作的原因,協調規則將于2007年正式生效。這表明協調規則工作組認為協調規則還將進行再次修改。
三、原產地規則協調化的前景分析
原產地規則應該有統一的、合理的標準已經成為各國的共識,但由于原產地規則關系到各國的重大利益和敏感利益,原產地規則的協調進程還有很長的一段路才能達到完美的境界。區域經濟一體化的勢頭使原產地規則的協調分成了兩條相互平行、相互作用的主線。一是在世界貿易組織主持下的非優惠原產地規則的全球性協調行動,另一條是各個區域經濟集團內部的優惠性原產地規則協調行動。
關鍵詞:商業判斷規則 董事
經濟學的意義上的公司是一種盈利主體,在追求利益最大化的同時,還需要承擔經營失敗的風險。而法律意義上的公司,在某些情況下,即使董事出于善意而且充分履行了注意義務,依然可能出現失誤或是錯誤從而導致公司的損失。但是經濟學上的經營管理失誤并不會當然導致公司法上的失誤。為了平衡公司利益和董事權利,美國法院通過長期的司法實踐,逐步形成了“商業判斷規則”,主要存在于判例法中,成文法并沒有相關規定。通過商業判斷規則區分法律上的經營過失責任和一般的經營失誤。根據該規則,公司董事在作出一項商業決策時,要求其滿足主觀和客觀的要求。即要求主觀上出于善意,并且客觀上依據其所獲得的合理信息盡到了合理的注意義務,那么即使最后事實證明該董事的決策是錯誤的,董事可以依據商業判斷規則而免于承擔法律上的責任。商業判斷規則是從本質上是將公司董事的責任加以限制,把責任限制在一個合理的范圍內。
商業判斷規則也被譯為業務判斷規則、經營判斷規則,是美國判例法和公司法中的一個重要原則,是建立在董事盡到合理注意義務的前提下的規則,所以與董事的合理注意義務相聯系。研究商業判斷規則不僅僅對規范公司董事業務行為有積極的作用,對我國董事責任制度的完善,也有積極的意義。
商業判斷規則包含以下兩個方面的內容:
第一,董事在從事公司授權范圍內的交易時,只要沒有存在個人厲害關系,法院就不能因為董事在執行職務未達到應有標準而禁止或取消該交易,董事也不必承擔因此而產生的損失。
第二,商業判斷規則既是一種舉證的分配機制,也是一種實體法上的規則。作為舉證責任分配機制的商業判斷規則,其存在的前提是假設董事作出決策時是出于主觀善意,并且也盡到了合理的注意義務。因此,主張董事違反了勤勉義務時,原告需要證明董事的主觀存在重大過失等非善意的因素。商業判斷規則作為實體法上的規則時,董事在作出決策時符合善意且合理注意,即使事后證明了董事的行為是錯誤的,公司因此遭受的損失,但是董事不負賠償責任。
商業判斷規則需要以下幾個的適用條件:
適用條件之一是要求有實施了經驗判斷的事實(A Business Decision)。因為商業判斷規則只保護商業上的決策。根據商業判斷規則的條件和標準,判斷董事是否受到該原則的保護。不存在經營判斷事項時,直接適用美國判例法或者是成文法上關于董事勤勉義務的法律規定,然后根據法律規定的標準來衡量董事是否盡到了合理的注意義務。
適用條件之二是董事和該經營判斷沒有任何利害關系(Disinterestedness)。董事對于公司應負有忠實義務和勤勉義務。忠實義務要求董事不得將其個人利益凌駕于公司的整體利益之上。因為,如果有權做出某事項董事和該決定直接存在著某些利害關系,就很難期待董事在這種情況下做出的決定是為了公司的最佳利益,而不存在任何私心,所以在有利害關系這種情況下,要排除商業判斷規則的適用。
適用條件之三要求公司董事盡到了合理的注意(Due Care)。這是判斷商業判斷規則的先決條件中最核心的問題。合理注意是針對董事或者高管在做出決策前所做的準備工作,并不是針對商業決策本身。決策人需要在決策過程中做出怎樣的行為,才能是符合當時的客觀情況下的“合理注意”呢?有一般要求和程序要求兩個方面。
合理注意的一般要求的內容是董事應當具有“普通謹慎之人,處于類似職位,并且在相似的環境中,能做到的注意”。這一標準要求公司董事在做出決策前,已經掌握了在類似情況下,作為一個普通謹慎之人認為應該掌握的所有重要信息。
注意義務在程序方面的要求是指公司董事在做出決策前,所進行的調查和咨詢應符合該決策的要求,這是注意義務一般要求的邏輯延伸。法院在審理相關案件時,判斷董事在決策前是否盡到“合理注意義務”主要通過董事的調查工作是否充分,當然充分與否的標準取決于具體決策的性質還有做出決策的時間判斷。
適用條件之四要求公司董事在做出經營判斷時出于善意(in good faith)。所謂善意是指:合理相信董事做出商業決策是為了公司的最佳利益。這是對董事主觀善意的判斷標準,也是其主觀善意的內容。
總體來說,商業判斷規則就是董事所作之決策與其本身不存在利害關系,是為了公司的最佳利益,并且為了該決策進行了與決策性質相適應的調查和咨詢,滿足以上幾個條件,董事對該決策實施后帶來的風險免除法律上的責任。但是商業判斷規則本質仍是屬于一種“可的假設”。即在一定的情況下可以排除商業判斷規則在具體案件的適用。在適用商業判斷規則之前,需要先審查董事的行為方式和決策過程,公司董事作出決策時未出于善意,或者是董事在客觀上沒有盡到合理的注意義務,或者對于董事與其所作決策存在利害關系并且因此作出了不符合公司利益的決定,原告一方對以上三種情況負有舉證責任,從而排除商業判斷規則的適用,使董事承擔相應的賠償責任,保護股東的利益。
關鍵詞: 數據挖掘;負關聯規則;相關系數; 最小興趣度
中圖分類號:TP 181
文獻標志碼:A文章編號:1672-8513(2011)04-0301-04
An Effective Method for Mining Negative Association Rules
ZHANG Yafen, WANG Xin
(School of Mathematics and Computer Science, Yunnan University of Nationalities, Kunming 650500, China)
Abstract: Negative association rules are always hidden in the huge infrequent items, but they also have strong correlation and contain important information. This paper presents an effective method based on the correlation and coefficient to estimate NAR and a proposal. The experiment results show that this algorithm is effective in improving the mining efficiency.
Key words: data mining; negative association rules; correlation coefficient; minimum interestingness
1 問題概述
傳統的關聯規則挖掘算法是依賴于支持度和置信度來挖掘的,它最初是由Agrawal 等于1993年提出來的[1-2],經典的Apriori算法也被同時提出.關聯規則的任務就是挖掘出同時滿足支持度和置信度最小閾值的規則.
下面來看一個例子[3-4],希望分析愛喝咖啡和愛喝茶的人之間的關系.收集一組人關于飲料偏愛的信息,并匯總在表1中.
根據表中所給的信息來評估關聯規則:茶咖啡.根據傳統的關聯規則挖掘算法,通過計算支持度和置信度的方法除去無意義的規則.下面計算該條規則的支持度和置信度:
支持度s=喝茶同時喝咖啡的人數/總人數=150/1000=15%,置信度c=喝茶同時喝咖啡的人數/喝茶的人數=150/200=75%.發現該條規則的支持度和置信度都很高,似乎喜歡喝茶的人也喜歡喝咖啡.但是再仔細觀察表中的數據可以發現,不管他是否喝茶,喝咖啡的人的比例為800/1000=80%,而喝咖啡的飲茶者卻只占75%.這說明一個人如果喝茶,則他喝咖啡的可能性由80%下降到75%.從該實例中可以發現置信度的缺陷在于該度量忽略了規則后件中項集的支持度.更奇怪的是喝咖啡的飲茶者所占的比例75%實際少于所有喝咖啡的人所占的比例80%,這表明飲茶者和喝咖啡的人之間存在著一種逆關系,這也是種關聯規則,只是它是一種負相關[4] ,稱之為負關聯規則,與之相對的傳統關聯規則即為正關聯規則.
在上述實例中發現基于這種框架的關聯規則挖掘存在一定的缺陷和局限性,在挖掘過程中,將會丟失許多有價值的信息,從而給決策者帶來一定的誤導.因此在挖掘過程中,需要重視負關聯規則的挖掘.例如在購物籃分析中,負關聯規則表明顧客購買某些商品有可能就不購買某些商品,這對決策者設計商店布局有一定的導向性;在投資、營銷或者廣告策劃等諸多領域的決策過程中,負關聯規則同樣有著不容忽視的作用.
對于負關聯規則的研究,最初是由Brin等在文獻[5]中提出2個頻繁項集間的負相關;Savasere 等在文獻[6]中研究了強負關聯規則問題;WU Xindong等[7]提出一種PR模型.之后許多學者研究關于負關聯規則算法以及改進,如文獻[8-9].本文提出了一種結合相關系數和最小興趣度2個度量的負關聯規則算法,其中相關系數用以識別關聯規則是正規則還是負規則,比較方便簡單,避免了對決策者的誤導;最小興趣度保證了所挖掘產生的負關聯規則的有效性,避免了大量冗余的規則產生,給決策者帶來一定的導向性.并且通過實驗證明該算法是有效的.
2 負關聯規則的相關知識
負關聯規則指的是在2個項集之間的互斥或否定關系,其形如AB,AB,AB,其中A,B分別表示交易中不含有A,B.如在商場中A表示購買茶葉,B表示購買咖啡,則A表示不購買茶葉,B表示不購買咖啡,因此AB表示顧客購買茶葉則不會購買咖啡的相關規則,此即為一條負關聯規則.下面給出負關聯規則的相關定義,其中min_sup為最小支持度閾值,min_conf為最小置信度閾值:
算法中步驟2)通過計算相關系數,并且如果滿足最小興趣度的值,此時才產生規則,并且產生的規則是用戶感興趣的.包括①計算相關系數;②滿足相關系數條件和最小興趣度的值,輸出形如AB,AB,AB的有趣的負關聯規則;步驟3)返回結果INAR,結束整個算法.
5 實驗
為了證明算法的有效性,考慮如表2所示的小型事務交易表[7],其中包括10條交易數據和6個項.表中TID表示每條交易的標識符號,分別用T1,T2,…,T10表示;表中的A,B,…,F等分別表示每條交易所包含的對象.若以購物籃事務為例,如A,B,D表示的是顧客購買的商品的集合.具體的實驗是基于Matlab的仿真效果.一般設min_sup=0.2,min_conf=0.40.表3中列出了本文算法與經典的Apriori算法的實驗結果進行比較.
從表3中可以發現,經典Apriori算法得到正關聯規則數是24,但無法發現負關聯規則的存在;而通過本文的算法可以直接得到負關聯規則數,正關聯規則在運行中不出現,從而節省了一定的存儲空間.同時根據表中所顯示的當min_interest取0和0.05時,負關聯規則數由39減少到12,被刪除的負關聯規則數明顯增多,這說明提高最小興趣度能夠減少一些無意義的規則出現,刪除了一些無意義的負關聯規則數目,使得剩余的規則數目減少了,便于用戶從中選擇有意義的規則,從而保證了挖掘出來的負關聯規則是用戶感興趣的,提高了負關聯規則的挖掘的效率,因此此算法是有效的.
6 結語
本文通過實例引出傳統的關聯規則挖掘算法在挖掘過程中存在的問題,將興趣度和相關系數兩者進行結合,從一定程度上減少了大量無趣的負關聯規則的產生.但是此種方法在一定程度上還存在一定的局限性,后將作進一步完善.
參考文獻:
[1]AGRAWAL R. Mining association rules between sets of items in large database[C]//Proceeding of the 1993 ACM SIGM OD International Conference on Management of Data. New York: ACM Press,1993:207-216.
[2]AGRAWAL R, SRIKANT R. Fast algorithms for mining association rules[C]//Proceeding of the 20th VLDB Conference. Santiago: Morgan Kaufmann,1994:487-499.
[3]CORNELIS C,YAN Peng,ZHANG Xing,et al.Minning postive and negative association rules from large databases[C]// 2006 IEEE Conference on CIS.Bangkol:IEEE,2006:613-618.
[4]TAN Pangning, STEINBACH M, KUMAR V.數據挖掘導論[M]. 范明,范宏建,譯.北京:人民郵電出版社,2006.
[5]BRIN S,MOTWANI R,SILVERSTEIN C.Beyond market baskets:Generalizing association rules to correlations[C]// Processing of the ACM SIGMOD Conference. New York:ACM,1997:265-276.
[6]SAVASERE A,OMIECINSKI E,NAVATHE S.Mining for strong negative association in a large database of customer transation[C]//In:Proceedings of the 1998 International Conference on Data Engineering.Orlando:IEEE, 1998:494-502.
[7]WU Xindong,ZHANG C,ZHANG S.Mining both positive and negative associations rules[C]//Proceedings of the 19th ICML.New York:Springer Verlag,2002:658-665.
[8]張倩,王治和,張國治.基于相關系數的正、負關聯規則挖掘算法[J].陜西理工學院學報,2005,21(4):35-38.
[9]董祥軍,宋瀚濤,姜合.基于最小興趣度的正、負關聯規則挖掘[J].計算機工程與應用,2004,24(2):24-27.
[10]汪際和,陳平,王新.一種基于信息表的關聯規則挖掘方法[J].云南民族大學學報:自然科學版,2010,19(6):432-434.
關鍵詞: 貿易規則; 區域一體化; 諸邊協定; 多邊體系
DOI:10.13939/ki.zgsc.2015.05. 073
危機往往不可阻擋的扮演著國際新規則催化劑的角色。發端于2008年的全球金融危機在沖擊世界經濟的同時,也促使全球貿易的新規則不斷的醞釀和發展,呈現了新的發展趨勢和動向。整體上,國際貿易新規則正從幾個方面逐步發展。第一,跨太平洋伙伴關系協定(Tans-Pacific Partnership,簡稱TPP)和跨大西洋貿易和投資伙伴協定(Tans-Atlantic Trade and Investment Partnership,簡稱TTIP)等區域經濟一體化的發展很可能會在未來形成富有影響力的新規則和新體系;第二,世界貿易組織(World Trade Organization,簡稱WTO)框架體系內的諸邊協定談判會在具體領域形成新的規則和制度;第三,WTO多邊貿易體系隨著“巴厘協定”的達成,未來也可能會形成新的國際貿易規則。
一、TPP和TTIP等區域一體化的發展與貿易規則的變化
全球金融危機之后,新一輪區域經濟一體化風起云涌,并且重點關注非關稅壁壘的削減以及國際貿易新規則的構建。尤其是跨太平洋伙伴關系協定(TPP)和跨大西洋貿易和投資伙伴關系協定(TTIP)。
TPP是2010年正式發起、由美國主導的旨在進一步推動亞太地區經濟自由化的高水平多邊自由貿易安排,參與的國家目前有13個。2013年8月日本正式成為TPP的談判成員,9月韓國宣布加入TPP談判。TPP預計很可能會在2014年達成協定。根據TPP發展的規劃,將在2015年之前實現13個成員的目標,即韓國加入TPP;而終極的目標是要建成亞太地區所有國家參與的高標準區域一體化安排。
TPP涵蓋了亞太地區的12個重要國家,包括了主要的發達經濟體和不少發展中國家。建成之后,將成為現有最大的自由貿易區或區域一體化組織。TPP成員的貿易總額約占世界貿易份額的25%以上,出口總額占世界份額的約23%,而進口總額占世界份額的約28%。TPP總體上占據了世界貿易的約1/4,這樣的區域一體化組織對于全球貿易和經濟的影響不言而喻。
TTIP是2013年2月13日由美國總統奧巴馬、歐洲理事會主席范龍佩、以及歐盟委員會主席巴羅佐聯合發起的自貿區安排。2013年3月12日,歐盟委員會通過了與美國進行自由貿易協定談判的授權書,2013年6月14日歐盟各成員國通過了歐盟委員會開啟TTIP談判的決議。2013年7月8日~12日,美國和歐盟在華盛頓啟動了TTIP的第一輪談判,初步確定了談判框架;截至目前已進行了七輪談判。
TTIP如若建成,將是世界第一大超級自由貿易區。同時,美國和歐盟是世界最主要的服務貿易大國,雙邊相互投資額巨大,在服務貿易和相互投資上的合作空間很大。顯然,TTIP對于世界經貿的影響將是巨大的。
TPP和TTIP關注的內容和議題反映了重建國際貿易規則的訴求。TPP涉及的議題包括知識產權保護、勞工標準、環境標準、促進中小企業發展、金融監管、競爭政策、國有企業條款、經濟立法、市場透明、反貪等[3]。TTIP包括農業和工業產品市場準入、政府采購、投資、服務、能源和原材料、監管議題、知識產權、中小企業、國有企業等20項議題。這些議題主要關乎新的規則。正如TTIP談判中的美歐聯合申明所述:“通過談判,美國與歐盟將不僅有機會促進大西洋兩岸的貿易與投資,也可能會成為全球貿易規則的制定者和主導者,進而改變現有的多邊貿易體系”,這充分說明了TTIP的目標在于重塑全球貿易新規則[2]。
近年來TPP和TTIP等主要區域一體化安排與以往相比具有差異,特點顯著。第一,重點在非關稅壁壘的削減和新規則、新制度的建設。無論是跨太平洋伙伴關系協定還是跨大西洋貿易和投資伙伴關系協定,都無一例外的關注非關稅壁壘的減讓和新規則的制定與事實。第二,似乎有意避開并游離于WTO體系之外。TPP和TTIP都是WTO體系之外的區域一體化安排。第三,以發達經濟體為核心,撇開發展中經濟體。TPP由美國主導,日本參與;TTIP由美國和歐盟共同主導和參與。第四,美國和發達經濟體推動一體化的意愿高度強烈,發展進程“出乎意料”的迅速。無論是TPP還是TTIP,都設定了密集的談判議程,預定達成協議的時間安排非常緊迫,反映了發達經濟體的迫切心態。可見,區域一體化構建全球貿易新規則的主導和推動力量主要是美國和歐盟等發達國家。
TPP和TTIP已經囊括了大多數的發達經濟體,如果建成了高標準的區域一體化組織,吸納越來越多的國家參與,很容易形成事實上的全球主導型貿易規則,最終TPP和TTIP取代現有的WTO多邊貿易體系而發揮作用,或者回到多邊體系框架下成為名正言順的全球貿易規則。無論何種發展結果,TPP和TTIP都是潛在的國際貿易新規則形成路徑。
二、WTO框架下的諸邊協定談判與貿易規則的變化
WTO框架下的諸邊談判是在世貿組織框架下,部分成員采取自愿的方式參與的涉及具體領域的協定談判。目前比較有影響的談判主要有全球服務貿易協定(Trade in Service Agreement,簡稱TISA)、信息技術協定(Information and Technology Agreement,簡稱ITA)和政府采購協定(Government Procurement Agreement,簡稱GPA),分別體現了服務貿易、信息技術貿易和政府采購上國際貿易新規則的談判和發展。
《全球服務貿易協定》(TISA)是世界貿易組織框架下的諸邊談判,美國和歐盟等國家認為20年前達成的《服務貿易總協定》(GATS)已經落后于時代,主張使用“負面清單”談判模式推動達成更高標準的服務貿易協定。TISA陣營目前已有48個國家,覆蓋了全球70%的服務貿易[2]。
《信息技術協定》(ITA)是世貿組織項下1997年生效的諸邊協定,成員涵蓋全球97%的IT產品出口,旨在分階段將信息技術產品的關稅削減至零。中國在加入WTO談判中承諾加入協定,并成為成員。
《政府采購協議》(GPA)是世界貿易組織(WTO)框架下的一項諸邊協議,目標是促進成員方開放政府采購市場,擴大國際貿易。GPA由WTO成員自愿簽署,目前有美國、歐盟等14個參加方,共41個國家和地區簽署了協議。
WTO框架內的諸邊協定談判基于自愿的基礎,并且主要包括的都是利益攸關方,部分成員參與的談判不僅更加容易達成協定,同時參與的成員本身就說明存在參與協定的愿望。由此,WTO框架內的諸邊協定談判將比多邊談判容易的多。從目前進展看,信息技術協定和政府采購協定已經達成,全球服務貿易協定仍在談判中,中國2013年已經宣布參與全球服務貿易談判。
諸邊協定談判同樣主要由發達經濟體主導,在世貿組織的多邊體系框架內開展談判,并且通常主要聚焦某一個領域,一旦協定達成,將會形成在某些特定領域新的國際貿易規則。如TISA談判一旦達成,由于匯聚了主要的服務貿易大國,將會形成服務貿易新的規則,成為事實上的主要通行規則,未來很容易上升為全球性的國際貿易規則。因而,WTO框架內的諸邊協定談判同樣是重要的全球規則變動主要路徑之一。
三、后巴厘時代的多邊貿易體系與貿易規則的變化
WTO多邊貿易談判一直是國際貿易新規則和新體制形成的主要機制。但世貿組織新一輪的多哈回合歷經10多年的談判一直毫無結果,發達國家成員和發展中國家成員很難在一些核心議題上達成一致。但隨著區域經濟一體化發展形成的壓力,推動多哈回合在2013年底達成了“巴厘一攬子協定”,宣告了多邊體系下仍然可以達成協議,具有重要意義。
從“巴厘協定”的內容看,主要包括貿易便利化、給發展中國家在糧食安全上更多選擇權、協助欠發達國家發展貿易等三個方面。這些內容具有重要的價值和意義,貿易便利化有利于降低貿易成本,促進貿易發展,尤其有利于全球價值鏈貿易的發展。但“巴厘協定”的內容仍然沒有涉及貿易一體化和自由化的核心議題,沒有涉及非關稅減讓,沒有形成核心的國際貿易規則。可以說,在國際貿易規則的形成上,基本沒有實質的推動和貢獻。
“巴厘協定”對新貿易規則的意義主要在于:第一,增強了未來在多邊框架下談判貿易規則和貿易自由化的信心,具有重要的象征意義;第二,貿易便利化是貿易自由化的一方面,在貿易便利化上形成的規則和措施,同樣也是國際貿易規則的一部分;第三,“巴厘協定”為后巴厘時代的貿易規則談判提供了榜樣和效仿效應,有利于未來的談判。
總體上,多邊體系下的國際貿易新規則談判并不容易,遇到的問題和困難很多,預計很難有較大的進展。
四、全球貿易規則變化的新動向
全球貿易新規則形成的三種路徑選擇中,正倚賴和快速發展的是區域一體化實現路徑和WTO框架下的諸邊協定路徑,但“巴厘協定”似乎點亮了WTO多邊框架的“星星之火”。目前,國際貿易新規則的發展呈現了新的動向,TPP可能會在不遠的未來可以達成協定,WTO體系下的諸邊談判達成的可能性很大,發達國家似乎希望形成WTO體系內外相互補充的規則體系,未來TPP等區域一體化可能會納入WTO體系。
(一)TPP談判已經進入最后階段,可能年內達成
TPP原定計劃在2013年底完成談判,但由于各位訴求的差異未能達成。但預計,TPP能夠在不遠的未來很可能會達成協定,初步建成一個高標準的區域一體化組織。TTIP目前已經進行了七輪談判,從目前的進展看,雙方達成協議的意愿較強,但談判中存在的矛盾很多,預計短期內較難達成。
(二)諸邊協定談判成功的概率較高
WTO框架內的諸邊協定談判基于自愿的基礎,并且主要包括的都是相關利益攸關方,部分成員參與的談判不僅更加容易達成協定,同時參與的成員本身就說明存在參與協定的愿望。由此,WTO框架內的諸邊協定談判將比多邊談判容易的多。
從目前進展看,信息技術協定和政府采購協定已經達成,全球服務貿易協定仍在談判中。預計諸邊協定談判都能夠在不遠的未來達成協議。
(三)WTO后巴厘時代的多邊體系較難推動貿易新規則的發展
“巴厘協定”證明了多哈回合的多邊體系是可以達成新的協議和新的規則,但從2013年底達成的“巴厘一攬子協定”的內容看,主要包括貿易便利化、給發展中國家在糧食安全上更多選擇權、協助欠發達國家發展貿易等三個方面。這些內容雖然具有著重要的價值和意義,但還沒有觸及國際貿易新規則的主體,也沒有體現發達經濟體和發展中經濟體的核心訴求與期望。雖然多數成員國,尤其是發展中經濟體都希望推動WTO多邊協定并借以重塑全球貿易規則,但心有余而力不足。WTO多邊體系似乎較難在國際貿易新規則上取得突破和發展。
事實上,TPP和TTIP等區域一體化的發展有利于倒逼WTO多邊體系的推進。WTO巴厘一攬子協定的達成,很大程度上是發展中經濟體受到了區域一體化發展的壓力,希望回歸WTO談判促進貿易自由化發展而形成的結果。因而,后巴厘時代的多邊體系也可能有在區域一體化的壓力下推動發展全球貿易新規則。
(四)發達國家或希望形成WTO體系內外相互補充的規則體系
全球貿易新規則的發展和推進途徑顯示了WTO體系內外相互補充和強化的特點。體系內的諸邊協定談判和體系外的區域一體化談判相互補充,諸邊協定主要關注具體領域而區域一體化關注整體方面,相互補充且里應外合推行新的全球貿易規則。
(五)未來區域一體化的發展可能會納入WTO議題
近期以來,不少的研究倡議將區域一體化的發展納入WTO議題,在WTO體系中討論區域一體化,并促成與多邊體系的協調發展,同時提高區域一體化發展的信息共享和透明度。這一新的趨勢意味著,未來通過TPP和TTIP等區域一體化建立的貿易新規則很可能會回到多邊體系框架內,逐步形成多邊的全球貿易規則。
五、對中國的影響及應對策略
中國是全球第二大經濟體,第一大貿易國,全球貿易規則的變動對中國的潛在影響毋庸置疑。整體上的影響是“有近憂而無遠慮”;即雖然在短期內會帶來負面沖擊,但長遠與中國的利益訴求一致。
(一)對中國的影響
短期內的沖擊和影響主要包括以下四個方面。
第一,TPP和TTIP等區域一體化的發展會沖擊中國的出口貿易和對外投資。美國的重要貿易伙伴是美國和歐盟,而兩國都在TPP或TTIP的體系內。
第二,新規則的形成將迫使中國等新興市場國家進一步開放市場,而一步到位的市場開放對中國經濟的短期沖擊是無法避免的。
第三,會削弱中國等新興經濟體的影響力和話語權。發達經濟體重建全球貿易規則的行動安排中,中國等發展中經濟體基本沒有參與或者被排除在外。
第四,中國基本被排除在新貿易規則的形成體系之外,很難在新規則形成中提出自己的訴求,不利于貿易的發展。但中長期之內,發達國家倡導全球貿易新規則的主要目的是要推動全球貿易自由化的發展,開放更多的市場,這也是符合中國利益的。故而長期內與中國的利益一致,并不需要過分擔憂。
(二)應對策略
中國的應對策略上,面對美國重塑全球貿易規則的發展,應有的選擇包括以下五個方面。
第一,密切關注全球貿易規則的發展動向。掌握最新的進展并準確評估可能存在的影響效應,及時根據發展動向制定相應的對策策略。
第二,積極參與全球貿易規則的重建。參與的方式包括加入這些新的區域、諸邊和多邊協定的談判中。積極參與的好處包括:首先,及時了解和影響新規則的制定朝著有利于中國的方向發展;其次,早參與比晚加入能夠獲得先發優勢;再次,以開放促進國內的改革;最后,實踐證明,進一步開放市場可能對中國更加有利。
第三,強化中國在WTO體系中的作用。WTO體系具有無法替代的優勢,貿易新規則最終預計都需要回歸或者上升到WTO的多邊體系中,才能夠成為全球規則。增強在WTO體系中的話語權對中國來說非常重要。中國也應該積極倡導在WTO多邊體系中推動全球貿易新規則。
第四,中國也應積極主導和推動全球貿易規則發展。中國作為全球第一大貿易國,也應該積極主導和推動全球貿易規則,制定有利于中國貿易發展的規則體系。
第五,團結和凝聚其他發展中大國,集體行動影響全球貿易規則的形成,努力構建有利于中國和發展中國家利益的全球貿易和投資規則,促進多邊貿易體系的指針朝著發展中國家的方向偏移。
參考文獻:
[1] 陳淑梅,全毅. TPP、RCEP談判與亞太經濟一體化進程 [J]. 亞太經濟,2013(2).
[2] 鞏勝利. 21世紀:美國新戰略“三大”規則 [J]. 國際金融,2013(5).
[3]李春頂,夏楓林.中美需求結構比較與中國未來的需求結構優化[J] .中國市場,2014(3).
[4]李春頂,夏楓林.需求結構對宏觀調控的影響及中國政策抉擇[J] .中國市場,2014(7).
[5]李春頂, 趙美英,彭冠軍.美國三大需求結構演變及其對中國的啟示[J] .中國市場,2014(19).