焦點探索:大數據與校務研究

 
圖片來源擷取自http://timoelliott.com/blog/2013/07/7-definitions-of-big-data-you-should-know-about.html
繼前期向大家介紹「校務研究與數位學習」之關係與相關技術及應用後 ,本期則接續為大家介紹「大數據與校務研究」之關聯與應用。
何謂「大數據」
7個大數據的定義
校務研究的意義
大數據分析在校務研究之應用



何謂「大數據」
 
 

大數據,英文為Big Data或Megadata,又或稱「巨量資料」、「海量資料」、「大資料」,如圖一,指的是所涉及的資料量規模巨大到無法透過人工或者計算機,在合理時間內達到擷取、管理、處理、並整理成為人類所能解讀的形式的資訊[1]。

在總資料量相同的情況下,與個別分析獨立的小型資料集(Data set)相比,將各個小型資料集合併後進行分析可得出許多額外的資訊和資料關聯性,可用來察覺商業趨勢、判定研究品質、避免疾病擴散、打擊犯罪或測定即時交通路況等;這樣的用途正是大型資料集盛行的原因[2-3]。

圖片來源擷取自http://timoelliott.com/blog/2013/07/7-definitions-of-big-data-you-should-know-about.html
隨著大數據被越來越多的提及,有些人驚呼大數據時代已經到來了,2012年《紐約時報》的一篇專欄中寫到,「大數據」時代已經降臨,如圖二,在商業、經濟及其他領域中,決策將日益基於資料和分析而作出,而並非基於經驗和直覺。但是並不是所有人都對big data感興趣,有些人甚至認為這是商學院或諮詢公司用來譁眾取寵的buzzword,看起來很新穎,但只是把傳統重新包裝,之前在學術研究或者政策決策中也有海量資料的支撐,大數據並不是一件新興事物[1, 4-5]。



7個大數據的定義
 
 
圖片來源擷http://blog.feedtree.cc/2014/09/big-data.html 1. 最基本的大數據定義 The Original Big Data
大數據的3Vs定義是目前為止最受推崇且最廣為人知的說法。3Vs由 Gartner的分析師 Doug Laney 最早在2001年時提出,分別代表資料量Volume、資料傳輸速度Velocity、資料類型Variety。 從那之後,便有人在3Vs之外陸續提出更多「V」,Veracity、Validity、 Value、Visibility等,其中又以Veracity(真實性)最被普遍認同[6]。

2. 大數據即科技 Big Data as Technology
現今要處理的資料量更龐大、資料產生跟處理速度更驚人、資料來源更多樣,於是處理、儲存大量資料的新技術跟工具快速發展,像是開源軟體Hadoop跟NoSQL資料庫。新科技誕生後,開發者跟使用者需要一個專業名詞來與之前的科技作出區別,於是「大數據」一詞因應而生。 大數據不只是指資料,也指這些用來分析、處理巨量資料的新興科技。


3. 大數據即不同的資料類型 Big Data as Data Distinctions
根據Hortonworks公司戰略副總裁Shaun Connolly的說法,過去的資料大部分是人工手記下來的交易紀錄(Transactions),現在則是機器替我們記錄下來的交易資料;除此之外,還有人們跟事物、企業間的互動資料(Interactions),例如人們在網路上點擊網頁跟連結的紀錄;最後則是機器自動生成、累積下來的觀察資料(Observations),例如智慧型家居產品記錄下來的室溫變化等。 因此Shaun Connolly定義大數據是由交易、互動、觀察資料所組成的資料型態。
(右圖片來源:擷取自Contents of above graphic created in partnership with Teradata, Inc.)


4. 大數據即訊號 Big Data as Signals
圖片來源擷取自Contents of above graphic
created in partnership with Teradata, Inc.
SAP公司的高管Steve Lucas不以資料型態來看待大數據,而是以intent跟timing。在過去,企業收集到的資料只能在事情發生後引以為鑒,但現在企業收集到的是「新訊號」,可以在事情發生前得到前兆跟提示,進而做出行動來影響事情結果。例如某品牌廣告在社群網站上的「讚」數、點閱率如果跌落谷底,公司便可以預期接下來產品銷售量一定也會慘不忍睹;同樣的情形在過去時,公司所得到的數據就是產品發售後的銷售量。

5. 大數據即機會 Big Data as Opportunity
根據「451 Research」的數據專家Matt Aslett,他將大數據定義為「以前因為科技所限而忽略的資料」,這個說法也受到許多人的贊同,因為多半提起大數據時,都是在討論這些以前無法分析處理、囊括其中的資料。 其實他在文中並不是用Big Data一字,而是使用「Dark Data(暗數據)」。事實上許多公司都使用暗數據這個字,因為當資料變「暗」了,便表示一個漏掉的訊息、錯失的機會,在企業策略中留下一個盲點。一直以來,各企業雇用數據專家的目的就是希望能「點亮」這些暗數據(illuminate the Dark Data),觀察到以前不曾注意過的趨勢、做出更全面的考量。 因此,SAP曾經做過一個調查顯示,將近76%的企業高管們視大數據為「機會」。個人也滿喜歡這個觀點,畢竟現在各公司在推動大數據的原因,就是希望能掌握全面的訊息、把握住這些機會!

6. 大數據的哲學定義 Big Data as Metaphor
著名的攝影師和出版人,前《Time(時代)》、《Life(生活)》、《National Geographic(國家地理)》雜誌攝影師,負責過有史以來最大攝影項目的Rick Smolan,在他的著作《大數據的人性面孔》(The Human Face of Big Data)一書中,則給了大數據一個最完美的哲學定義 :「大數據是幫助地球建構神經系統的一個過程,在這系統中,我們(人類)不過是其中一種感測器。」

7. 大數據是舊東西的新噱頭 Big Data as New Term for Old Stuff
圖片來源擷取自Google Trends from 2014 也有部份人認為,「大數據」一詞被嚴重濫用,大數據只是商業智慧(Business intelligence)或商業分析(Business analytics)演化後的新字。 從Google Trend裡可以看出,從2004年到現在,「Big Data」一字的搜尋次數從2011年開始飆漲的同時,人們對「Business intelligence」的興趣則是持續降低。「Business analytics」趨勢雖然小幅上漲,但短時間應該不可能趕上另外兩個字的風潮,如左圖。

大數據的應用[1,7]:
包括大科學、RFID、感測裝置網路、天文學、大氣學、交通運輸、基因組學、生物學、大社會資料分析、網際網路檔案處理、製作網際網路搜尋引擎索引、通信記錄明細、軍事偵查、社群網路、通勤時間預測、醫療記錄、相片圖像和影像封存、大規模的電子商務等等。



校務研究的意義
 
 

再次複習一下校務研究的意義:所謂「校務研究」(IR),英文為Institutional Research,源自於美國,在1950年代逐漸專業化與制度化[8]。

IR的出現是為了收集大學內部相關實徵資訊(scientific evidence)並加以整理、共有化,進一步提供給各級決策者(校長等),作為改善與創新行政及教學等決策上的重要依據[9, 22],全球各地成立校務研究相關機構的時間如右上圖。

在美國許多大學中設有校務研究辦公室,其名稱為「Office of Institutional Research」、「Office of Institutional Analysis」或「Office of Institutional Studies」,不一而足;在部分大學中可能與其他財務單位同屬一個組織,或由副校長負責此一功能[10]。

而近幾年在少子化、不景氣與國際競爭造成大學經營環境日漸困難的情況下,IR除了因應上述的功能外,也進一步針對評鑑的需求並滿足社會對於大學相關資訊公開的期盼,而具備多樣的功能,在大學經營上逐漸扮演更重要的角色[8, 22],校務研究的發展歷程如右下圖。

在過去,每個大學也都在進行有關校務研究的過程,包括相關料收集與分析、多方意見的整合、各層級人員的參與、標竿學習、檢視自己與同儕間的強項與弱點,例如教學卓越計畫、校務發展計畫、系所自評報告等計畫書也都是校務研究的一種成果,只是我們缺少了完整性的概念、永續性的機制,以及運用系統化、科學化的運作[11]。

圖片來源擷取自https://www.google.com.tw/webhp?sourceid=chrome-instant&ion=1&espv=2&ie=UTF-8#q=pta_11823_8847736_30752

圖片來源擷取自常桐善(加州大學柏克萊分校校長辦公室校務機構研究員),
美國校務研究的核心內容,2014/11/12。

再者,雖然與Amazon、Facebook、Google等、以及一些全球性企業他們每日處裡的資料量相比, 一所大學的教學與行政等相關校務資料量似乎並不符合「海量資料」的概念(Volume),但是,若從前述大數據的7大定義而言,校務資料仍屬一所大學的商業分析(Business Analytics)與商業智慧(business Intelligence)、也有不同的資料類型(Data Distinctions),更重要的是,隨著全球少子化的趨勢,校務資料更是仰賴科技(as Technology)開創新機會(as Opportunity)!



大數據分析在校務研究之應用
 
圖片來源擷取自林庭瑜、邱育賢、詹雅慧巨量資料衝擊下的校園環境  科學研習No.54-3  2015. 03 23-31頁
校務研究透過系統化、科學化的科技導入,可以創造出更豐富及具價值的發展分析與成效診斷應用。整合各類行政、教職、學生與家長的資料庫系統,並以資料驅動(Data-Driven)為核心,如右圖所示[13]。

並可結合政府資料雲及網路可公開的資料,做為校務研究的資料分析、比對或驗證。




基本的分析應用範例,譬如瞭解學生來源背景與學習成效的關係,如左下圖、畢業生的就業情形與成就,如右下圖 [14]。
圖片來源擷http://blog.feedtree.cc/2014/09/big-data.html 圖片來源擷http://c005.utaipei.edu.tw/ezfiles/22/1022/img/592/168826688.pdf


更重要的是學校對於經營與發展的決策模式也將藉此轉變為以「數據驅動」,或稱「資料驅動」為基礎的決策模式,如右圖上 [12, 15]。

更有進者,在巨量資料的引流下,智慧校園(Smart University)的發展可謂注入一項嶄新的動能。以往智慧校園已強調整合運用雲端運算、虛擬化和物聯網等新技術來改變教職人員、學生、家 長、民眾和校園資源相互運作與溝通的方式,將學校的教學、行政、環境和應用系統進行整合,以提高各項智慧型應用的創新性、效率和彈性,從而實現智慧化服務和管理的校園模式。

如今,在巨量資料的加持下,將能為智慧校園落實邁向一大步;其中包括智慧校園中的全面感知,如可以隨時隨地感知、收集、管理和傳遞有關人、環境與設備等不同來源的資訊,以及對學習者個人特徵(學習偏好、認知程度、反應狀態、學習風格等)和學習情境(學習時間、學習空間、學習人際網絡與學 習活動等)的掌握,如右圖下 [13, 16]。

結語:
大數據的核心價值,就是更能重複使用,並創造新價值。而教育決策者更關心的是,如何從數據中得知相關訊息,了解政策的成效,以及是否有提升學校的教育品質以及經營績效 [17]。(遠距組 王英宏組長撰稿)

圖片來源擷取自彭森明,高等教育校務研究的理念與應用,2013;林世昌,大學校務研究與學校發展實例,2015。

圖片來源擷取自White Paper: The Intelligent Campus, Etisalat BT Innovation Center (EBTIC) 2010


 

參考文獻:

[1]. https://zh.wikipedia.org/wiki/%E5%A4%A7%E6%95%B8%E6%93%9A

[2]. http://www.inside.com.tw/2015/02/13/big-data-2-7-definitions-you-should-know-about

[3]. 麥爾荀伯格、庫基耶原著 林俊宏譯【大數據】天下文化2013.5.30出版

[4]. 一次搞懂大數據(上)http://www.bnext.com.tw/article/view/id/35807

[5]. 一次搞懂大數據(下)http://www.bnext.com.tw/article/view/id/35809

[6]. 巨量資料的時代,用「大、快、雜、疑」四字箴言帶你認識大數據
http://www.inside.com.tw/2015/02/06/big-data-1-origin-and-4vs

[7]. M. Hogan, “What is Big Data” http://www.scaledb.com/big-data-php.php

[8]. 楊武勳(2014)。“日本大學發展「校務研究」作為教學改善之探討”,評鑑雙月刊第47期,取自
http://epaper.heeact.edu.tw/archive/2014/01/01/6108.aspx

[9]. 彭森明(2013)。“高等教育校務研究的理念與應用”,臺北市:高等教育出版社

[10]. 王麗雲(2012)。“大專校院校務研究與資料庫應用”,我國高等教育評鑑發展與實務,121-149頁,
臺北市:財團法人高等教育評鑑中心基金會

[11]. 林博文【大學校務研究的應用–以玄奘大學為例】簡報
www.heeact.edu.tw/public/Attachment/532314175077.pdf

[12]. 陳錦毅博士【校務研究與資料庫建置管理】簡報
https://www.google.com.tw/webhp?sourceid=chrome-instant&ion=1&espv=2&ie=UTF-8#q=pta_11823_8847736_30752

[13]. 林庭瑜、邱育賢、詹雅慧【巨量資料衝擊下的校園環境】 科學研習 No. 54-3 2015. 03 23-31頁

[14]. 常桐善【校務研究的內涵、核心內容以及實施環境】2014. 10. 27
http://c005.utaipei.edu.tw/ezfiles/22/1022/img/592/168826688.pdf

[15]. 林世昌【大學校務研究與學校發展實例】2015.03 大學辦學領航系列講座演講。

[16]. White Paper: The Intelligent Campus, Etisalat BT Innovation Center (EBTIC) 2010

[17]. 蔡明學、黃建翔【大數據分析在我國教育發展應用上之探討】國家教育研究院教育脈動電子期刊 No.4 2015.12