香港教育大學
善用大數據分析 規劃學校持續發展

文: 教育傳媒

教育資訊 教育傳媒 教育專業 教育專業25期 香港教育大學 鄭志強博士 數據科學 大數據

自1970年代以來,計算機系統通過業務流程的自動化為各行業機構提供了競爭優勢,從而為持份者及客戶提供更高效、更具成本效益的服務。時至今天,很多機構的操作數據庫 (operational databases) 已經積累越來越多的數據。學校的數據庫也不例外,儲存了大量有關教與學、學生支援及學業成績的數據。現代企業機構均以分析及運營數據來優化及支持決策,作為獲得競爭優勢的一種手段。對於學校而言,分析這些教與學數據有助課程發展、改善教學策略及提升學生的學習成效。分析數據以發現新決策方案的重要性已被廣泛運用,數據科學(Data Science)便成為新興的學科,而以大數據(Big Data)分析生成的數據量和不同的格式更加成為研究發展的討論焦點。

數據科學和大數據是現代社會的兩大趨勢。數據科學是一種從數據中推斷出可操作的見解的方法,它是一門不斷發展的學科,涵蓋運用統計方法(Statistic)和算法(Algorithms)從結構化(Structural)和非結構化(Unsturtural)數據中提取及發掘知識。數據科學是一個技術、算法開發和數據干擾複雜融合的平台。數據科學的發展涉及各種工具和技術的運用,如數據挖掘(Data Mining)、機器學習(Machine Learning)和大數據。大數據內巨大的數據量,且各種數據的格式均存在差異,故此使用傳統方法難以分析。但為什麼我們使用大數據?這可以簡單地回答,突出兩個關鍵點。它提供了提取大量數據以獲得關鍵和有用知識的能力。分析過程由機器學習(Machine Learning)管理,人工干預最少,因此分析更簡單且無錯誤。

學校需要將他們的數據檔案轉變為知識來源,並用以規劃學校持續發展。學校可以應用數據科學處理所產生的原始數據,去發掘學校管理及教學的知識,並建立學生學習模式,以了解教學成效趨勢及潛在影響學生學習的因素等。學校有需要認識數據倉庫(Data Warehouse),多維分析、在線分析處理(OLAP)數據挖掘、數據可視化(Data Visualization)、簡單查詢及用於報告和大數據技術的分析工具。這些技術允許涉及教學流程業務的單位和部門收集、存儲、擷取和分析數據,以提高管理及教學決策能力。

香港教育大學教育及人類發展學院副院長鄭志強博士