本文數據來源為學校數字化校園各業務系統、數據中心及數據綜合服務平台,包括學校一卡通午餐刷卡數據、人事數據、教務數據、多媒體教學系統數據等。基于以上背景,主要實現以下幾個目标:分析就餐人員類型,為今後各單位财務統籌提供數據支持;分析不同時段的就餐人數,為食堂供餐分時管理提供決策依據;分析教工食堂開放後,在校就餐教工人數及平均餐費的對比,為業務部門的業務管理、創新發展提供了數據支持。
數據清洗與統計
1.一卡通數據
(1)原始一卡通數據
一卡通原始消費記錄數據如圖1所示。
圖1一卡通原始消費記錄數據其中各字段意義如下:
ZGH:職工号;
XM:姓名;
PRICE:金額;
ARISES_TIME:時間;
IDENTITY_CARD:身份證号碼;
WNDPS_ID:設備編号;
PROP_DESCRIPTION:地點。
(2)一卡通數據清洗
數據清洗過程如圖2所示。
(3)就餐流量的統計
圖2一卡通原始消費記錄清洗過程新建存儲過程按分鐘計算就餐人數形成就餐流量統計。
其中各字段意義如下:
RS:就餐人數;
SJ:時間;
RQ:日期。
2.教務數據
(1)原始教務數據
教務數據來自學校教務系統,每日上課的課程表集成了本科教務數據和研究生教務數據。
其中各字段意義如下:
ZGH:職工号;
XM:姓名;
KCMC:課程名稱;
JIAOSHI:上課教室;
SKSJ:上課時間;
BZ:備注。
(2)教務數據清洗
由于研究生與本科生上課時間數據格式并不相同,需要将上課時間字段進行清洗和整理。由于數據清洗過程較為複雜,需分别對研究生和本科生教務數據按照其自有格式進行清洗整理、整合。以2017年4月11日為例,我們整理了當日上課的所有教師數據,共有408條記錄。
整理後的數據中存在同一位教師在一天有多節課的情況,進行二次整理後我們得到了當天有課的所有教師的職工号,2017年4月11日當天有課的教師人數為305人。
3.多媒體教學數據
(1)多媒體教學數據的獲取
要篩選某個時間段上課的教師信息,首先在多媒體系統的設備使用信息表中篩選出上課教師的卡信息,再結合人事系統及一卡通系統進行數據分析。
以2017年4月11日的設備使用信息為例,表DeviceUseInfo部分字段含義如下:
USEID:設備編号;
ROOMID:教室号;
DEVICENO:設備号(電腦或投影儀);
CARDNO:多媒體系統識别的一卡通号;
BEGINTIME:刷卡開始時間;
ENDTIME:刷卡結束時間。
多媒體系統中一卡通編碼表CardInfo部分字段含義如下:
CARDNO:多媒體系統識别的一卡通号;
USERNAME:姓名;
EMPLOYEEID:職工号。
(2)多媒體教學數據的清洗
将DeviceUseInfo表及CardInfo表以字段CardNo為關鍵字進行連接,篩選出使用多媒體設備開始時間在上午10:00~12:00的教師數據(以2017年4月11日為例),即篩選出4月11日上第二大節課的教師信息(如圖3所示)。
其中前三行數據為未刷個人一卡通,而是到管理員處借公用卡插卡上課的教師,他們的信息無法統計,因此這三條信息為無效信息。
4.人事數據
人事數據來自學校人事系統,是所有業務系統相關數據的核心。人事數據以職工号字段作為識别系統的數據表。
人事基本信息數據其中各字段意義如下:
ZGH:職工号;
XM:姓名;
DEPART_ID:部門id;
ID:人事系統id
人事系統與其他業務系統關聯結構如圖4所示。
圖34月11日第二大節課的教師信息數據分析與呈現
1.就餐人數整體趨勢分析
(1)按照周次分析就餐整體趨勢
分析了一學期之内的就餐人次整體趨勢。周次與就餐人次關系的整體分析趨勢圖如圖5所示。
2017年上學期,平均每周在教工食堂就餐的教職工人次為2079,教工食堂剛開始營業的兩周内人數較多,後逐漸趨于平穩,系統數據結構在5、6月主要教學周内,平均每周就餐人數為2114人,考試周期間平均人數為1780人。
圖4人事系統與其他業務系統關聯結構
圖52017年上學期周次與就餐人次的關系(2)按照日期分析就餐整體趨勢
主要分析每周從周一至周五的五天内,就餐人數的變化情況。統計時,排除了節假日在内的周次,避免出現較大誤差。統計結果如圖6所示。
圖6每月周一至周五平均每日就餐人數從圖中可以清晰地看到,由于周三下午很多單位會召開每周例會,周三的就餐人數最多,比其他四天的日就餐人數增加13.8%;而周五由于臨近周末,就餐人數最少,比其他四天的日就餐人數減少15.5%。
2.就餐人員類型分析
按照教職工崗位類别,分别對其在教工食堂吃午餐的情況進行分類統計。崗位類别及其具體人數統計可參考表1。
統計不同類别的教職工5月就餐情況如圖7所示。從圖7中可以看出,所有類别中除教師類外,其他人員就餐人數較為穩定,總計平均每天為188人;教師就餐人數浮動最大,由于5月28~30日是端午節假期,教師曲線趨勢驟然下降。
圖7按教職工崗位類别統計就餐人數趨勢3.就餐時段分析
(1)就餐時段整體分析
首先,将就餐區間劃分為5個時段,從11點20分至13點,每20分鐘劃分為1個時段;然後,按照教師刷卡時間統計不同時間段内的就餐人數;最後,以周為單位得出每天的統計結果的均值,并劃分出就餐高低峰時段。
2017年上學期的分析如表2所示。從表格中我們可以得出以下結論:
每天11:20~11:40時間段内就餐人數最多,12:40~13:00時間段内就餐人數最少,就餐最高峰期平均進入食堂人數為8人次/分鐘;
每日11:20~12:20可視作就餐高峰期,就餐人數占總人數的90%;
在高峰時段内就餐的人數大體上随着周數的增加遞減,在16周之後基本均小于平均人數,我們可以結合就餐人員類型分析的結果進行推測,人數遞減是由于考試周臨近,上課教師人數的減少導緻的;
在低峰時段用餐的人數變化較小,但在最後兩周人數均超過平均人數。說明臨近假期,考試及會議安排較多,教職工行為模式較以往不具備普遍規律性。
(2)不同類别教職工就餐時段分析
按照教職工崗位類别對其就餐時段進行分析,分析結果可以幫助我們預測不同類别教職工就餐習慣。
從圖8可以得出以下結論:
專業技術人員、行政管理人員及工勤人員每天集中就餐時間段為:11:20~12:00,平均人數為54人/天,占比為87.3%;
教師科研人員每天集中就餐時間段為11:20~12:20,平均人數為201人/天,占比為86%,與其他教工不同的是,教師科研人員中平均每天有81人在12:00~12:20時間段内就餐,是其就餐人數最多的時段;就餐時段最少的為每天12:40~13:00,平均就餐人數為7人/天。除11:20~11:40時間段内,其他時段教師科研類職工就餐占比均超過50%,就餐人員以其為主要人群。
圖8按教職工崗位類别統計就餐流量
圖94月10日至4月14日上午有課教師就餐人數及占比
圖105月15日至5月19日上午有課教師就餐人數及占比4.特殊就餐分析
(1)特殊就餐者分析
特殊就餐者指的是上午有課的教師,分析他們的就餐比例有助于了解授課教師的實際需求,并為食堂流量預測提供數據參考。
學校2017年上學期有本科或研究生授課任務的教師共626人,我們随機分析了4月10~14日即第7周及5月15~19日即第12周的數據,彙總如圖9、10所示。
通過上述統計,我們可以看出,平均每天上午有課教師人數為141人,其中有33.1%的教師選擇中午在教工食堂吃午餐,其餘将近67%的教師不在學校就餐,就餐人數比例偏低,同時比例在33.1%左右變化很小,其中周三的就餐人數最多,在60人左右。周五就餐人數最少,在30人左右。
數據挖掘與應用
1.教工餐廳使用前後數據分析比較
首先要進行數據清洗,清洗條件為:一卡通交易時間為2016年4~6月,工作日,中午11:20~13:00;刷卡機編号為消費;人員為人事系統中在職狀态字段為“在職人員”的教職工。
(1)就餐人數比較
我們比較了教工食堂開業前後同期在校吃午餐的教職工人數。教工食堂開業後,就餐人數有15%左右的提升,在學校吃午餐的教職工人數增多了150人左右。
(2)平均餐費比較
通過比較教工食堂開業前後同期在校吃午餐的教職工平均每人每天午餐消費金額,我們發現,教工食堂開業後,平均每位教職工每天消費下降了40%左右,說明教工食堂的開設确實為教職工提供了很大福利。但同時,2017年4月~6月,午餐消費從6.06元上升至6.32元,說明在學校吃飯但選擇教工食堂的教職工比例有所減少。如何保持并吸引教職工選擇在教工食堂用餐,這對食堂的管理者也提出了更高的挑戰和要求。
2.基于多維數據的就餐流量預測
(1)從整個學期的角度按照教學周次判斷就餐人數的變化。根據就餐人數整體趨勢的分析,在1~12周整體就餐人數将保持在一個較高水平,平均每周就餐人次預計會有2200人左右。在13~17周,就餐人數有所下降,平均每周預計在1900左右。最後18~20周考試周期間,平均每周預計在1700左右。
(2)按照類别估算,除教師外其他人員每日變化不大,平均每天就餐人數在190人左右,而教師類人員就餐人數在200人/天左右浮動。所以,平均每日就餐人員預計為390人,高峰時将會達到500人左右。
(3)按照日期估算,前半學期周三就餐人數最多,預計500人/天,周五就餐人數最少,預計400人/天,其他日期預計450人/天;後半學期,周一至周四預計400人/天,周五人數最少,預計300人/天。
(4)按照就餐時段估算,每天高峰時段為11:20~12:00,在1~15周在此時段内平均就餐人數為320人/天,15~20周平均270人/天。
通過上文的數據分析與挖掘,我們可以清晰地看到隐藏在每日簡單的刷卡就餐數據背後更為深層的數據意義。管理部門可以此為依據,更理性客觀地為學校提供管理決策。
同時,可以看出任何一次有效的數據挖掘必須建立在學校各個系統有效連接、數據高度互聯互通的基礎之上。智慧校園需為學校各部門、院系開展教學、科研提供人、财、物管理的整合統一、深入廣泛的信息化支撐和協同的校務管理支持。
(責編:楊潔)
(作者單位為東北财經大學網絡信息管理中心)