人人書

雜誌

保存到桌面 | 簡體人人書 | 手機版
傳記回憶文學理論偵探推理驚悚懸疑詩歌戲曲雜文隨筆小故事書評雜誌
人人書 > 雜誌 > 旅遊業研究的大數據支持

旅遊業研究的大數據支持

時間:2024-10-28 11:35:34

在旅遊研究方面,大數據技術正在被廣泛應用,可以通過搜索量預測遊客數量,還可以通過網絡評議審視旅館酒店的服務水平

互聯網的普及帶來了一系列新的活動,改變了我們進行傳統活動的方式。我們越來越多地在網上閱讀新聞,在看醫生之前和之後在網上查找醫療信息,在線購買産品和服務(書籍、音樂、機票等),參與社交網絡,與銀行和政府合作,撰寫電子郵件,打電話和在線看電視。這無數的活動在網上留下痕迹,産生了大量關于購買意圖、投票意圖、産品、人員、機構等的信息。在旅遊研究方面,大數據技術正在被廣泛應用,特别是在通過搜索量預測遊客數量方面。同時,如今意見數據不時在網上生成,并以各種形式呈現,如客戶評論、推特和博客。這些意見數據揭示了消費者的主要需求。在市場驅動的産品設計中,特别是在有競争力的産品存在的情況下,從大的消費者意見數據中推廣滿足顧客需求的産品和服務的能力起着重要的作用。對于旅遊業來講,當然也可以通過這些網絡評議審視旅館酒店的服務水平。

大數據時代的旅遊業分析

利用谷歌趨勢預測經濟變量的開創性論文主要側重于關注失業申領的預測。在Choi和Varian展示了如何使用搜索來預測有關前往香港的旅行之後,諸如此類的一些其它的研究也開始集中于其他旅遊目的地。Artola和Galan等研究人員關注了英國遊客流入西班牙的情況,Matsumoto等研究人員分析了日本的旅遊消費。

歐盟統計局(Eurostat)和歐盟委員會(EuropeanCommission)曾經發布過相關的調查報告,提供了支持使用互聯網查詢數據研究旅遊業流入情況的證據。根據有關對于家庭及個人使用信息和通信技術之情況的調查,39%的歐元區居民從事與旅遊相關的在線活動,22%的人在線購買此類服務。那麼差距便為17個百分點,這種差異的大小因國而異,盡管這兩項統計數據提供了類似的信息:它們之間的相關性為0.903。造成差異的原因多種多樣:互聯網普及率、消費者在購買時對網絡安全的信任不足、在歐洲市場運營的公司的在線銷售發展水平較低。很值得一提的是,西班牙是世界上最主要的旅遊目的地之一,也是世界上最依賴旅遊業的國家之一。在西班牙遊客流量最大的三個國家(英國、法國和德國),與旅遊活動有關的互聯網使用率高于歐元區平均水平。

在關于旅遊業發展分析方面,西班牙銀行、西班牙薩拉曼大學及荷蘭阿姆斯特丹大學有關專家學者構建了一個基于互聯網上個人搜索的指标。其想法是:在規劃假期時,人們會經常使用互聯網以搜尋關于他們的目的地(航班、酒店、便利設施、天氣等)的信息。這些搜索可以為實際行程提供一個有價值的先導指标。

當前,随着互聯網使用的擴大,在電子商務網站上發現的評論對消費者的購買決定有更大的影響。旅館酒店行業也是如此。這些網站的一個流行做法是對産品的預定義方面提供評級,從而使用戶能夠獲得重要信息的摘要。這種方法的一個限制是,對于網站未預先定義的産品的某些方面,無法獲得評級和摘要信息。

針對這一弱點,台灣地區有關專家學者提出了一種新的方法,允許用戶指定他感興趣的産品方面,從而系統根據這些特定方面自動對所有在線評論進行分類和評級。值得注意的是,拟議的方法還可以幫助企業查明對用戶重要的問題,否則這些問題就會被隐藏起來。了解他們的關切,可作為改善内部環境和實施服務創新的參考,從而提高客戶滿意度和競争力。

通過對幾個酒店評論數據集的分析,可以确定目标酒店的以下信息:(1)用戶指定的對酒店各個方面的正面、中立性和負面評論的百分比;(2)用戶指定方面的平均評級;(3)根據特定方面對評論進行分類。

與目前的網站實踐相比,這樣的方法具有以下優點:(1)此方法的功能是兼容的,并且可以安裝在當前的電子商務網站上,以改進服務;(2)用戶可以根據自己的興趣獲取信息的摘要;(3)相關分析使用戶能夠輕松地看到相似的觀點組。

商業數據分析的迅速發展使客戶期望的不僅僅是準确的信息;他們期望以準确和符合其需要的信息形式提供更好的服務。為什麼定制或個性化信息很重要?學者Thirualai和Sinhab表示,提供選擇幫助的決策定制與客戶滿意度正相關。還有學者表示,内容相關性、自我參照和目标特異性以多種方式影響網絡用戶的注意力、認知過程和決定。換句話說,用戶可以接受個性化的内容,并發現它有助于決策。雖然傳統的評議功能是有用的,但當用戶的興趣不在網站預先定義的産品方面時,它們就會失敗。

從搜索看客流

鑒于旅遊業在經常賬戶“食譜”中的核心作用,向前邁出的一步應包括收集适當的關鍵詞,以确定哪些是潛在旅行者感興趣的主要部分:即,在尋找與西班牙度假有關的搜索術語時,可能包括與低水平支出相關的術語(如野營、廉價等),或者相反,它們可能會包括與較高支出水平相關的關鍵詞(如高爾夫、帆船、天堂)。這一框架可補充對遊客流入的預測,并最終有助于預測旅遊支出。此外,大數據的未來研究和成功将在很大程度上取決于研究人員更深入地獲取數據,以及大數據作為傳統數據的補充而不是替代的觀點。

西班牙及荷蘭有關專家學者構建了一個基于互聯網上個人搜索的指标。在規劃假期時,人們會經常使用互聯網以搜尋關于他們的目的地(航班、酒店、便利設施、天氣等)的信息。這些搜索可以為實際行程提供一個有價值的先導指标。

在這項研究中,他們建議利用個人在計劃其假期時大量使用網絡搜索這一事實,同時,利用谷歌(Google)提供的這些搜索趨勢的信息,來預測度假目的地的實際旅行者數量。

有兩點需要注意。首先,出于旅遊目的而進行旅遊在線搜索的人數僅占旅行者人數的一小部分,而在這些人群中,年輕人和受教育程度較高的人群比例可能過高。

其次,Google趨勢提供的“搜索強度”指标隻顯示在某一地理區域和時間段内關鍵詞或短語相對于總搜索量的搜索量。某一特定關鍵字的索引值下降并不一定意味着對該特定關鍵字的絕對搜索量下降了;如果它的增加量小于該特定位置和時間段的總搜索量,那麼就足夠了。

相關專家學者獲得了一個查詢索引,該索引是關于上述三個向西班牙提供最大遊客流量的國家——英、法、德,對于前往西班牙度假的相對興趣。所使用的關鍵詞“SpainHoliday”,着重于體現源自英國的搜索;“VacanceEspane”,用于表示源自法國的搜索;“SpanienUrlab”,用于描述源自德國的搜索。為了進一步檢查這一方法的穩健性,相關學者們在“旅行”類别下獲得了“Spanien”(用于源自德國的搜索)、“Spain”(用于源自英國的搜索)和“埃斯帕涅”(針對源自法國的搜索)的查詢索引。

對于這三個國家中的每一個,将實際的遊客流入量與GoogleTrend提供的查詢索引進行比較。Google索引為每周提供一次,并取平均值以獲得月度的系列。當一個星期在兩個月之間重疊時,它被分配給工作天數最多的月份。遊客流入的時間序列由旅遊研究所(“InstitutodeEstudioTuristicos”)每月出版,該研究所編制月度調查(“MovimientosturisticosenFronteras”),向遊客抽樣詢問其居住國和旅行目的,從而能夠确定每月遊客人數和原籍國。

将來自每個國家的遊客流入量與相應的Google查詢索引進行比較。兩個旅遊系列的模式并沒有很大的不同,部分原因是旅遊系列的季節性很強,夏季的遊客流入最多。還需要注意的是,互聯網搜索可以在一定程度上引導遊客流入。

相關研究認為,納入一項基于在線搜索的指标,改善了對2012年之前遊客流入的短期預測——樣本均方誤差減少了42%——表明在線搜索中有價值的信息可以改進分析師使用的常規統計數據。然而,在接下來的幾年裡,相關的模型的性能會惡化。

這不禁讓人想起以前成功地使用谷歌搜索詞來識别流感爆發的過程(金斯貝格塔爾,2009年),但在随後的幾年裡失敗了。從2009年開始,谷歌流感趨勢(GFT)一直在過度預測流感。Butler(2013年)報告說,GFT趨勢預測,類似流感的疾病就診比例将增加一倍以上。

實踐證實,谷歌趨勢現在可能會提供好的結果,但索引和使用可以迅速改變,算法會定期改變,用戶基礎可能會根據政策或任何其他原因轉移到實際結果中去。

我們可以推測相關模式的表現惡化的可能性:潛在旅行者在組織旅行時使用的搜索詞的變化,對一國(或地區)度假信息的搜索量的增加沒有轉化為由于意外事件而湧向該國的遊客的增加。許多可供選擇的搜索詞可以被探索、評估和比較,但無論如何,為了了解搜索詞的動态,還需要進行更多的研究。

雖然傳統的評議功能是有用的,但當用戶的興趣不在網站預先定義的産品方面時,它們就會失敗。在線消費者評論常常不能滿足消費者的需求。

從評議看服務

網絡和信息技術的廣泛使用導緻了大量的傳統商業活動在網上進行。許多電子商務系統允許客戶對他們購買的産品表達自己的意見,并查看以前客戶發布的評論。提供這一選擇的目的是希望提供可靠、可信賴的信息,并改進他們提供的服務。

例如,在hotels網站上,潛在客戶可以閱讀前幾位客人關于他們可能感興趣的酒店的評論。因為這些評論揭示了以前客戶的真實體驗,它們對潛在客戶産生了強大的影響。

除了客戶評論之外,許多網站還提供關于其服務的各種預定義方面的彙總評級信息。這有助于用戶盡快評估評論内容。然而,商業數據分析的迅速發展使客戶期望的不僅僅是準确的信息,他們期望以準确和符合其需要的信息形式提供更好的服務。

用戶可以接受個性化的内容,并發現它有助于決策。雖然傳統的評議功能是有用的,但當用戶的興趣不在網站預先定義的産品方面時,它們就會失敗。

在線消費者評論常常不能滿足消費者的需求。大多數現有的評論網站對産品的各個方面提供摘要的評分,這使消費者能夠快速地掌握評論的内容。在相關的研究中,有關專家學者曾考慮了兩個著名的酒店評論網站:Hotels和booking。Hotels根據以下五個預先定義的方面為每家酒店提供平均評級:清潔、服務、舒适、條件和鄰居。同時,booking根據以下七個預先定義的方面為每家酒店提供平均評級:清潔、員工、舒适、設施、位置、性價比和免費WiFi。

值得注意的是,如果客戶對酒店的“物有所值”或“免費WiFi”感興趣,則hotels不提供用戶所需的彙總評級,因為這些方面不是其系統的一部分。對這些方面感興趣的消費者隻能通過逐一檢查每個相關的評論來比較和評估酒店,這可能非常耗費時間。更糟糕的是,消費者可能因為無法獲得所需信息而有不滿意的體驗,從而導緻他遷移到其他網站。換句話說,雖然有關預定義方面的信息有助于客戶快速評估酒店,但當消費者有系統中沒有預定義的獨特需求時,很難從網站上的大量評論中獲得準确的摘要。

因此,有關研究提出了一種根據用戶特定方面對在線評論進行評級和聚類的方法。為了測試所提出的方法,相關研究使用hotels作為研究對象;但是,他們的方法并不是特定于這個站點的。Hotels符合上述特征,因為該系統提供了總體評級以及與清潔、服務、舒适、條件和鄰裡有關的平均評級摘要。它還顯示了每個酒店的許多評論,每個評論是由許多句子組成的。

在相關研究中,研究人員使用了一種觀點挖掘方法來提取隐含的觀點,即根據特定的方面對評論中的句子進行分類。然後通過分析來确定這些句子的情感極性。使用這些方法可以形成酒店特定方面的情緒表,顯示評論中正面、中性和負面意見/句子的數量。通過總結某一特定酒店的所有評論的情緒表,相關研究人員得到了酒店級别的整體情緒表。

此外,這使目标酒店的情緒表中的價值彙總成為可能,并使其能夠獲得與目标酒店在每個特定方面的業績相關的評級。最後,可以對所有評論的情緒表進行聚類,以揭示總體情況,即對目标酒店的總體看法。

諸如這樣的研究,其貢獻主要有幾個方面。首先,無論網站是否提供與預定義方面相關的彙總評級,該方法使用戶能夠獲得他們感興趣的特定信息。所提出的方法可以擴展評論網站的功能,以更加靈活和動态的方式滿足用戶的需求。其次,使用這些方法可以讓用戶快速評估和比較酒店,而不需要花費大量的時間閱讀評論。

通常,包含産品或服務的客戶評論的網站隻允許用戶根據網站預先定義的方面從在線評論中搜索摘要信息。當用戶對未經網站預先定義的産品或服務的特定方面感興趣時,他們可能難以獲得所需的信息。

本項研究旨在通過檢索基于用戶需求所指定的搜索參數來對産品和服務進行審查,幫助用戶從中提取信息摘要,從而将用戶需求與網站上發掘的搜索特性進行對接。NGD或WordNet被用來計算現有評論句中的術語和用戶生成的與興趣相關的術語之間的相似度。然後使用SentiWordNet3.0來分析每個句子的情感極性。

這就産生了對每個評論的評論情緒表,顯示了評論句子在用戶感興趣的方面的分布和情感。由此生成的酒店情緒表提供了與所述酒店相關的所有評估情緒表的概述。最後,将每個評論以向量形式表示,并使用一種算法對評論中表達的意見進行聚類,以便更好地了解針對特定酒店報告的主要類型的意見。此研究使用了來自hotels的顧客評論作為目标數據集來檢驗這些方法。

該方法可分為兩部分。第一部分是對方面分類和情感分析相關結果的評價。第二部分是對實際審查進行聚類,以獲得對這些審查中提出的意見的概述。相關研究結果證明了其所提出的--對于在産品或服務可以被評議的網站上所發現的信息進行總結(根據用戶的興趣)--方法的有效性。
   

熱門書籍

熱門文章