随着網絡技術的日益發展,網絡技術的效率越來越高,個人對互聯網的使用也越來越頻繁,大量的數據開始堆積如山。這些數據,至少在開始的時候,是在人們不知道的情況下存在的。新的調查數據的美妙之處在于,與傳統的調查數據不同,傳統調查數據是在個人同意下收集的,可能會受到一些主觀的影響,而互聯網的普及帶來了更多的數據,而這些數據不都是來自于自願被調查。它們揭示了人們在家中隐私環境中做出的發自内心的、合乎邏輯的選擇,盡管他們認為自己沒有被觀察到。
這種類型的數據之所以出現,是因為過去的“線下”生活越來越多地被轉移到網上。信息通信技術和互聯網可以做得很好的一件事就是在幾乎任何類型的市場,在任何類型的匹配任務中減少摩擦。因此在不同的環境(和市場)中處理搜索和匹配的許多企業,現在在“線上”進行搜索和匹配。
新的數據将從所謂的物聯網中誕生。越來越多負擔得起的嵌入式傳感器将及時傳輸精确的地理位置測量數據,涵蓋從個人生命體征到個人情緒狀态和幸福感,以及任何經濟活動和其他人類活動的方方面面。顯然,這些發展将使經濟社會和人文研究更加依賴數據,因此将帶來新的研究機會,但也帶來新的挑戰。
數字生活:文化的可感知性
新媒體對日常生活的滲透表明,現實與虛拟、物質與網絡空間的分離是錯誤的。可以這麼說,關于無地域或非物質生活的最初預言已經被現在關注的焦點所取代,尤其是,媒體如何使當地生活運轉起來?對此,英國杜倫大學的MikeGrang教授曾撰文做過深入的讨論。
最首要的當然是,除了社交媒體之外,基于位置的社交網絡也在大量湧現。而更有意思的是,還有一種“混合”的數字遊戲,與虛拟遊戲不同,參與者将自己嵌入到不同的地方——在現實生活中的街道上模拟僵屍攻擊,或者在周圍和附近的參與者玩耍。此外,藝術作品越來越多地對空間進行注釋,将數字内容分層到場地或使用場所來告知媒介内容。例如,JanetCardiff的作品被各種各樣的geowebbed媒體跟随,這些媒體現在也在現場傳遞故事,用過去的聲音場景或藝術介入重新填充城市環境。
還有一些人則将多種不同形式的數據混合在一起,以改變空間的體驗,并為流行歸檔添加可能性。在這裡,新媒體于空間實踐中與重疊的分布式存檔相結合。當然,當時流行的存檔和作者身份(一如既往)反映了權力的多重維度,在這種情況下,通過新技術調解關于誰寫什麼。
在這一點上,可以分析不同媒體變體中關于場地的不同符号的分層——看看同行或是實際上競争的媒體,以及它們試圖為場地創造霸權意義的不同用戶群體。我們有關于有争議和多義性的景觀的長期争論的非常成文的規定。但是,對于文化地理學來說,有一些新的幹預工具,可以通過進行地理标記,向既有技術添加公共檔案注釋。
社交媒體通過它們留下的數字痕迹,讓人們可以通過分析(由學術機構、政府,或者,更多的是公司),來觀察社會生活的前後變化。我們平凡的社交生活變成了數字中介,可以通過詞法分析進行定量概括。例如,相關研究人員艾倫·米斯洛夫和他的同事們針對美國關于地理定位的推文(tweets),應用了一種詞彙評分系統——對積極和消極的内涵進行打分——來制作令人震驚的“國家情緒”時間流逝地圖。類似的方法也将發帖與股市走勢聯系起來,隻不過迄今為止的結論都很平庸。
視覺化的詩學和情感力量往往比所謂的“結果”更強大。很明顯的一個結果是:作為“證據”的社交媒體機構、使用它的媒體研究人員,都“不僅僅是社交媒體内容的觀察者或使用者,而是這種基礎設施的推動者”,他們通過特定的媒體平台構建一個問題,冒着再現媒體如何對此問題框架化的風險。
以上這些分析,使得情感和情感在社會生活中傳遞的中心地位更加明顯。可是,這是通過量化來實現的,很多關于情感或影響的研究都是從假設它們不可量化開始的。
加布裡埃爾·塔爾德(Jean-GabrielTarde)将經濟和社會性視為一系列可量化的強度。早在20世紀初,他就提出,社會科學研究的問題不在于它的量化,而在于它的度量是錯誤的。他想知道,通過創造“價值計量單位”或“榮耀計量單位”,來發展名望、魅力和幸福的衡量标準的可能性。學者們指出,我們現在應該“毫不費力地理解數字化對權威的計算、可信度的映射和榮耀的量化都做了什麼”。
然而,對替代度量的熱情大大低估了任何和所有度量可能産生的疏離。比如,學生評價、國家研究評價、排名表、引文分析、推特熱議(在這裡,學術工作在社交媒體上的流通是由諸如altmetrics等這樣的措施記錄的)等越來越多地支配學術生活的一系列事物,似乎并不能促進積極的影響。這些衡量标準并不是簡單地報告現實世界,而是按照它們自己的形象對其進行格式化。使人文活動更容易被察覺,不同群體從而更容易行動,凸顯了費德裡希·基特勒(FriedrichKittler)所說的“選擇機制”的重要性。
同樣的情況是,通過複制當前的交互模式這樣的數據,無論在重複當前占主導地位的内容方面,還是在重新定義簡單化一元論方面,往往都是保守的。數字化對權威的計算、可信度的映射和榮耀的量化都做了什麼?用大數據衡量經濟社會的人文環境
如果說新媒體在記錄社會人文活動的痕迹,那麼舊媒體也在被改造。如Kittler所言,媒體是“制造、加工、傳送和存儲信息的物質設備”。随着數字媒體的使用越來越多,正在進行的是從圖書館向數據庫的mnemotechnical轉變。羅傑·查蒂耶(RogerChartier)認為,這樣做的結果是對之前因物質差異和相關慣例而被分割開來的話語的去分化。Chartier推測,在數字世界中,所有文本實體都像提供片段的數據庫一樣,閱讀片段絕不意味着對作品或作品主體的感知。問題是,數據庫與叙述是相對立——正如LevManovich所主張的那樣,還是如KatherineHayles所說的與之共生?
這意味着要更多地關注信息呈現的慣例和模式。有關學者喬安娜·德魯克認為,這突出了文本的空間組織和這些結構的語義關系。在這方面,她提出了兩種可能的方法:第一種她稱之為推理性計算,第二種是對客觀數據有科學依附的數字人文。第一種利用視覺化的力量來産生情感反應,德魯克稱之為“圖解學”,即材料的組成可能性和分布的表現關系。後一種數字人文的方法挖掘數字文本對象的全體,通過數據可視化或“InfoVis”技術揭示關系模式。
InfoVis使用圖形原語,例如點、直線、曲線和簡單的幾何圖形來代替對象和它們之間的關系,不管這些對象是人、他們的社會關系、股票價格、國家收入、失業統計還是其他任何東西……這種還原論成為現代科學默認的“元範式”,并繼續統治着今天的科學研究。
因此,這種方法很可能會使許多人感到不安,因為它不僅從根本上說是定量的,而且還受到了簡化主義敏感性的影響:在科學中,理論從經驗中提煉出一些基本規律,從而把看似無限的特殊性減少為區區的少數。可以減少的實例越多,理論就越有說服力。減少是好的,增多是壞的。
這種簡約的數字人文學科體現在“文化組學”(Culturomics)中,它挖掘通過谷歌(Google)獲得的數字化書籍以繪制出:随着時間推移的國交媒體,但該領域的未來也将意味着對過去越來越雄心勃勃的嘗試。随着數字化曆史檔案的不斷擴大,以及社會學家們協調新的方法以組織有關意義演變的豐富細節的定性元數據,文化社會學家應對大數據運動引起重視。
可是,長期以來,社會學家——尤其是文化社會學家——在很大程度上忽視了所謂“大數據”的前景,文化社會學家将有關互聯網網站和其他數字化文本中數億人的論點、世界觀或價值觀的信息源留給了計算機科學家,計算機科學家擁有提取和管理此類數據的技術專長,但缺乏解釋其與國之間的情緒化術語的頻率,或者查看有關氣候變化的關鍵術語的興衰,凡此種種。然而,尋找文化标記作為更大的文化單元的轉喻,在文化地理學中已經相當的過時了。相反,當社會媒體被挖掘出來時,被追蹤到的是行為性的流動,而不是特定文化的标記。
英國杜倫大學教授MikeCrang表示,十分贊同學者DeLyser和Sui的觀點,他們擔心“文化組學”可能會淹沒傳統的解釋性學問,隻進行淺表的數字運算,而沒有立足于分析的對象或過程。學者Mays有力地辯稱,解構主義和量化的方法以對比的方式看待文本。解構主義傾向于聚焦于某一具體的作品上,表明其意義是不确定的、開放的、有争議的解釋,而定量方法則側重把握文本的擴散,賦予文本确定性的意義。
長期以來,文化社會學一直受到理論和數據不平衡的困擾。然而,大數據運動可能會從根本上改變這種不平衡。大數據運動始于互聯網與社含義的理論指導。
美國北卡羅來納大學學者ChristopherBail的一項研究提供了大數據運動中最近發展的批判性調查,并将它們與文化社會學中傑出的理論争辯和測量挑戰聯系起來。在描述大數據對文化社會學的前景時,該項研究還詳細介紹了後一領域如何解決前者最棘手的一些挑戰。
ChristopherBail表示,該研究隻對處理大數據時出現的技術和後勤問題進行有限的讨論,也不考察量化叙事分析這一有希望的領域,而主要是對對大數據潛力感到好奇的文化社會學家的邀請,也是對打破阻礙該領域與大數據運動的領導者之間合作的學科豎井的呼籲。
數字重塑人文社會的挑戰
文化社會學家和人類學家倡導的深入的定性編碼技術的集成,可以用來改進計算機科學家、語言學家和政治科學家已經很強大的自動文本分析技術。這種綜合将使文化社會學家能夠在那些曾經被認為是不可衡量的問題上取得理論上的進步。
大數據的支持者還可以從文化社會學家那裡獲得關鍵的洞察力,了解如何進一步完善他們的工具,以繪制社會和人文領域的輪廓圖,對文化元素進行分類,追蹤人文環境随時間的演變。
然而,盡管對文化社會學和大數據的結合持樂觀态度,但巨大的障礙依然存在。也許最令人煩惱的問題是,大數據往往不包括關于文本産生的社會背景的信息。雖然我們能夠收集數百萬關于幾乎任何問題的博客帖子,但這些數據通常隻包含很少或根本沒有關于此類帖子作者的信息,或者是那些對它們發表評論的人的信息。
Twitter的數據是公開的,但提供的關于Tweets産生的社會背景的信息非常少。Facebook等其他網站收集了大量關于社交環境的數據,但由于擔心用戶隐私,往往無法與研究人員共享這些數據。社交媒體之外的大數據來源也往往缺乏關于文本産生的社會背景的重要信息。收集每一篇關于政治話題的報紙文章都是沒有多大用處的,缺乏對導緻媒體傾向于一個問題而不是另一個問題的政治和體制過程的深入分析。
然而,這些障礙并非沒有解決方案,這些解決方案可能建立在文化社會學家開發混合方法研究設計的進展基礎上。例如,可以對Twitter用戶進行定性或定量調查,将他們的在線行為置于更廣泛的背景下。或者,大規模的媒體數據或曆史調查的分析,可以用來找出比較曆史分析的令人感興趣的謎題。從理論上講,大數據也可以用來指導人種學,或者至少幫助将民族志的發現置于更廣泛的人文領域。簡言之,大數據方法應該被視為文化社會學中經得起考驗的技術的補充而不是替代。
第二個主要挑戰是計算機輔助編碼永遠不會比編碼本身更可靠。文化社會學家很少讨論編碼标準或編碼間的可靠性,部分原因是我們對許多核心概念的定義存在很大争議。例如,人們隻需閱讀有關框架的文獻,就能看到關于是否以及如何衡量或操作這些框架的重大分歧。
雖然這些争論不會輕易解決,但大數據和文化社會學的整合将在很大程度上取決于我們是否有能力就這些核心概念的若幹廣泛接受的定義達成一緻。然而,大數據實際上可能會促進這種對話——因為文化社會學家之間概念模糊的部分原因是我們缺乏共享的數據集。文化社會學家也在跨越學科界限,尋找使核心概念更加具體的指導。例如,Mohr等研究人員将語言學的叙事文獻與社會學、計算機科學的社會網絡研究和主題建模研究相融合。學者Polletta目前正在綜合語言學和文化社會學,使用新的可視化技術,使他們能夠探索如何讓人們意識到他們的文化圖式如何塑造他們在民主審議中的行為。
文化社會學家的最後一個擔憂是,對于那些希望在目前使用大數據所必需的技術專長方面有所發展的人來說,進入成本相對較高。盡管得益于簡單的基于網絡的大數據分析工具,這些成本正在迅速下降,但将這些技術正式化用于文化社會學,将需要新一代擁有技術專長和理論抱負的學者。目前,大數據運動迫切需要以理論和定性為導向的文化社會學家的指導。沒有大的思考,就不能從大數據中學到什麼。雖然數據挖掘可以在大文本語料庫中揭示有趣的模式或引人入勝的可視化效果,但許多幹草已經變得像針一樣。因此,大數據運動的未來取決于文化社會學家、計算機科學家和其他人之間的合作,教計算機區分不同類型的意義及其随時間變化的關系。