PRAGMA(PacificRimApplicationsandGridMiddlewareAssembly,環太平洋網格應用與中間件聯盟)是一個開放的國際合作組織,緻力于在太平洋周邊地區相關領域内的重要學術機構之間建立起持續的合作,并推進信息技術在不同學科的應用[1]。PRAGMA于2002年3月成立,獲得美國自然基金會(NSF)的支持,截至2017年PRAGMA有正式成員29個,來自14個國家和地區的大學和科研機構,如美國加州大學聖地亞哥分校(UCSD)、美國佛羅裡達大學、美國印第安納大學、日本産業技術綜合研究所(AIST)、大阪大學、韓國科學信息技術研究所(KISTI)、中國科學院、吉林大學、蘭州大學等。
PRAGMA集中開發、部署實際的網絡基礎設施來幫助一個長期的科研團體之間的合作。目前PRAGMA的研究主要有生物多樣性、淡水生态學、SDN、電信科學、教育、生物科學和地理科學。PRAGMA探索各領域科學家和網絡基礎設施專家如何在很長一段時間内一起工作,同時開發滿足科學需求的解決方案,并讓它們更廣泛地應用。
為了實現這個目标,PRAGMA目前的活動主要包括:通過打造一個能夠開發和測試信息技術的專業科學家和信息技術設施研究者組成的團隊來培育一個國際的科學探索團體,去解決具體的科學問題,并建立一個可用的、國際規模的網絡信息環境;通過共享資源、專業知識以及軟件來建立和改進一個基礎的、用于測試的國際信息基礎設施。
PRAGMA每年舉辦兩次工作研讨會,研讨會由不同的成員組織輪流主辦。它是不同工作小組、研究人員和工作人員之間信息交流的主要工具,提供一個讓所有成員認識并讨論研究興趣的論壇。同時他們還提供絕佳的機會讓新研究人員和學生參與進來,為PRAGMA帶來新的視角、應用、技術以及資源。在研讨會上大家各自彙報在項目上取得進展,并制定行動計劃,以及在下一階段完成任務,極大地促進研究的可持續性。PRAGMA目前有四個工作小組,分别是Resources、Biosciences、Telescience和Cyberlearning。Resources主要研究PRAGMA分布式資源平台上的各種應用;Biosciences從事如何創建一個穩定的信息基礎設施執行基因組分析,并整合許多技術建立一個能夠促進傳染疾病藥物篩選的計算架構。Telescience主要研究如何利用和開發高分辨率顯示技術對遠程設備進行接入。Cyberlearning主要集中在使用技術手段來改善對一些計算科學的理解,從事基于仿真的學習技術研究。除此之外,PRAGMA還有一個關于如何培養從事國際跨學科研究的學生項目PRAGMA學生團隊,幫助學生加強學術研究的能力和經驗。
PRAGMA-ENT
PRAGMA-ENT是PRAGMA的網絡實驗床,其目标是給PRAGMA的研究者和合作者建立一個軟件定義網絡(SDN/OpenFlow)的網絡測試床。它給研究者提供一個完全免費的可接入網絡資源來開發、測試以及評估基于SDN的網絡,而且它給PRAGMA的多個雲平台提供網絡支持,通過在環太平洋地區的研究所之間建立新的合作和基礎設施來促進e-Science的長期發展。目前接入PRAGMA-ENT資源的有美國佛羅裡達大學、加州大學聖地亞哥分校、印第安納大學、日本奈良科技研究院(NAIST)、日本國立先進工業科技研究院、大阪大學。由日本JNG公司提供的RISE(ResearchInfrastructureforlarge-ScalenetworkExperiments)被用來連接所有站點的OpenFlow交換機,并且建立控制器來管理整個測試床。目前已經成功部署了基于RISE的交換機,并開始連接美國、日本,它将有助于優化這些國家的路由,并提高PRAGMA-ENT的性能。接下來PRAGMA将和泰國大學進行合作,研究開展管理和可視化的PRAGMAENTOpenFlow網絡,這對幫助研究者理解PRAGMA-ENT非常有幫助。而且PRAGMA正在将ENT主幹網擴展到馬來西亞和日本的JOSE(一個虛拟的研究室平台由AIST提供),并利用該環境部署一個分布式的軟件定義存儲系統,以此來确定未來在虛拟網絡和計算資源上使用分布式存儲的研究挑戰。另外,PRAGMA還在美國和日本通過SINET(國家研究與教育網絡)建立一條國際鍊路,使用多條國際路徑來改善ENT主幹網的帶寬,這樣可以幫助PRAGMA在未來執行大規模和高性能的網絡實驗。
對物種多樣性的分析和建模以及它們如何在當地以及全球範圍的可持續性仍然是生物地理研究的核心。理解這些過程以及由此導緻的自然結構變化對于維持和保護生物的多樣性至關重要。PRAGMA雲測試平台
PRAGMA的雲測試平台為用戶提供了一個持久的分布式國際信息基礎設施,可以用來運行應用程序實驗,不同的應用程序環境以虛拟集群映像的方式提供給用戶。
目前有基于Rocks和Centos7的BioLinux,GRAPLEr以及DOCK應用虛拟鏡像,這些鏡像可以運行在PRAGMA的雲站點,也可以通過pragma_boot工具運行在本地。最初虛拟鏡像由于建立在不同的地方格式也不盡相同,因此在PARGAM不同的站點需要手動調整鏡像文件以适應不同的運行環境。為了能夠使虛拟鏡像文件具有統一的格式,PRAGMA開發了一個工具clonezilla,它可以将鏡像文件輸出成統一的格式,同時另外一個工具cziso提供命令行的界面完成這種轉換,并實例化這些鏡像文件。他們在googledrive建立了一個倉庫(存放鏡像的地方),最後把這些鏡像文件上傳到googledrive上。
為了使用這些鏡像,PRAGMA增加了新的cziso倉庫,并為pragma_boot增加了一個新的同步功能,它可以完成從googledriver下載cziso鏡像,并運行cziso工具将鏡像恢複成适合本地文件的格式。Pragma_tool可以定期在晚上檢查本地鏡像和googledriver的時間戳,如果本地文件是舊的,它會自動下載更新鏡像。這種共享鏡像文件的方法目前在聖地亞哥大學、印第安納大學和NAIST使用,下一步将部署到AIST和NCHC。
虛拟生物多樣性探索
對物種多樣性的分析和建模以及它們如何在當地以及全球範圍的可持續性仍然是生物地理研究的核心。理解這些過程以及由此導緻的自然結構變化對于維持和保護生物的多樣性至關重要。
Lifemapper是美國NFS支持的一個項目,它使用所有在線地理空間物種出現的數據來創建它們的分布,從而進一步地根據它所記錄的位置來預測單個物種的存在[2]。Lifemapper通過将物種的出現數據與全球氣候、地形和土地覆蓋信息相結合,來确定物種與周圍環境的相關性。用Lifemapper項目開發的工具以及合适的模型結合全世界收集來的物種出現的數據就可以尋找物種的分布和栖息地。它的分析和模拟結果對解決環境、全球天氣對物種分布的影響以及如何維持物種的生存有着非常重要的作用。它提供的服務能夠讓學生了解全球氣候生态的變化對生态系統的影響。所以該項目可以解決這個時代的重要環境問題,特别是全球氣候變化對野生物種的分布和可持續性的潛在影響。項目整合了數據科學框架、模型、互聯網技軟、硬件技術,另外它的Web接口可以讓用戶從分布的站點浏覽、操作和下載數據。Lifemapper是一個便攜式、可部署的系統,很容易安裝在物理機或者虛拟機上。它運行在NSF的虛拟cluster和pragma的cloud(NAIST)平台上,現在被弗吉利亞理工大學的本科生和研究生用來理解全球氣候變化和水的營養化對海藻花的影響,學生通過對模型的訓練清楚的理解氣候變化對湖泊的影響。XSEDE是由美國NSF資助的一個虛拟系統,它整合并共享包括超級計算機和高端可視化和數據分析資源,可以讓全美國的研究人員一起開展科學研究[3]。科學家利用它來交互式地共享計算資源、數據和服務。在XSEDE資源上安裝的Lifemapper,利用高吞吐、低延遲的網絡交換連接到數據服務器可以觀察高分辨率的北美物種分布。
湖泊探索
全球對能源、食品和飲用水的需求正在給世界湖泊和水庫帶來前所未有的壓力。目前全球社會正在經曆着水資源供應的減少和水質的惡化,這些将影響地球未來幾十年提供所需自然資源的能力。對淡水資源的智能管理需要近乎實時,高頻率的湖泊和水庫信息,這個項目既是數據密集型又是計算密集行問題,需要對每個湖泊運行上千次的模拟。為了解決計算問題,PRAGMA的計算機科學家建立了一項服務,使用戶可以輕松地訪問龐大的分布式計算機,利用具有高吞吐量計算能力的分布式計算資源來運行大量模型的模拟。GRAPLEr是基于R的開放源碼軟件,将分布式計算的力量帶到了湖泊生态學建模者的指尖,使他們能夠提交成百上千的一般湖泊模型(GLM2),有效運行這些湖泊模型模拟,并檢索和可視化模型輸出。在這個項目中,湖泊生态學家和計算機科學家們聯合起來,共同應對如何在土地和氣候變化的條件下準确地對世界各地湖泊進行生态水動力學模拟。PRAGMALake項目是計算機科學家和與全球湖泊生态觀測網絡(GlobalLakeEcologicalObservatoryNetwork,GLEON)的研究者之間的跨學科合作項目。這一合作的成就在于通過對湖泊水動力學的批量模拟來理解目前海水富營養化和氣候變化對有害藻華的影響,同時也不斷地改善并使用最先進的模型來預測水的質量。這個項目的成果給用戶提供一個端到端的集成環境GRAPLEr[4],用戶使用簡單的API就可以在這個環境建立、運行和檢索,還能從上千次的模拟中可視化結果。這個軟件被PRAGMA的研究者和學生廣泛使用。GRAPLEr使用IPOP連接了不同機構的雲資源,如佛羅裡達大學、聖地亞哥超級計算中心、PRAGMA雲虛拟機,并使用一個開源的HTCondor系統來調度和管理大量的模型運行。GRAPLEr是基于R的開放源碼軟件,将分布式計算的力量帶到了湖泊生态學建模者的指尖,使他們能夠提交成百上千的一般湖泊模型(GLM2),有效運行這些湖泊模型模拟,并檢索和可視化模型輸出。
系統利用從三千個稻米基因的項目中篩選出的單核苷酸基因型分型數據集,讓研究者進行全組基因研究,檢查遺傳變異體和特性之間的關系。擴展基因組學計算基礎設施加強稻米培育
PRAGMA的生物科學工作組目前為蛋白質組學和遺傳基因的研究尋找一種新的信息基礎設施。雖然虛拟篩選被認為是确定潛在新藥的研究方法并活躍在PRAGMA的許多研究者中,但是PRAGMA正在努力建立一個基因分析平台,并将水稻基因作為一個新的研究領域,這對全球而言都有重要的意義。在馬尼拉舉行的PRAGMA30次會議上,他們和國際稻米研究所(IRRI)進行合作,旨在幫助水稻種植者以環境可持續的方式提高稻米的産量和質量。
該項研究的任務是通過合作研究、夥伴關系來加強農業研究,減少貧窮和饑餓、改善稻米農民和消費者的健康并确保環境的可持續發展。IRRI的許多研究都集中在數據獲取、數據标準、數據重現性和數據管理方面,還有包括育種管理系統,共享高通量測序和基因分型數據。PRAGMA部署了一個基因分析工具于一體的虛拟機BioLinux8,它有一個友好的界面和一個改進的用于大米基因研究的可再生工作流軟件-Galaxy。這個系統利用從三千個稻米基因的項目中篩選出的單核苷酸基因型分型數據集,讓研究者進行全組基因研究,檢查遺傳變異體和特性之間的關系。這種分析框架不僅可以讓稻米研究者進行實驗的驗證和決策制定,而且方便IRRI使用它來收集不同研究者的研究結果。這個基因工作流成功的部署在PRAGMA雲資源平台,并為IRRI的生物科學家建立一個可擴展的、易于使用的密集型基因分析平台。這項工作也讓PRAGMA利用數據認證服務和PRAGMA數據倉庫來給計算實驗的可重複性和數據共享研究邁出了重要的一步。而且這種分布式的架構和科學工具還可以被擴展到生物醫學領域的科學家使用,幫助他們利用工作流來處理和分析大量的生物學相關的數據集。
可視化環境
如今,可視化在更好地理解科學研究數據中扮演着非常重要的作用。
現在越來越多的數據通過傳感設備獲得,這些數據經過高性能計算來加速分析後更容易可視化的顯示。将不同領域專家的專業知識彙聚到一起對我們的科學研究非常重要,從這個角度,我們需要開發一個科學家易于使用的平台,允許科學家在一個高分辨的顯示系統下形成一個協作環境,但并不強迫他們擁有更高的知識、技術或專業知識。
目前PRAGMA将可視化場景應用在災難管理。他們在彈性的軟件定義架構中部署一些災難管理應用,在不同的PRAGMA機構中連接多個高分辨率顯示牆進行災難場景的可視化。它可以連續的、不間斷的在自然災難發生時傳輸信息給決策者以便他們能夠采取有效的行動。目前該應用已經連接日本多個機構,并計劃連接其他的PRAGMA站點來測試更多的全球場景。随着近來不斷增長的城市傳感數據,AIST使用沉浸顯示和交互技術如虛拟現實(VR)開發下一代的信息可視化環境。平台可以在災害發生期間将相關信息傳送給多個地點的決策者,同時結合VR改變了災害管理人員查看不同異構數據集的方式。他們下一步将建立一個2D或3D的沉浸平台能夠讓決策者在災害發生期間快速了解這些信息。在PRAGMA32次會議上,AIST展示了一個VR應用,它利用從17000個不同地方收集到的日本河流傳感數據,然後通過一個沉浸式3D虛拟設備展示該場景。它可以讓用戶擁有一個全國性的視圖。初步的測試說明這個應用在提供全局視圖上非常有效。AIST還在繼續努力利用大屏幕的顯示牆來創造一種不同類型的沉浸式環境。他們基于SAGE2開發了一個災害管理平台,允許用戶在一個共享合作的環境以不同的内容進行交互。該平台可以在災害發生期間将相關信息傳送給多個地點的決策者,同時結合VR改變了災害管理人員查看不同異構數據集的方式。他們下一步将建立一個2D或3D的沉浸平台能夠讓決策者在災害發生期間快速了解這些信息。
網絡學習和遠程教育
EDISON是Cyberlearning工作組從事的項目[5]。它是一個創新的網絡學習平台,也是一個免費開源的項目,是由KISTI在2011年發開的。通過這個平台,各種高性能計算模拟程序可以在線獲得,可以被廣大的韓國研究者和學生以及PRAGMA的成員使用。該項目受到韓國國家科學技術部和韓國未來計劃資助,是由KISTI和幾個計算科學與工程領域的研究機構共同進行的一個聯合項目。這些專業機構的領域來自計算流體力學、計算化學、納米物理學、計算結構力學、計算機輔助設計、計算藥學以及計算電磁學等。這個平台目前提供340個科學Apps和568個教學内容,過去六年間給來自韓國和世界其他國家提供42852次服務。該平台的日益流行和技術優勢增強了它的國際認可,還獲得了韓國多個獎項。
PRAGMA學生團體
PRAGMA學生團體,建立與2012年,目标是幫助學生在PRAGMA信任的社交和網絡中獲得專業的經驗。作為一個學生組織,它由一個委員會領導,并接受PRAGMA研究者的指導。
到目前為止,該團體組織的活動包括PRAGMA一年兩次會議中各成員學生的會議,舉辦在線的研讨會等。PRAGMA以一種獨特的模式,為學生提供多種機會,讓他們參與PRAGMA的合作項目研究,如到其他成員單位參加短期的項目研究;可以在PRAGMA的研究者中尋找合作的導師,參與導師最新的科研項目,提高他們研究和科學探索的能力;參加各種國際會議,幫助他們激發靈感,共享信息,參與合作。另外,PRAGMA學生團體在近期的會議期間中組織“Lighteningtalk”,給學生機會反饋他們在研究中獲得的經驗和結果,每次受邀請的學生将基于他們相關的研究做短暫的報告。所有這些活動不僅讓學生的科學研究水平和領導能力得到提高,而且對于理解其他成員國家的文化也起到了增進作用,也讓PRAGMA各成員之間的關系也越來越密切。
截至目前,PRAGMA項目由其成員和美國國家科學基金會(NSFOCI1234983)支持,包括加州大學聖地亞哥分校、佛羅裡達大學、印第安納大學、弗吉尼亞理工大學、威斯康星-麥迪遜大學。另外還有來自美國國家自然基金辦公室的信息基礎設施、國際科學和工程學院辦公室、計算機與信息科學與工程理事會的信息和智能系統部以及新興的生物科學理事會的大力支持。PRAGMA在環太平洋地區建立了一個值得信賴的合作者網絡,這種信任關系使得PRAGMA對影響PRAGMA成員發生的事件能夠快速的響應。
2017年是PRAGMA成立十五周年,在這期間,所有的成員在合作研究上一直保持着密切的聯系,不斷利用信息技術創新未來科學的研究模式。尤其是面對面的會議不斷建立和加強成員之間的必要信任,使之成為PRAGMA成功的關鍵。讓信息基礎設施變得容易接入,讓目标研究團體使用更加方便一直是PRAGMA努力前行的目标。這種共享、長期、開放的國際科研合作模式必将對創新型科學研究産生深遠的影響和意義。
(責編:楊潔)
(作者單位為蘭州大學網絡安全與信息化辦公室)
參考文獻:
1、http://www.pragma-grid/
2、http://lifemapper.org/
3、https://www.xsede.org/
4、http://graple.org/GRAPLEr
5、https://www.edison.re.kr/