“我經常使用大型計算機,它們消耗的能量相當於壹個小城市,”他說。“我可能是這條街上汙染最嚴重的人。如果使用壹臺超級計算機消耗的能量相當於10000個家庭,那麽我有什麽權利告訴我的孩子或者其他人不應該洗20分鐘的澡?”
當世界正在努力解決氣候變化的問題時,許多科學家開始正視他們的碳排放量太大的現實。
巨大的計算成本
除了學術旅行對氣候變化的影響,許多物理學家發現,在過去幾年中,計算機使用造成的碳足跡是巨大的——有時甚至超過航空旅行。
亞當·史蒂文斯是西澳大利亞大學的天體物理學家。他和他的同事分析了澳大利亞天文學家在2018-2019期間,由於旅行、使用超級計算機和在大型觀測站工作等“例行活動”而產生的溫室氣體排放總量。他們的研究發現,平均每個澳大利亞天文學家產生約37噸二氧化碳當量,比澳大利亞平均水平高40%,是全球平均水平的5倍。主要原因是天文學家需要使用超級計算機來處理望遠鏡收集的大量數據,並進行宇宙學模擬。這項工作中每個天文學家的排放量約為15噸,幾乎是全年飛行排放量的4倍(圖1)。
圖1澳大利亞天文學家的四個排放源,以每人每年的二氧化碳(CO2)當量(e)噸(t)為單位(yr-1)。圖中標出了誤差線。註意,觀測站的數值是排放的下限。
再比如即將開展的大型中微子探測陣列(GRAND)項目,該項目計劃利用分布在全球山區的20萬個天線,探測來自深空的超高能中微子。2021年,項目背後的團隊估算了三個不同實驗階段的溫室氣體排放量,即原型實驗、中規模實驗和2030年將要進行的綜合實驗。他們將模擬和數據分析、數據傳輸和存儲以及計算機和其他電子設備稱為“數字技術”,這些技術將在碳足跡中占據很大比例。
據估計,在原型實驗階段,數字技術將占排放的69%,而旅行僅占27%,4%將來自“硬件設備”,如制造無線電天線。中期實驗階段,數字技術將占總排放量的40%,出行和硬件將占剩余排放量的壹半。整個實驗完成並投入使用後,主要的排放將由硬件(48%)和數字技術(45%)分擔。
超級計算機的環境成本很大程度上取決於為設備供電的能源。2020年,荷蘭天文委員會邀請Portegies Zwart和另壹個研究團隊分析其6個成員機構的碳足跡。據估計,在2019年,每個荷蘭天文學家平均排放4.7噸二氧化碳當量,遠低於澳大利亞,其中只有4%來自超級計算。
荷蘭天體物理學家Florisvander Tak主持了這項研究。他認為荷蘭天文學家使用超級計算機的次數不會比他們的澳大利亞同行少,所以這種差異可能來自不同的能源供應。由於荷蘭100%使用風能或太陽能產生的可再生能源,國家超級計算中心SURF不產生任何碳排放,少量排放由國際設備和荷蘭的小型超級計算機產生。現在,Portegies Zwart已經養成了檢查他使用的超級計算機是否使用環保能源的習慣。如果不行,他會考慮用其他設備。
問題的根源
德國Max?普朗克天文研究所的溫室氣體排放數據也顯示了各國碳排放的差異。在2018年,該研究所的每個研究人員排放了大約18噸二氧化碳當量——超過了荷蘭天文學家,但只有澳大利亞同行的壹半(圖2)。這壹數字比德國普通居民高出60%,是德國2030年減排目標的3倍,符合巴黎氣候協議。
圖2壹個澳大利亞天文學家和壹個馬克斯?德國普朗克天文研究所研究人員2018年的平均排放量按排放源分類,並與德國根據《巴黎協定》制定的2030年目標排放量進行比較。與電力相關的排放包括計算和未計算的消耗,在德國和澳大利亞,大部分是通過計算產生的。
在Max?普朗克研究所2018年約29%的碳排放來自功耗,其中計算(尤其是超算)占75-90%。德澳碳排放差異的關鍵在於電力來源。2018年,德國約壹半的電力來自太陽能和風能,而在澳大利亞,大部分電力來自化石燃料,主要是煤炭。這意味著,在澳大利亞,用於計算的電力每千瓦時產生0.905千克二氧化碳,而在Max?普朗克研究所只有0.23公斤。
範德克還指出,這些調查是幾年前進行的,現在世界已經向前發展了。例如,使用可再生能源的機構越來越多。荷蘭的壹項研究發現,荷蘭天文學界2019年的碳足跡中,只有不到三分之壹(29%)來自電力使用,包括為6個研究機構的本地計算供電。當時壹半的研究所用的是綠電,後來有兩家開始轉用100%可再生能源。範德克預測,第六研究所將在未來兩年內實現轉型。
澳大利亞的情況也在發生變化。作為該國三大國家高性能計算設施之壹,超級計算機OzSTAR自2020年7月起改用從附近風力發電站購買的100%可再生能源。超級計算機所在的斯威本科技大學聲稱,這將大大減少其碳足跡,因為電力排放占總排放量的70%以上。
位置,位置,還是位置
然而,如何才能準確計算出使用超級計算機的碳排放量呢?英國劍橋大學的數學家和物理學家?C Lannelongue沒有找到壹個簡單的方法,所以他開發了壹個名為“綠色算法”(green-algorithms.org)的在線工具來估計研究人員的碳足跡。
蘭納隆格重申,位置是關鍵。例如,在相同的硬件上運行相同的任務,澳大利亞排放的二氧化碳約為瑞士的70倍,因為瑞士的大部分電力來自水力發電。雖然估計任何算法的碳足跡都取決於硬件、任務所需的時間以及數據中心或超級計算機的位置等關鍵因素,但綠色算法還有壹個“實際比例因子”(PSF)來估計實際計算的次數,這對排放有直接影響。
事實上,大多數算法在不同的參數下都要運行多次,有時甚至上百次,運行次數會根據不同的任務和研究領域有很大的差異(圖3)。該研究還發現,南非和美國壹些州的計算排放量與澳大利亞相似,而冰島、挪威和瑞典的電力碳排放量特別低。
圖3綠色算法是壹個估算碳足跡的免費工具的算法。估算過程涉及壹系列因素,包括硬件要求、運行時間和數據中心位置。用戶可以通過在其他架構上重新部署算法來評估計算性能或估計節省或消耗的碳。該圖比較了不同科學領域中算法的碳足跡——從粒子物理模擬和DNA輻射損傷到大氣科學和機器學習——並比較了重復計算(PSF)的結果,其中每個算法只運行壹次,並且執行相同的任務。以上結果以二氧化碳(CO2)當量(E)的克數(g)來衡量,並與樹木的固碳量和日常活動(如開車)的碳排放量進行比較。
如今,隨著雲計算的出現,研究人員可以更方便地選擇超級計算機。但即使他們不能取代機器,他們仍然有其他方法來減少碳排放。Lannelongue表示,如果不能改變位置,可以使用最新版本和優化的軟件,因為這樣會降低計算要求。
更好的編碼
高效的代碼對於讓計算變得更加環保也至關重要。正如Portegies Zwart所說,如果妳在代碼優化上花更多的時間,它就會運行得更快,產生更少的排放。另外,改變編碼語言也是壹個很好的方法。
為了驗證這壹觀點,Portegies Zwart進行了壹項實驗,他在十幾種不同的編碼語言中運行了相同的算法。沒有壹個語言代碼是專門優化過的,寫每壹個代碼用的時間都差不多。物理學家常用的Python與其他編碼語言(如C++或Fortran)相比,運行算法的時間要長得多,因此會產生更多的碳排放。問題是Python很好用,但是很難優化,其他語言很難編碼,但是比較容易優化。
然而,遠離Python可能並不能解決問題。法國格勒諾布爾-阿爾卑斯大學的研究員皮埃爾·奧吉耶說,更好的教育和使用Python編譯器壹樣有效。他用更優化的代碼和五種不同的Python實現進行了類似的實驗,其中四種比C++和Fortran更快,產生的排放更少,更容易理解和使用。
Portegies Zwart同意Python可以是高效的,但是它不能反映實際情況。他認為天文學家對代碼的優化程度不高,與其讓他們學習更多的計算機知識,物理研究機構或許應該聘請更多的計算機專家。“我們擅長物理,但是計算機科學家把我們所有的時間都花在計算機上研究物理,”他說。“毫無疑問,他們更擅長編程。”
隱性發射
碳密集型工作不僅僅是在超級計算機上進行模擬。作為大中微子項目的聯合發起人,法國索邦大學的Kumiko Kotera和她的同事發現,數據存儲和傳輸在原型階段將占年總排放量的壹半左右,在中間階段占四分之壹,在綜合實驗階段超過三分之壹。相比之下,三個階段數據分析和模擬產生的碳排放量分別占16%、13%和7%。
數據存儲和傳輸的碳足跡取決於數據中心的能源需求,使用低排放的數據中心可以在壹定程度上解決問題。然而,減少數據量仍然有效,科學家將對他們傳輸的內容更加謹慎。Kotera表示,GRAND項目將研究如何減少數據量,並找到壹種有效的方法來清理數據。
圖4為了減少整體碳排放,CERN聘請了壹名環境工程師來監督未來項目的建設。
粒子物理學家也需要貢獻。CERN每年產生大約100 PB的數據。全球LHC計算網格(WLCG)整合了全球40多個國家約170個計算中心的計算資源,並對這些數據進行存儲、分發和分析。CERN近幾年開始發布環境報告,2021發布的第二份報告介紹了LHC上實施的能效提升措施(圖4),之後可以收集更多的單位能源數據。升級後,LHC的能源效率將在20年內比最初投入使用時提高10倍。然而,該報告也承認,它並沒有真正涵蓋WLCG的所有排放,只是詳細說明了歐洲粒子物理研究所擁有或運營的WLCG設備的能耗。
改變心態
Lannelongue希望越來越多的研究人員可以開始考慮計算產生的碳排放量,並將其納入決策。壹個典型的例子是,研究人員過去常常整夜運行低效的代碼和軟件。當他們被告知提高計算效率將減少他們的碳足跡時,他們就有了改變的動力。
談及宏大的項目,Kotera表示,他們計劃建立壹個仿真庫,讓用戶可以重用常用的仿真,而無需自己創建,從而避免相同的數據被不斷復制。即使在大規模的合作中,由於沒有中心存儲,不同的用戶經常重復運行同壹個仿真。“按下壹個按鈕,進行為期壹周的模擬,得到結果,然後說,‘哦,實際上我不需要它’,這是非常常見的,”Kotera說。“我們的目的是鼓勵用戶在運行之前思考他們是否真的需要這個模擬。”