
人類生存的地球,表面有5.1億平方公里,其中,海洋的總面積有3.6億平方公里,約占地球表面積的71%。
人類或起源于海洋,與海為鄰,傍海而居,又隨著科技的發展潛入深海。「從古至今,人們一直都踏在研究海洋的基礎上,為了生存」,這是接受我們的采訪時,李明悝副教授說的一句話。
李明悝老師是中國海洋大學物理海洋教育部重點實驗室的碩士生導師,主要從事海洋動力過程及海氣相互作用、耦合氣候數值模式和科研數據可視化等研究工作。
接受我們的采訪,所有回答都以盡可能通俗易理解的話進行表達,李老師說「希望我的分享能起到一定的作用」。以下是李明悝老師與和鯨之間關于大氣海洋、關于他的研究、經歷、思考的對話——
01 兩洋一海
「兩洋一海」是李明悝老師與其所在的團隊自2015年開始研究的項目。
項目基于區域天氣研究預報模式WRF和區域海洋數值模式ROMS建立了大西洋高分辨率海氣耦合模式系統,而后將其移植到西北太平洋-印度洋區域,構建了“兩洋一海”區域海氣耦合數值模式,并由此發展了“兩洋一海”區域海氣耦合預報系統。
說到「兩洋一海」,就像一個故事。
大氣離不開海洋,海洋離不開大氣
「我們這個行業用到的一個研究方法,就是利用數值計算的方法,即這些年隨著計算機的發展,產生的一種不同于以前的研究方法。以前是先調查,后進行科研的理論研究,而近些年基于計算機技術發展起來的這個方法叫做數值模擬研究,其中需要用到建模的方式。這里提到的 WRF 和 ROMS 正是我們行業里面兩個方向的兩大代表性的數值模式,其中 WRF 是區域性的大氣模式,而 ROMS 是區域性的海洋模式,它們的針對性不太一樣。這兩個模式發展到一定程度以后,成為了在氣象、海洋研究這些領域里面被大家公認這些年發展得比較好的數值模式。」
關于將WRF模式與ROMS模式進行耦合的研究,李老師稱是機緣巧合。
「我在國外待過幾年,當時接觸的兩個團隊都是在這兩個模式上有比較大的貢獻的,其中一個就是以ROMS為主的團隊,通過這個團隊接觸到了ROMS模式開發小組的其中一個人,就是后來的區域海氣耦合模式的作者。也就是說,區域海氣耦合模式的作者本身就是來源于ROMS團隊的。當時在發展這個模式的過程當中,我還有幸地參與了一段時間,所以相對來說了解一些。在這個基礎上,他們發布了這么一個海氣耦合的模式,它叫做COAWST,其中的兩個分支分別就是大氣的 WRF 模式和海洋的 ROMS 模式,那么這就是這個耦合模式的來源。
關于這個研究方法,一般行業外的人可能會去區分這是氣象的還是海洋的,但是事實上氣象和海洋雖然是兩個不同的專業,它們之間有千絲萬縷的聯系,大氣離不開海洋,海洋離不開大氣。比如最常見的一個和人類生活息息相關的極端天氣過程——臺風。臺風它源于海上生成,但是它的主體又發生在大氣里面。它依賴于海洋給它提供熱源,然后才能在海洋上方形成大的氣旋,逐漸地越來越生長壯大,最后接近于岸邊,給人類生活帶來劇烈的影響。
所以其實大氣和海洋,它們之間是分不開的。開始人們是針對大氣做 WRF ,針對海洋做 ROMS ,那隨著技術發展的話,人們就考慮現實生活當中大氣和海洋之間的相互作用,所以才要提到海氣耦合這個事情。」

區域海氣耦合模式結果示例
不斷打補丁,一步步發展
將兩個模式進行耦合,是否一定能提高預測的精度?李老師表示,這還是分方面的。而受限于物理機制或者計算機條件,很多東西目前還尚未研究到,但是在將來一定會有進一步的發展。
「在某些方面它確實能夠提高精度。如果去對行業的一些科研前沿進行一定了解的話,會發現近些年國家海洋局第一海洋研究所,現在改成自然資源部第一海洋研究所,那邊的喬方利研究員,他們工作組提出了一種概念,就是海浪會對海洋上層的混合層,以及對臺風的發展過程起到作用。這一系列的科研成果,都表明在大氣海洋的各種各樣的現象之中,海浪,這個我們常見的現象對天氣過程有這么大的影響,就說明了如果我們單純去看大氣模式的話,由于它里面肯定不包括海洋內的東西,它就會缺乏了海浪這樣的一環。而對于單純去看海洋模式,我們又該把海浪放到什么位置,就算把海浪放進來,怎么去反映它對大氣的影響呢?
所以說,如果不把 WRF 模式和 ROMS 模式耦合起來的話,這種過程就很難用一種更科學的方法引進去,而想引進去的話,按照以前的做法就是引入一種所謂的參數化。所謂參數化就是我們平常所說的經驗公式的方式,那經驗公式的方式肯定不如有一個真正的科學原理在背后,有一個科學的控制方程解析方程或者動力原理在背后來支持更準確對吧。
所以從這個角度來講的話,在某些方面它還是比以前的兩者分開的時候能起到提高預報精度的作用,但是不能一概而論,因為我們的發展過程畢竟還是受限的。盡管各種技術發展得都很好,但是畢竟有很多東西我們還是不能面面俱到的,有些物理過程有些天氣過程我們到現在還在研究當中。」
單單從耦合模式上來講,它是一個工具,是一個在不斷完善的工具。
「海氣耦合模式開發出來之前,有其他的耦合方式,也有其他的一些近似的方法,只不過它(指COAWST)是后發展出來的,相對來說是在區域海洋大氣的計算方面用的比較好的一個模式而已。比如說剛才提到了 WRF 和 ROMS 分別是大氣和海洋的數值模式的代表之一,但是就拿海洋來說的話,除了 ROMS 以外,其實還有其他的一些模式,比如說FVCOM、HYCOM,還有比如說像全球的這種CESM以及 MITgcm等等這一些數值模式,都是有它各自特點的,也都在不同的領域有它的作用。
海氣耦合模式,我的印象里當時用了也就是兩年左右,這個模式基本上就已經到了從開始開發到最后發布的階段了,只不過在發布之后,隨著不斷的發展,就是 WRF 和 ROMS 自己本身的發展,比如說 WRF 剛開始是1.0版本,后來二點幾,到現在已經是四點幾的版本,而 ROMS 也已經到了三點幾的版本,隨著它們發展,耦合模式也在不斷地打補丁也好,再往前一步一步地走也好,加新的特性也好,也是在不斷往前發展的。」
而隨著計算機的發展,因為物理機制問題用數值模式解決得不夠好的場景,機器學習可以在其中的參數化過程進行一定助力。
「我們剛才提到參數化,什么是參數化?當某些過程在數值計算沒有辦法用公式來解決的時候,那這幾乎就是用一種統計或者是經驗的方式。而這個經驗的方式怎么用計算機的語言來實現,實現了以后又叫什么,我們通常在數值模式當中就把它稱之為是某種參數化的過程,即把某一個物理過程進行的參數化的表達。
機器學習是通過現有的各種數據,在海量數據支持的情況下,一種總結出來的關系,然后得到一種基于 AI 的理論框架和實踐下的一種計算結果。而且現在好多方面確實也證明了,這個計算結果不一定差。關于這方面,其實現在已經有了發展,比如說剛才說到的 WRF 模式,據我所知,它這兩年已經開發出了包含與原來的動力模型框架相結合的 AI 模塊的 WRF 模式,也就是說把其中的某些參數化過程利用機器學習的方式來實現了,已經有人開始這么做了。」
02 流場動態可視化
科學研究的繼往開來都需要工具進行支持,在氣象海洋領域,將各種要素放在同一張圖上進行表達是最為常見的,由此,讀圖繪圖也成為了每個研究者的必修課。并行化二維流場多元數據動態可視化軟件是李老師結合數值模式和預報系統的需求開發的科學數據可視化工具。
降低大氣海洋領域科研工作者繪圖的計算機能力門檻,大概是李老師最開始的初衷。
為了手到擒來
「它有一個發展的歷史背景。當時這套軟件出來的時候正好是處在,在我們把科學數據進行可視化的過程中出現了一類比較新穎的展現方式,叫做粒子動態流場,這樣一個過程中,那么我寫的軟件主要就是為了產生類似這樣的一個流場的描述結果,也就是提供一種描述二維流場的可視化方法。
這個方法可能本身形式上比較新穎,但其實大家一直都在采取各種不同的方法去實現這樣的效果。我們很多科研領域的人,并不是計算機領域的人,那么他們對計算機的,尤其是計算機圖形學這方面肯定不像計算機專業的人那么精通,要想實現一些可視化的效果就會有些困難。恰巧我利用了我們這個行業經常接觸到的一些可視化軟件,手到擒來的這種大部分人都會用的軟件,在這個基礎上來實現相對大家都比較認可,而且比較感興趣的一種可視化方式。這時候它就解決了對于像我們這個行業或者領域的人去做類似可視化結果的入門門檻的問題,他們不需要再去花大量時間學習那么多大量的更專業的計算機圖形知識了,而只需要使用我們一般在使用的軟件,那么無形之中降低了門檻。」
一個科普的方式
李老師表示,大家都對這種可視化方式比較追捧的一個原因是因為它在一定程度上改變了之前對流場的描述方法,讓這個流場的體現更直觀、更漂亮,而正是這樣的效果卻在“科普”的方面起到了意料之外的作用。
「這種可視化的效果,一般來講,它的使用場景大多體現在兩個方面,當然這是我個人總結的,不見得對。
第一就是它在對科研成果的展示方面起到了比較大的作用。你不能整天拿著一堆比較枯燥無味的科研圖形,讓一些老百姓或者說業外的人士、非專業人士來看你這圖以后覺得看不懂也說不清對吧。當你用了比較生動的方法之后,一下就會引起別人的興趣。這一點其實我當時有一個很大的感觸,就是我用這種方法畫出來的海洋流場,在我的周圍的非專業領域的朋友,對我們行業完全不了解的,他們看了之后也能感覺到說你這畫的是不是海洋怎么流的,而如果按照以前的方式,他們根本就得不到這樣的感官。這是給我的一個很大的觸動,這是對我們科研成果向外去展示、去介紹、去科普的一個非常好的方式,也是我發展這一套方法的一個重要的動力源泉。
第二點就是這個方法確實在細節表現上面比以前的普通做法還是有一定改進了,所以在科研的角度來說,它也是能起到一定的輔助作用。」
03 研究方法的選擇
研究方法是人們解決科學問題時采用的基本手段、措施和程序。不同的方法,與事實和理論有著不同的相容性,因而在應用范圍和使用場景上都有一定的差別。
在對大氣和海洋進行預測研究的時候,動力學模式等的研究方法與現代的機器學習、人工智能算法,雖各有差異、各有利弊,然都能協助研究者們走進那片蔚藍。
物理學原理與數學計算
「其實這是個比較大的問題,我只能粗淺地談一點我自己的認識。
這兩者的大致區別就是,動力學模式是基于控制方程的,以數值計算為方法。從物理學這個角度來講的話,它的動力框架應該是嚴謹的。在某些動力框架或者解析的方法上解決不了的地方,我們至少還有一些剛才提到的經驗公式,或者是參數方法,或是統計的結果能用在里面。但是它的總體的框架,從物理學角度來講,相對是比較嚴謹的,我說的是從物理學的角度。
但是對于機器學習或者 AI 人工智能的話,它基本上是以大量的數據為基礎的,而這個數據其實更多依賴的是數學,尤其像概率論、統計分析等等,與這些關系更強一些。而它與物理本身,比如說氣象也好,海洋也好,它與氣象海洋等等這方面的物理原理的關系的并不那么直接。所以相比較而言,并不是說它肯定沒有物理原理,只能說相比較而言,它里面所直接體現的物理框架、動力框架等等這方面是相對缺乏的。
所以這是兩者的一個很大的不同,而這兩者之間也確實各有利弊。
比如說我們前面說的動力學模型,它從物理角度來講是嚴謹的,有控制方程來控制,那么它的求解方式也就相對來說比較固定。這時候,它在計算的過程當中受計算機算力的影響就比較大,你算得越精細、范圍越大、規模越大,計算需要的計算量越大,計算就越慢。相反,用 AI 的方式,需要數據作為它的飼料,不斷地喂它成長。只要它訓練,一旦訓練成功后拿來進行應用,它的速度是非常快的,所以它主要只受數據量和訓練過程的影響。
那么這個數據量直接影響了什么呢。就 AI 來說,它其實最主要體現的是預測的方面,因為它沒有什么動力方程來控制,就不太會存在我們所謂的機理研究等等。這也是它的一個缺陷吧,它主要的功能更側重于預測預報。而動力學模型除了預測預報以外,雖然它算的慢,但是從物理學角度來說,它是可以用作一個強有力的科研工具。從我們物理海洋的角度來說,拿它可以做一些機理研究,做一些數值實驗。就像我們以前做水動力的實驗,在實驗室里做一個水槽的實驗,做一個轉盤的實驗,我們完全可以類似地把它搬到計算機上做成這種數值的實驗。如果僅僅是 AI 的話,它是從數據出發的,想做這樣的實驗的可能就不太一樣了。所以說它們兩者之間的應用范圍和解決的問題上其實都是有一定的差別的。」
氣象科研人員的選型,不同場景、不同價值,黑盒與白盒究竟如何去選擇?關于這一點,李老師表示,還是應該從問題出發,要認清自己的研究目的。
「如果你的目的就是去談數據,談預報等等的話,黑盒應該是很好用的一個工具。而且其實它并不是說完全沒有機理在里面,只不過機理有待我們去發掘,去和物理方面的一些原理去進行建立聯系,就像我們當初剛開始發展這門學科一樣,應該從各種不同的現象里去抓規律。現在也是一樣的,我們只不過現在還沒有完全的,從 AI 或者是它的計算方法里面去抓出來我們想要的一些物理規律,但是并不代表它就一定沒有,我只能說只不過現在沒發現而已。」
一則忠告
新技術的出現、發展與應用,是踏著短處的階梯挺立起來的。要腳踏實地,要取長補短。從機器學習、從 AI 的角度去考慮,如果想要在海洋學中使用大數據進行長期深入科研,李老師也給出了指引建議。
「到目前為止,海洋學中的大數據還真跟我們去做 AI 的原始意義下的大數據,還是有一定差距的。我覺得海洋數據處在一個叫做海量數據和大數據之間的一個狀態,它不是完完全全的真正的大數據,但是它的數據量確實是非常大的。真正的大數據是雜七雜八各種領域各種方面的,它們之間甚至沒有直接聯系,但是目前我們的海洋數據,相對來說,數據與數據之間的聯系還是比較緊密的。但是量上,確實隨著我們技術的發展,包括全世界各個國家對海洋事業發展的支持,觀測得多了,各種各樣的解決方式多了,那么從而產生的數據確實也多了,所以說它是海量的。
在這種情況下的話,不管怎樣,我們姑且把它稱為是大數據的情況下,如果有人想從這個角度去出發,我認為的一個忠告是,從海洋學的角度,海洋學相關的專業基礎知識還是要打牢的,除了這個以外,數學基礎知識也要打牢。
之前提到,大數據或者說機器學習人工智能這方面,它的一個根源,與數學是息息相關的,從數學出來,它真正的內部還是很嚴謹的。而現在有一個情況是,越來越多的工具發展得非常便利,人們能夠直接拿來就用,但是對里面的很多東西他還是不太懂。這種情況下,只能懵懵懂懂的去照貓畫虎去做一些分析,進行一些訓練和學習,然后拿來用而已。
但是比如說你拿來了一堆海洋數據,你想做一個學習的數據集,這個數據集,你必須得了解它里面的數據有哪些特征,而你想把這個特征和什么東西聯系起來,要想做這方面的聯系,你必須得具備一定的相關的海洋學的知識才可能。打個比方,你想研究臺風生成的原因,你總不能把一個和臺風生成完全無關的數據,比如海洋數據里面有魚群群落的分布,然后你把這個數據跟臺風生成的原因聯系起來,這肯定不行的,你只能去想跟臺風生成有關系的是哪些,肯定和溫度和濕度等等這些東西是相關的。
所以說還是必須得有一定的物理學方面的專業知識,其次另外一個就是數學的基礎知識,這兩個不分伯仲,否則在這條路上面是走不太遠的,只能走到皮毛。」
04 和鯨Workshop
李明悝老師受邀擔任12月13日和鯨舉辦的線上公益培訓活動 Python 氣象海洋數據分析 Workshop 第二期的導師。關于 Workshop ,李老師選擇了“從海洋數據開始來認識海洋”作為主題。了解與認識海洋有不同的方法和角度,如此選擇,李老師也給出了自己的原因。
從海洋數據出發
「我舉個例子,首先讓大家有個感受。從古至今,人們都一直踏在研究海洋的基礎上。為什么?為了生存。從遠古時代,人們為了生存,就需要從海洋獲取各種各樣的資源,包括動力資源和比如說生活的食物等這一系列的資源,不管是輕是重、是難是易、是淺是深,人類都在了解海洋,在學習海洋。
最古老的學習海洋的方式無外乎就是觀察,發展到現在其實就是調查。那么調查之后得到的東西是什么呢?其實就是數據。所以我們現代人去研究一樣東西的時候,比起古代人有一個好處是,我們站在了巨人的肩膀上。有了那么多的堅實基礎,我們不用再自己造輪子了,而是可以在現有的基礎上進行研究,這時候我們最容易得到的東西其實就是在網上等等這些地方,有著各種科研機構發布出來的免費的供我們使用的大量的海洋數據。這么多數據在這兒,就使得從這個角度出發去著手認識海洋、感受海洋、了解海洋,相對來說會更容易上手,因為獲取這些數據的方式簡單,處理一些數據的方式也相對于便捷,正如咱們之前說的現在有很多的工具,比如在我們這次Workshop,用ModelWhale去進行處理分析,復現學習。而且有了這些數據以后,可以通過一些方式把一些具有信息的變量用可視化的方法展示出來,通過這些方式就能比較直觀地知道海洋長什么樣,它有多深,它的溫度分布哪高哪低,我們就能有初步的認識,這肯定比你出去開個船出去調查一番要容易得多。
所以我覺得從這個方面來講的話,從數據出發,這是一個非常易于實施的手段。再者,數據這個概念從廣義上來講的話,其實就是信息。任何得到的能夠記錄在案的,能夠再重復使用的關于海洋的任何信息都可以稱之為數據,只不過我們現在能夠用常規方式,用常用的分析手段和軟件能夠直接去使用的這些數據更為直觀更為方便而已。那么把這些稱之為某一類的這種數據拿來去研究,是再簡單不過了。
所以就從這兩個角度來講,我覺得從數據開始認識海洋,比其他的方式來的容易和直觀。」

圖源和鯨社區氣象專區
需求驅動
將 Workshop 作為起點的人們可能各自希望通往不同的終點,讓需求驅動自己的行動,李老師給出了這樣的建議。
「我認為能夠通過 Workshop 的形式學一些知識的人們,大約有兩類。第一類是將來有可能從事氣象或者海洋方面研究的,那么對于這些我個人建議去按部就班地,類似我們國家各個高校科研領域的這種培養的方式去進行學習,多讀文獻積累專業知識,多了解科研的前沿,如果還沒有基礎的話,去打一打相關專業的基礎,這一方面相對來說比較重要。
還有一類我個人認為是本身已經有了一定的自己的事業或者研究方向,那很可能是抱著學習 Python 處理數據的角度來看這件事情的,對于這一類的話,我的建議其實很簡單,多練習,多看案例,多動手,這個東西就是熟能生巧的事情。」
05 關于熱愛
訪談的尾聲,我們問了李老師最后一個問題:從本科畢業到現在,您研究物理海洋好像已經有20幾年了,這么多年過去,您覺得自己在研究的過程中,心境有什么變化嗎?
老師頓了一下,笑了,我想應該也有過其他的后輩向他請教過這些看似虛頭巴腦的問題吧。
「這個問題其實也是蠻大的,人在某一個領域里面角色不同,心境肯定也不同,而且隨著整體工作狀態的發展變化,這不是可以一言以蔽之的。像我的話,我感覺任何一個專業,隨著研究得越來越深入,從廣義的面上來看,也就是隨著你學歷的增長,你的專業就越來越細分。細分到一定程度以后,非專業的人對你研究的這一塊就已經不了解了,這說明龐大的知識體系里面,等你真正去參與進去之后,你可能只能為其中的一部分去工作、去研究、去學習或者去享受。
在這個情況下,最好的事情就是什么?找自己喜歡做的,找自己能做的,把能力和愛好興趣結合在一起,尋找到一個平衡點,然后來達到一個比較好的狀態。興趣引導著你的工作方向,這是一個比較好的工作方式。如果說你為了某一個艱難的目標去做,而沒有任何的興趣在里面,我覺得這樣一是可能會比較痛苦,二是可能也走不遠。
當然了我說的也不一定對,但是這是我自己的感受。」
從事自己喜歡的事業要有天分和機遇,熱愛是成就的充分非必要條件。
感謝李老師帶給我們的分享。
-END-